sq - это CLI утилита, которая предоставляет доступ в стиле jq к структурированным источникам данных: базам данных SQL или форматам документов, таким как CSV или Excel. sq выводит данные во множество форматов, включая JSON, Excel, CSV, HTML, Markdown и XML, и может вставлять результаты запроса непосредственно в базу данных SQL.sq также может проверять источники для просмотра метаданных о структуре источника (таблицы, столбцы, размер). Вы можете использовать sq diff для сравнения таблиц или целых баз данных. В sq есть команды для обычных операций с базой данных, таких как копирование, усечение и удаление таблиц.https://github.com/neilotoole/sq
Web: https://sq.io/
#json #excel #csv #html #markdown #xml #sql
GitHub
GitHub - neilotoole/sq: sq data wrangler
sq data wrangler. Contribute to neilotoole/sq development by creating an account on GitHub.
👍22🔥8
MarkItDown - утилита написанная на Python для преобразования различных файлов в формат Markdown для использования с LLM и связанными с ними конвейерами анализа текста. В этом отношении она наиболее близка к
textract, но с акцентом на сохранение важной структуры и содержимого документа в формате Markdown (включая заголовки, списки, таблицы, ссылки и т. д.). Хотя вывод зачастую достаточно презентабелен и удобен для восприятия, он предназначен для использования инструментами анализа текста и может быть не лучшим вариантом для высококачественного преобразования документов для восприятия человеком.В настоящее время
MarkItDown поддерживает конвертацию из:- PowerPoint
- Word
- Exel
- Изображения (метаданные
EXIF и OCR)- Аудио (метаданные
и транскрипция речи)- HTML
- Текстовые форматы (
CSV, JSON, XML)- ZIP-файлы (перебирает содержимое)
- URL-адреса YouTube
- EPubs
- и многое другое!
https://github.com/microsoft/markitdown
опубликовано в @gitgate
#markdown #pdf #xls #doc #ppt #html #zip #epub #converter
🔥11👍7