Git Finds
24 subscribers
212 photos
12 videos
5 files
1.25K links
Download Telegram
ContextGem - це відкрита бібліотека для ефективного витягування структурованих даних з документів за допомогою LLM. Вона надає гнучкий та інтуїтивно зрозумілий фреймворк, який мінімізує написання шаблонного коду. Основні можливості включають: автоматизовані динамічні промпти, автоматичне моделювання даних, точне відображення посилань, обґрунтування екстракції, нейронну сегментацію, багатомовну підтримку та єдиний конвеєр екстракції. ContextGem підтримує хмарні та локальні LLM через інтеграцію з LiteLLM. Бібліотека оптимізована для глибокого аналізу окремих документів, використовуючи довгі контекстні вікна LLM для підвищення точності екстракції.

#Python

@sourcefuture
Forwarded from partially unsupervised
Недавно собрал на коленке Reddit Research - максимально простую вариацию на тему deep research, но с фокусом только на реддит (лично у меня это довольно частый сценарий использования и в обычном поиске, и в AI-ассистентах).

Очевидно, он уступает по качеству deep research от крупных вендоров, но вполне подойдет тем, кто зачем-то хочет гонять все локально, или сделать форк и контролировать какие-то мелочи. Ну и для неопытным разработчикам LLM-приложений может пригодиться для вдохновения - кода мало, и большая его часть - свистелки для терминала.
HelixDB - потужна графово-векторна база даних, створена на Rust для забезпечення мілісекундної затримки запитів та простоти використання. Основні особливості:

• Швидкість і ефективність: блискавично швидкий запуск і мілісекундна затримка запитів
• Підтримка векторів: нативна підтримка векторних типів даних для RAG та AI додатків
• Зручність для розробників: інтуїтивна мова запитів з вбудованою перевіркою типів
• Надійне зберігання: використовує LMDB для ефективного збереження даних
• ACID-сумісність: забезпечує цілісність та узгодженість даних
• Керований сервіс: доступний як повністю керований хмарний сервіс

#Rust

@sourcefuture