📝 Редактирование PDF с помощью ИИ 🚀
Nano PDF - это инструмент командной строки для редактирования PDF-документов с использованием естественного языка. Он позволяет вносить изменения в слайды, добавлять новые и сохранять текстовый слой с помощью OCR. Работает на базе модели Gemini 3 Pro Image.
🚀 Основные моменты:
- Редактирование слайдов по текстовым командам
- Генерация новых слайдов в стиле существующих
- Поддержка многопоточной обработки для повышения скорости
- Сохранение текстового слоя с помощью OCR
📌 GitHub: https://github.com/gavrielc/Nano-PDF
#python
Nano PDF - это инструмент командной строки для редактирования PDF-документов с использованием естественного языка. Он позволяет вносить изменения в слайды, добавлять новые и сохранять текстовый слой с помощью OCR. Работает на базе модели Gemini 3 Pro Image.
🚀 Основные моменты:
- Редактирование слайдов по текстовым командам
- Генерация новых слайдов в стиле существующих
- Поддержка многопоточной обработки для повышения скорости
- Сохранение текстового слоя с помощью OCR
📌 GitHub: https://github.com/gavrielc/Nano-PDF
#python
❤5🔥3
🎤 Инновационная система распознавания речи Fun-ASR
Fun-ASR — мощная модель распознавания речи, обученная на миллионах часов аудиоданных. Она поддерживает 31 язык и обеспечивает высокую точность в сложных условиях, таких как шумные помещения. Модель адаптирована для профессиональных терминов в таких областях, как образование и финансы.
🚀 Основные моменты:
- Высокая точность распознавания до 93% в шумных условиях.
- Поддержка 31 языка с акцентом на восточноазиатские языки.
- Оптимизация для распознавания диалектов и региональных акцентов.
- Способность распознавать текст песен на фоне музыки.
📌 GitHub: https://github.com/FunAudioLLM/Fun-ASR
@pythonl
#python
Fun-ASR — мощная модель распознавания речи, обученная на миллионах часов аудиоданных. Она поддерживает 31 язык и обеспечивает высокую точность в сложных условиях, таких как шумные помещения. Модель адаптирована для профессиональных терминов в таких областях, как образование и финансы.
🚀 Основные моменты:
- Высокая точность распознавания до 93% в шумных условиях.
- Поддержка 31 языка с акцентом на восточноазиатские языки.
- Оптимизация для распознавания диалектов и региональных акцентов.
- Способность распознавать текст песен на фоне музыки.
📌 GitHub: https://github.com/FunAudioLLM/Fun-ASR
@pythonl
#python
❤8🔥8👍1
📄🚀 Qwen-Doc: Открытые проекты по пониманию документов
Qwen-Doc — это репозиторий, посвященный ИИ для работы с документами, разработанный командой Tongyi-Zhiwen. Здесь собраны исследования и практики, направленные на улучшение обработки сложных документов с помощью современных технологий, включая обучение с подкреплением и долгосрочное понимание контекста.
🚀Основные моменты:
- Модели для долгосрочного понимания документов.
- Использование обучения с подкреплением для улучшения ИИ.
- Открытые данные и методологии для сообщества.
- Проекты QwenLong-L1 и QwenLong-L1.5 с передовыми алгоритмами.
- FRAMEWORK SPELL для автономного генерации обучающих данных.
📌 GitHub: https://github.com/Tongyi-Zhiwen/Qwen-Doc
#python
Qwen-Doc — это репозиторий, посвященный ИИ для работы с документами, разработанный командой Tongyi-Zhiwen. Здесь собраны исследования и практики, направленные на улучшение обработки сложных документов с помощью современных технологий, включая обучение с подкреплением и долгосрочное понимание контекста.
🚀Основные моменты:
- Модели для долгосрочного понимания документов.
- Использование обучения с подкреплением для улучшения ИИ.
- Открытые данные и методологии для сообщества.
- Проекты QwenLong-L1 и QwenLong-L1.5 с передовыми алгоритмами.
- FRAMEWORK SPELL для автономного генерации обучающих данных.
📌 GitHub: https://github.com/Tongyi-Zhiwen/Qwen-Doc
#python
❤9👍5🔥4🤩1
🚀 Модели IQuest-Coder-V1 для автономного программирования
IQuest-Coder-V1 — это семейство больших языковых моделей, предназначенных для улучшения автономного программирования и интеллектуального анализа кода. Модели используют инновационную многослойную парадигму обучения, обеспечивая выдающиеся результаты на ключевых бенчмарках.
🚀 Основные моменты:
- Достигает лучших результатов на SWE-Bench и других бенчмарках.
- Обучение на основе динамики изменений в репозиториях.
- Два специализированных направления: Thinking и Instruct модели.
- Поддержка контекста до 128K токенов.
- Эффективная архитектура с рекуррентным механизмом.
📌 GitHub: https://github.com/IQuestLab/IQuest-Coder-V1
#python
IQuest-Coder-V1 — это семейство больших языковых моделей, предназначенных для улучшения автономного программирования и интеллектуального анализа кода. Модели используют инновационную многослойную парадигму обучения, обеспечивая выдающиеся результаты на ключевых бенчмарках.
🚀 Основные моменты:
- Достигает лучших результатов на SWE-Bench и других бенчмарках.
- Обучение на основе динамики изменений в репозиториях.
- Два специализированных направления: Thinking и Instruct модели.
- Поддержка контекста до 128K токенов.
- Эффективная архитектура с рекуррентным механизмом.
📌 GitHub: https://github.com/IQuestLab/IQuest-Coder-V1
#python
❤6👍6🔥2
📹 Загрузчик видео с YouTube и других платформ
tuitube — это текстовый интерфейс для загрузки видео с YouTube, 𝕏, Twitch, Instagram и Bilibili с использованием yt-dlp. Удобный инструмент для тех, кто предпочитает командную строку.
🚀 Основные моменты:
- Поддержка множества видео платформ
- Использует yt-dlp для загрузки
- Простой текстовый интерфейс
- Легко настраивается и использует командную строку
📌 GitHub: https://github.com/remorses/tuitube
#python
tuitube — это текстовый интерфейс для загрузки видео с YouTube, 𝕏, Twitch, Instagram и Bilibili с использованием yt-dlp. Удобный инструмент для тех, кто предпочитает командную строку.
🚀 Основные моменты:
- Поддержка множества видео платформ
- Использует yt-dlp для загрузки
- Простой текстовый интерфейс
- Легко настраивается и использует командную строку
📌 GitHub: https://github.com/remorses/tuitube
#python
👍25❤6🔥4
🛠️ Трекер токенов для LLM CLI инструментов
Sherlock предоставляет живую панель мониторинга для отслеживания использования токенов в LLM CLI инструментах. Вы можете в реальном времени видеть, сколько токенов вы используете, а также сохранять все запросы для последующего анализа.
🚀 Основные моменты:
- Отслеживание использования токенов в реальном времени
- Визуализация контекстных окон с индикатором
- Автоматическое сохранение запросов в формате Markdown и JSON
- Никакой конфигурации — просто установите и используйте
📌 GitHub: https://github.com/jmuncor/sherlock
#python
📲 Max
Sherlock предоставляет живую панель мониторинга для отслеживания использования токенов в LLM CLI инструментах. Вы можете в реальном времени видеть, сколько токенов вы используете, а также сохранять все запросы для последующего анализа.
🚀 Основные моменты:
- Отслеживание использования токенов в реальном времени
- Визуализация контекстных окон с индикатором
- Автоматическое сохранение запросов в формате Markdown и JSON
- Никакой конфигурации — просто установите и используйте
📌 GitHub: https://github.com/jmuncor/sherlock
#python
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8🔥3👍2