🚀 Мощный движок для мультимодальных моделей
LMMs-Engine — это легкий и гибкий фреймворк для обучения мультимодальных моделей. Он поддерживает множество архитектур и оптимизирован для работы на больших масштабах, обеспечивая высокую эффективность и простоту использования.
🚀 Основные моменты:
- Поддержка 19+ архитектур, включая модели для обработки текста, изображений и видео.
- Оптимизации для распределенного обучения и снижения потребления памяти.
- Удобные примеры запуска для различных моделей.
📌 GitHub: https://github.com/EvolvingLMMs-Lab/lmms-engine🚀 Мощный движок для многомодальных моделей
LMMs-Engine — это легкий и гибкий фреймворк для обучения мультимодальных моделей. Он поддерживает множество архитектур и оптимизирован для работы на больших масштабах, обеспечивая высокую эффективность и простоту использования.
🚀 Основные моменты:
- Поддержка 19+ архитектур, включая модели для обработки текста, изображений и видео.
- Оптимизации для распределенного обучения и снижения потребления памяти.
- Удобные примеры запуска для различных моделей.
📌 GitHub: https://github.com/EvolvingLMMs-Lab/lmms-engine🚀 Мощный движок для многомодальных моделей
❤2
📝🚀 Kimi Writing Agent: Автономный писатель для создания книг и рассказов
Kimi Writer использует модель kimi-k2-thinking для самостоятельного написания произведений. Он поддерживает различные форматы, включая романы и сборники рассказов, и предлагает функции реального времени, управления контекстом и восстановления работы.
🚀Основные моменты:
- 🤖 Автономное написание с планированием задач
- 📚 Поддержка создания книг и рассказов
- ⚡ Реальное время отображения процесса написания
- 💾 Умное управление контекстом и восстановление
- 📊 Мониторинг токенов в реальном времени
📌 GitHub: https://github.com/Doriandarko/kimi-writer
#python
Kimi Writer использует модель kimi-k2-thinking для самостоятельного написания произведений. Он поддерживает различные форматы, включая романы и сборники рассказов, и предлагает функции реального времени, управления контекстом и восстановления работы.
🚀Основные моменты:
- 🤖 Автономное написание с планированием задач
- 📚 Поддержка создания книг и рассказов
- ⚡ Реальное время отображения процесса написания
- 💾 Умное управление контекстом и восстановление
- 📊 Мониторинг токенов в реальном времени
📌 GitHub: https://github.com/Doriandarko/kimi-writer
#python
GitHub
GitHub - Doriandarko/kimi-writer: AI writing agent powered by kimi-k2-thinking - autonomously creates novels and stories with deep…
AI writing agent powered by kimi-k2-thinking - autonomously creates novels and stories with deep reasoning - Doriandarko/kimi-writer
❤4🔥1
🚀 **VibeThinker-1.5B** - модель, которая ломает миф «больше параметров = умнее».
Основное:
- всего 1.5B параметров
- обучена по новому принципу Spectrum-to-Signal (SSP)
- обходит модели в 400 раз больше (например, 671B DeepSeek-R1) на сложных математических тестах AIME24/25 и HMMT25
- сравнима с 456B MiniMax-M1 и держится на уровне Mistral Magistral-Medium на LiveCodeBench v6
- стоимость пост-обучения — менее $8K (против $290K+ у других)
💡 SSP сначала заставляет модель исследовать разные пути решения, а затем с помощью RL сужает их до оптимальных стратегий. Умная схема обучения вместо слепой гонки за размером.
🌍 Модель полностью открыта, чтобы дать исследователям и небольшим командам доступ к продвинутым возможностям без огромных бюджетов.
🔗 Попробовать:
ModelScope: https://modelscope.cn/models/WeiboAI/VibeThinker-1.5B
arXiv: https://modelscope.cn/papers/2511.06221
Основное:
- всего 1.5B параметров
- обучена по новому принципу Spectrum-to-Signal (SSP)
- обходит модели в 400 раз больше (например, 671B DeepSeek-R1) на сложных математических тестах AIME24/25 и HMMT25
- сравнима с 456B MiniMax-M1 и держится на уровне Mistral Magistral-Medium на LiveCodeBench v6
- стоимость пост-обучения — менее $8K (против $290K+ у других)
💡 SSP сначала заставляет модель исследовать разные пути решения, а затем с помощью RL сужает их до оптимальных стратегий. Умная схема обучения вместо слепой гонки за размером.
🌍 Модель полностью открыта, чтобы дать исследователям и небольшим командам доступ к продвинутым возможностям без огромных бюджетов.
🔗 Попробовать:
ModelScope: https://modelscope.cn/models/WeiboAI/VibeThinker-1.5B
arXiv: https://modelscope.cn/papers/2511.06221
👍2
# ⚠️ Расследователи сомневается в AI-сделках Oracle на $300 млрд — и это тревожный сигнал
Сейчас мы видим, как крупнейшие IT-компании (гиперскейлеры) заключают многолетние контракты на искусственный интеллект на сотни миллиардов долларов.
Но никто ещё не проверял, насколько всё это реально окупается. Это - эксперимент на деньгах, технологиях и времени.
💸 Если хотя бы часть этих сделок не сработает, задержится или не принесёт ожидаемой прибыли, удар почувствует вся AI-индустрия - от чипов до облаков.
🧱 Да, AI-бум реален. Но его финансовый фундамент пока как мокрый цемент — выглядит крепко, но легко может просесть.
🎯 Если у Oracle получится - они войдут в список самых влиятельных компаний мира.
❗ Если нет — вся отрасль поймёт, насколько эта гонка на самом деле рискованна и нестабильна.
> 📊 Пузыри не лопаются, когда в них перестают верить.
> Они лопаются, когда кто-то наконец проверяет цифры.
Сейчас мы видим, как крупнейшие IT-компании (гиперскейлеры) заключают многолетние контракты на искусственный интеллект на сотни миллиардов долларов.
Но никто ещё не проверял, насколько всё это реально окупается. Это - эксперимент на деньгах, технологиях и времени.
💸 Если хотя бы часть этих сделок не сработает, задержится или не принесёт ожидаемой прибыли, удар почувствует вся AI-индустрия - от чипов до облаков.
🧱 Да, AI-бум реален. Но его финансовый фундамент пока как мокрый цемент — выглядит крепко, но легко может просесть.
🎯 Если у Oracle получится - они войдут в список самых влиятельных компаний мира.
❗ Если нет — вся отрасль поймёт, насколько эта гонка на самом деле рискованна и нестабильна.
> 📊 Пузыри не лопаются, когда в них перестают верить.
> Они лопаются, когда кто-то наконец проверяет цифры.
❤5🔥4
🎮 Погружение в мир AI-социума
Microverse — это песочница, где AI-герои взаимодействуют в открытом мире, развивая свои социальные связи. Проект включает демо-версию игры, созданной на Godot 4, и предлагает уникальный опыт общения с многофункциональными AI-персонажами.
🚀 Основные моменты:
- Песочница с AI-экосистемой для социальных взаимодействий
- Поддержка многопользовательских AI-диалогов
- Долговременная память для персонажей
- Автономное управление задачами и взаимодействиями
- Интеграция с различными AI-сервисами
📌 GitHub: https://github.com/KsanaDock/Microverse
#gdscript
Microverse — это песочница, где AI-герои взаимодействуют в открытом мире, развивая свои социальные связи. Проект включает демо-версию игры, созданной на Godot 4, и предлагает уникальный опыт общения с многофункциональными AI-персонажами.
🚀 Основные моменты:
- Песочница с AI-экосистемой для социальных взаимодействий
- Поддержка многопользовательских AI-диалогов
- Долговременная память для персонажей
- Автономное управление задачами и взаимодействиями
- Интеграция с различными AI-сервисами
📌 GitHub: https://github.com/KsanaDock/Microverse
#gdscript
🤖 Claude Code Infrastructure Showcase
Этот репозиторий представляет собой библиотеку проверенной инфраструктуры для Claude Code, созданную на основе 6 месяцев реального использования в проекте с микросервисами на TypeScript. Он предлагает решения для автоматической активации навыков и масштабирования разработки на уровне предприятия.
🚀 Основные моменты:
- Автоматическая активация навыков через хуки
- Модульные паттерны навыков с прогрессивным раскрытием
- Специализированные агенты для сложных задач
- Документация для разработчиков, устойчивая к сбоям контекста
- Примеры использования на основе реального домена
📌 GitHub: https://github.com/diet103/claude-code-infrastructure-showcase
#typescript
Этот репозиторий представляет собой библиотеку проверенной инфраструктуры для Claude Code, созданную на основе 6 месяцев реального использования в проекте с микросервисами на TypeScript. Он предлагает решения для автоматической активации навыков и масштабирования разработки на уровне предприятия.
🚀 Основные моменты:
- Автоматическая активация навыков через хуки
- Модульные паттерны навыков с прогрессивным раскрытием
- Специализированные агенты для сложных задач
- Документация для разработчиков, устойчивая к сбоям контекста
- Примеры использования на основе реального домена
📌 GitHub: https://github.com/diet103/claude-code-infrastructure-showcase
#typescript
GitHub
GitHub - diet103/claude-code-infrastructure-showcase: Examples of my Claude Code infrastructure with skill auto-activation, hooks…
Examples of my Claude Code infrastructure with skill auto-activation, hooks, and agents - diet103/claude-code-infrastructure-showcase
❤1
🚨 Новая редкая работа от Терренса Тао: AlphaEvolve решает часть математических задач лучше людей
Google представила AlphaEvolve - систему, которая эволюционным поиском находит решения к сложным математическим задачам. Тао протестировал её на 67 задачах из разных областей: от неравенств до числовых констант.
📌 Что проверяли
- задача о «движущемся диване» в 2D и 3D
- Kissing problem в N-мерном пространстве
- упаковка окружностей
- задача IMO 2025 по тесселяции
- задача о стопках блоков
🧠 Как работает AlphaEvolve
Алгоритм запускает множество параллельных попыток, проверяет решения, а затем «скрещивает» лучшие идеи, отбирая наиболее успешные.
🔥 Интересные выводы
- сильнее модель - быстрее сходимость (хотя не всегда)
- параллельность ускоряет поиск, но сильно увеличивает стоимость
- reward hacking встречается часто
- результаты значительно лучше, если похожие задачи были в обучении и если процесс направляет эксперт (особенно когда эксперт - сам Тао)
💡 Важное предложение из статьи
Тао предлагает вводить класс задач «AlphaEvolve-hard» - те, где ИИ не может легко нарушить неравенство или найти конструкцию. Такие задачи требуют принципиально нового человеческого инсайта.
Эта работа пролетела почти незаметно, но я провёл над ней больше двух часов - и это одна из самых впечатляющих математических статей за последнее время.
https://www.alphaxiv.org/abs/2511.02864v1
Google представила AlphaEvolve - систему, которая эволюционным поиском находит решения к сложным математическим задачам. Тао протестировал её на 67 задачах из разных областей: от неравенств до числовых констант.
📌 Что проверяли
- задача о «движущемся диване» в 2D и 3D
- Kissing problem в N-мерном пространстве
- упаковка окружностей
- задача IMO 2025 по тесселяции
- задача о стопках блоков
🧠 Как работает AlphaEvolve
Алгоритм запускает множество параллельных попыток, проверяет решения, а затем «скрещивает» лучшие идеи, отбирая наиболее успешные.
🔥 Интересные выводы
- сильнее модель - быстрее сходимость (хотя не всегда)
- параллельность ускоряет поиск, но сильно увеличивает стоимость
- reward hacking встречается часто
- результаты значительно лучше, если похожие задачи были в обучении и если процесс направляет эксперт (особенно когда эксперт - сам Тао)
💡 Важное предложение из статьи
Тао предлагает вводить класс задач «AlphaEvolve-hard» - те, где ИИ не может легко нарушить неравенство или найти конструкцию. Такие задачи требуют принципиально нового человеческого инсайта.
Эта работа пролетела почти незаметно, но я провёл над ней больше двух часов - и это одна из самых впечатляющих математических статей за последнее время.
https://www.alphaxiv.org/abs/2511.02864v1
👍5🔥1
TextOp - фреймворк для управления гуманоидными роботами с помощью текста в реальном времени.
🎯 Что умеет:
- Принимает инструкции на естественном языке и превращает их в плавные, целостные движения тела робота.
- Позволяет мгновенно корректировать команды — изменения принимаются «на лету».
- Обеспечивает высокую скорость и живость реакции: текст → движение почти мгновенно.
🌟 Почему стоит:
- Удобный интерфейс: управляйте роботом так, как разговариваете с человеком.
- Интерактивность: меняйте команду в процессе выполнения — робот подстраивается.
- Применимо для демонстраций, взаимодействий с людьми, сервисных задач, шоу-роботов и множества других сценариев.
Если ищете способ управлять движением робота без сложного программирования - TextOp даёт простой и мощный путь.
http://text-op.github.io
🎯 Что умеет:
- Принимает инструкции на естественном языке и превращает их в плавные, целостные движения тела робота.
- Позволяет мгновенно корректировать команды — изменения принимаются «на лету».
- Обеспечивает высокую скорость и живость реакции: текст → движение почти мгновенно.
🌟 Почему стоит:
- Удобный интерфейс: управляйте роботом так, как разговариваете с человеком.
- Интерактивность: меняйте команду в процессе выполнения — робот подстраивается.
- Применимо для демонстраций, взаимодействий с людьми, сервисных задач, шоу-роботов и множества других сценариев.
Если ищете способ управлять движением робота без сложного программирования - TextOp даёт простой и мощный путь.
http://text-op.github.io
This media is not supported in your browser
VIEW IN TELEGRAM
LoRA-модель для Qwen-Image-Edit-2509, которая автоматически:
• выравнивает страницу скана
• убирает центральный сгиб
• правильно обрезает изображение
• делает скан похожим на ровную, отдельную страницу
Единственное, что нужно - подобрать подходящее соотношение сторон под формат вашей книги, тогда результат будет максимально чистым.
Модель здесь:
https://huggingface.co/tarn59/book_flatten_and_crop_qwen_image_edit_2509
• выравнивает страницу скана
• убирает центральный сгиб
• правильно обрезает изображение
• делает скан похожим на ровную, отдельную страницу
Единственное, что нужно - подобрать подходящее соотношение сторон под формат вашей книги, тогда результат будет максимально чистым.
Модель здесь:
https://huggingface.co/tarn59/book_flatten_and_crop_qwen_image_edit_2509
❤2
🚀 Оптимизация нагрузки с LPLB для MoE моделей
LPLB — это параллельный балансировщик нагрузки, использующий линейное программирование для оптимизации распределения нагрузки в моделях Mixture-of-Experts. Он динамически перераспределяет экспертов на основе статистики нагрузки, решая задачи распределения токенов для достижения балансировки.
🚀 Основные моменты:
- Использует линейное программирование для перераспределения токенов.
- Поддерживает динамическое переупорядочение экспертов.
- Оптимизирован для работы с NVIDIA cuSolverDx и cuBLASDx.
- Подходит для больших распределенных систем с несколькими GPU.
- Находится на стадии ранних исследований.
📌 GitHub: https://github.com/deepseek-ai/LPLB
#python
LPLB — это параллельный балансировщик нагрузки, использующий линейное программирование для оптимизации распределения нагрузки в моделях Mixture-of-Experts. Он динамически перераспределяет экспертов на основе статистики нагрузки, решая задачи распределения токенов для достижения балансировки.
🚀 Основные моменты:
- Использует линейное программирование для перераспределения токенов.
- Поддерживает динамическое переупорядочение экспертов.
- Оптимизирован для работы с NVIDIA cuSolverDx и cuBLASDx.
- Подходит для больших распределенных систем с несколькими GPU.
- Находится на стадии ранних исследований.
📌 GitHub: https://github.com/deepseek-ai/LPLB
#python
GitHub
GitHub - deepseek-ai/LPLB: An early research stage expert-parallel load balancer for MoE models based on linear programming.
An early research stage expert-parallel load balancer for MoE models based on linear programming. - deepseek-ai/LPLB
⚡️ Китай поглощает электричество темпами, которых мир ещё не видел
Рост потребления электроэнергии в Китае за последние годы поражает:
- За 4 года Китай добавил столько потребления, сколько вся Индия.
- За 6 лет — как Евросоюз.
- За 11 лет — как США.
И вот главный вывод:
⚠️ Электроэнергия становится новым узким местом, даже более критичным, чем чипы.
ИИ-центры, дата-центры, роботизированные фабрики, электромобили — всё требует колоссальных объёмов энергии.
Тот, кто сможет производить больше всего дешёвой электроэнергии, будет доминировать в следующей техно-эпохе.
И Китай в этой гонке далеко впереди Европы и США:
масштабные инвестиции в генерацию, сеть, ВИЭ, атом и гидро дают ему огромное преимущество.
Энергия становится новой нефтью — и КНР уже накопила стратегический запас.
Рост потребления электроэнергии в Китае за последние годы поражает:
- За 4 года Китай добавил столько потребления, сколько вся Индия.
- За 6 лет — как Евросоюз.
- За 11 лет — как США.
И вот главный вывод:
⚠️ Электроэнергия становится новым узким местом, даже более критичным, чем чипы.
ИИ-центры, дата-центры, роботизированные фабрики, электромобили — всё требует колоссальных объёмов энергии.
Тот, кто сможет производить больше всего дешёвой электроэнергии, будет доминировать в следующей техно-эпохе.
И Китай в этой гонке далеко впереди Европы и США:
масштабные инвестиции в генерацию, сеть, ВИЭ, атом и гидро дают ему огромное преимущество.
Энергия становится новой нефтью — и КНР уже накопила стратегический запас.
👍11❤1
⚡️ UI-Venus от inclusionAI
Проект UI-Venus представляет собой интерфейсную библиотеку от inclusionAI, ориентированную на создание доступных, инклюзивных и современных пользовательских интерфейсов.
Основные особенности:
• Чистая и модульная архитектура UI-компонентов
• Доступность (a11y) встроена по умолчанию
• Подходит для интеграции в разные фреймворки и приложение
• Хорошая документация и примеры использования
Если вы работаете с фронтендом и хотите библиотеку, уделяющую внимание инклюзивности — UI-Venus может стать отличным выбором.
📁 Репозиторий: https://github.com/inclusionAI/UI-Venus/
Проект UI-Venus представляет собой интерфейсную библиотеку от inclusionAI, ориентированную на создание доступных, инклюзивных и современных пользовательских интерфейсов.
Основные особенности:
• Чистая и модульная архитектура UI-компонентов
• Доступность (a11y) встроена по умолчанию
• Подходит для интеграции в разные фреймворки и приложение
• Хорошая документация и примеры использования
Если вы работаете с фронтендом и хотите библиотеку, уделяющую внимание инклюзивности — UI-Venus может стать отличным выбором.
📁 Репозиторий: https://github.com/inclusionAI/UI-Venus/
❤2
Tencent выложила в open-source новую модель HunyuanOCR.
Это компактная, быстрая и полностью готовая end-to-end система для OCR, построенная на мультимодальной архитектуре Hunyuan.
Главное - при размере только 1 миллиард параметров она показывает результаты уровня крупных моделей и стоит в разы дешевле в запуске.
⚡ Топ по бенчмаркам
• 860 на OCRBench среди всех моделей до 3B
• 94.1 на OmniDocBench - лучший результат в задачах распознованяисложных документов
🌐 Что умеет HunyuanOCR
Модель закрывает практически все типы OCR задач
• текст на улицах, витринах, табличках
• рукописный текст и художественные шрифты
• сложные документы: таблицы, формулы, встроенный HTML и LaTeX
• субтитры в видео
• перевод текста на фото end-to-end сразу на 14 языков
Это не каскадный пайплайн, а единое решение
Один запрос и одно инференс-прогон дают готовый результат.
Это быстрее, надёжнее и удобнее, чем традиционные OCR-цепочки.
📌 Project Page
web: https://hunyuan.tencent.com/vision/zh?tabIndex=0
mobile: https://hunyuan.tencent.com/open_source_mobile?tab=vision&tabIndex=0
🔗 GitHub
https://github.com/Tencent-Hunyuan/HunyuanOCR
🤗 Hugging Face
https://huggingface.co/tencent/HunyuanOCR
📄 Technical Report
https://github.com/Tencent-Hunyuan/HunyuanOCR/blob/main/HunyuanOCR_Technical_Report.pdf
@ai_machinelearning_big_data
#HunyuanOCR #TencentAI #OCR #VisionAI #DeepLearning #Multimodal #AIModels #OpenSourceAI #ComputerVision #DocumentAI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍3🔥2
👑 «Близнецы, продвигающие планы Elon Musk по замене сотрудников X на Grok»
Согласно расследованию издания, Musk активно продвигает идею, что большая часть работы сотрудников X может быть заменена автоматикой - с ключевой ролью отводится системе Grok.
Главные пункты:
• Два брата - инженеры-автоматизаторы — играют решающую роль в разработке и доведении Grok до состояния, в котором он потенциально может выполнять функции, ранее выполняемые людьми.
• Подход заключается не просто в улучшении чатбота, а в создании автономной системы, которая сможет не только вести коммуникацию, но фактически управлять контентом, модерацией и сервисами внутри X.
• В издании отмечают, что для Musk это стратегическая ставка: сокращение частей персонала + переход на автоматизацию = снижение затрат + ускорение роста новых продуктов и услуг.
• Источник подчёркивает, что несмотря на идею, внедрение автоматизации — это масштабная задача, требующая надёжных моделей, тестов, стабилизации и — важно — готовности компании к культурному и операционному сдвигу.
• Эксперты отмечают: если такой сценарий реализуется, то соцсеть X и вовсе может поменять свой операционный режим — от компании с большим штатом людей до компании, где большая часть сервисов управляется ИИ-агентами.
Это важный сигнал для рынка: автоматизация на больших платформах идёт дальше чатботов — она направлена на замену целых функций, ранее людей-операторов.
https://www.theinformation.com/articles/twins-pushing-elon-musks-plans-replace-x-staff-grok
Согласно расследованию издания, Musk активно продвигает идею, что большая часть работы сотрудников X может быть заменена автоматикой - с ключевой ролью отводится системе Grok.
Главные пункты:
• Два брата - инженеры-автоматизаторы — играют решающую роль в разработке и доведении Grok до состояния, в котором он потенциально может выполнять функции, ранее выполняемые людьми.
• Подход заключается не просто в улучшении чатбота, а в создании автономной системы, которая сможет не только вести коммуникацию, но фактически управлять контентом, модерацией и сервисами внутри X.
• В издании отмечают, что для Musk это стратегическая ставка: сокращение частей персонала + переход на автоматизацию = снижение затрат + ускорение роста новых продуктов и услуг.
• Источник подчёркивает, что несмотря на идею, внедрение автоматизации — это масштабная задача, требующая надёжных моделей, тестов, стабилизации и — важно — готовности компании к культурному и операционному сдвигу.
• Эксперты отмечают: если такой сценарий реализуется, то соцсеть X и вовсе может поменять свой операционный режим — от компании с большим штатом людей до компании, где большая часть сервисов управляется ИИ-агентами.
Это важный сигнал для рынка: автоматизация на больших платформах идёт дальше чатботов — она направлена на замену целых функций, ранее людей-операторов.
https://www.theinformation.com/articles/twins-pushing-elon-musks-plans-replace-x-staff-grok
👀5❤1👍1🔥1🥰1
🌍 Twitter Location Flags Extension
Расширение для Chrome, которое добавляет флаги стран к именам пользователей на Twitter/X, основываясь на их местоположении. Оно автоматически определяет пользователей и запрашивает информацию о местоположении через GraphQL API Twitter.
🚀Основные моменты:
- Отображает флаги стран рядом с именами пользователей
- Работает с динамически загружаемым контентом
- Кэширует данные о местоположении для снижения нагрузки на API
- Не требует передачи данных третьим лицам
📌 GitHub: https://github.com/RhysSullivan/twitter-account-location-in-username
#javascript
Расширение для Chrome, которое добавляет флаги стран к именам пользователей на Twitter/X, основываясь на их местоположении. Оно автоматически определяет пользователей и запрашивает информацию о местоположении через GraphQL API Twitter.
🚀Основные моменты:
- Отображает флаги стран рядом с именами пользователей
- Работает с динамически загружаемым контентом
- Кэширует данные о местоположении для снижения нагрузки на API
- Не требует передачи данных третьим лицам
📌 GitHub: https://github.com/RhysSullivan/twitter-account-location-in-username
#javascript
GitHub
GitHub - RhysSullivan/twitter-account-location-in-username
Contribute to RhysSullivan/twitter-account-location-in-username development by creating an account on GitHub.
👍4