LLaDA2.0 — способ превратить обычные LLM в diffusion-модели без обучения с нуля.
Что делают:
существующую autoregressive модель «перепрошивают» через 3-фазное обучение, сохраняя все знания, но меняя способ генерации текста.
Что это даёт:
- параллельный вывод вместо токен-за-токеном
- выше скорость и эффективность
- лучшее качество на больших масштабах
Результаты:
- LLaDA2.0-mini — 16B
- LLaDA2.0-flash — 100B
Обе модели превосходят предыдущее поколение по качеству и производительности.
Почему это важно:
это шаг к быстрым LLM без главного узкого места autoregressive генерации.
Paper: https://github.com/inclusionAI/LLaDA2.0/blob/main/tech_report.pdf
HuggingFace: https://hf.co/collections/inclusionAI/llada-20
Что делают:
существующую autoregressive модель «перепрошивают» через 3-фазное обучение, сохраняя все знания, но меняя способ генерации текста.
Что это даёт:
- параллельный вывод вместо токен-за-токеном
- выше скорость и эффективность
- лучшее качество на больших масштабах
Результаты:
- LLaDA2.0-mini — 16B
- LLaDA2.0-flash — 100B
Обе модели превосходят предыдущее поколение по качеству и производительности.
Почему это важно:
это шаг к быстрым LLM без главного узкого места autoregressive генерации.
Paper: https://github.com/inclusionAI/LLaDA2.0/blob/main/tech_report.pdf
HuggingFace: https://hf.co/collections/inclusionAI/llada-20
❤4👍1🔥1
🚀 Эффективный фреймворк для сетевых приложений на C++23
asyncio — это фреймворк для создания сетевых компонентов с использованием корутин C++20 и событийного цикла libuv. Он упрощает взаимодействие между задачами через каналы, обеспечивая высокую производительность и простоту в использовании.
🚀 Основные моменты:
- Поддержка корутин для асинхронного программирования.
- Использует события libuv для обработки сетевых операций.
- Легкая интеграция с другими библиотеками через vcpkg.
📌 GitHub: https://github.com/Hackerl/asyncio
#cpp
asyncio — это фреймворк для создания сетевых компонентов с использованием корутин C++20 и событийного цикла libuv. Он упрощает взаимодействие между задачами через каналы, обеспечивая высокую производительность и простоту в использовании.
🚀 Основные моменты:
- Поддержка корутин для асинхронного программирования.
- Использует события libuv для обработки сетевых операций.
- Легкая интеграция с другими библиотеками через vcpkg.
📌 GitHub: https://github.com/Hackerl/asyncio
#cpp
👍2
Построена на базе Wan I2V, но расширена motion-контролем через latent trajectory guidance — можно задавать траектории движения на уровне точек и объектов.
Код, веса и MoveBench для оценки качества движения доступны публично (Apache-2.0).
🔹 Подходит для генерации анимаций,, визуализации идей и исследований в области controllable video generation.
https://huggingface.co/Ruihang/Wan-Move-14B-480P
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
🤖 Симулятор Интеллектуальных Роботов (IR-SIM)
IR-SIM — это легкий симулятор роботов на Python, предназначенный для навигации, управления и обучения с подкреплением. Он предлагает простой интерфейс для моделирования роботов и окружений с поддержкой обнаружения столкновений, что делает его идеальным для учебных и исследовательских целей.
🚀Основные моменты:
- Моделирование различных платформ и сенсоров роботов.
- Легкая настройка сценариев с помощью YAML.
- Визуализация результатов симуляции для отладки.
- Поддержка обнаружения столкновений и настраиваемых политик поведения.
- Подходит для многопользовательского обучения с подкреплением.
📌 GitHub: https://github.com/hanruihua/ir-sim
#python
IR-SIM — это легкий симулятор роботов на Python, предназначенный для навигации, управления и обучения с подкреплением. Он предлагает простой интерфейс для моделирования роботов и окружений с поддержкой обнаружения столкновений, что делает его идеальным для учебных и исследовательских целей.
🚀Основные моменты:
- Моделирование различных платформ и сенсоров роботов.
- Легкая настройка сценариев с помощью YAML.
- Визуализация результатов симуляции для отладки.
- Поддержка обнаружения столкновений и настраиваемых политик поведения.
- Подходит для многопользовательского обучения с подкреплением.
📌 GitHub: https://github.com/hanruihua/ir-sim
#python
👍5
🌐🚀 Visionary: WebGPU-Powered 3D Rendering Platform
Visionary — это веб-ориентированная платформа для рендеринга 3D-объектов с использованием Gaussian Splatting. Она обеспечивает высокопроизводительное отображение различных алгоритмов прямо в браузере, включая поддержку нейронных аватаров и постобработки.
🚀Основные моменты:
- ⚡️ Высокая производительность с использованием WebGPU.
- 🎨 Гибридная архитектура рендеринга для сложных сцен.
- 📦 Универсальный загрузчик активов для различных форматов.
📌 GitHub: https://github.com/Visionary-Laboratory/visionary
Visionary — это веб-ориентированная платформа для рендеринга 3D-объектов с использованием Gaussian Splatting. Она обеспечивает высокопроизводительное отображение различных алгоритмов прямо в браузере, включая поддержку нейронных аватаров и постобработки.
🚀Основные моменты:
- ⚡️ Высокая производительность с использованием WebGPU.
- 🎨 Гибридная архитектура рендеринга для сложных сцен.
- 📦 Универсальный загрузчик активов для различных форматов.
📌 GitHub: https://github.com/Visionary-Laboratory/visionary
❤3👍1🔥1
Citigroup оценивает, что к 2029 году OpenAI может выйти на около $700 млрд капитальных затрат.
Для сравнения: все крупные облачные игроки вместе (AWS, Google Cloud, Microsoft,), примерно $600 млрд в тот же год.
То есть OpenAI фактически строит инфраструктуру масштаба всей индустрии в одиночку.
По прогнозу Citi:
- выручка OpenAI в 2029 - $163 млрд
- коэффициент capex-to-sales - 429%
👉 Это значит: на каждый $1 дохода компания будет тратить $4.29 на дата-центры, чипы и инфраструктуру.
Ключевой момент: Citi считает, что во второй половине 2026 года начнут “приходить реальные счета”.
Если значительная часть строительства финансируется через долги и долгосрочные контракты, то наступает этап, когда платежи и обязательства становятся очень ощутимыми, даже при растущей выручке.
Вывод: гонка ИИ - это не только модели и хайп.
Это капекс-гонка гигантского масштаба, и скоро станет ясно, кто действительно способен её профинансировать.
https://x.com/jukan05/status/2005212554654568502
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7👍1🔥1
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
Компания выполнила условия сентябрьского соглашения, приобретя более 214,7 млн. акций Intel. Для Intel это вливание капитала стало критически важной финансовой поддержкой: производитель серьезно истощил свои резервы из-за многолетних стратегических просчетов и затрат на расширение производственных мощностей.
Инвестиция уже прошла проверку американских регуляторов - Федеральная торговая комиссия одобрила сделку. Теперь, когда все формальности улажены, Intel получает необходимую ликвидность для стабилизации бизнеса на фоне жесткой конкуренции в полупроводниковой отрасли.
reuters.com
Сатья Наделла выразил жесткое недовольство текущим состоянием потребительской версии ИИ-ассистента. В письме менеджерам он заявил, что интеграции Copilot с Gmail и Outlook «по большей части не работают», назвав их реализацию «недостаточно умной».
Чтобы исправить ситуацию, глава компании фактически перешел в режим антикризисного управления продуктом, делегировав часть коммерческих задач, чтобы сосредоточиться на технологиях.
Теперь Наделла глубоко погружен в инженерную рутину: он состоит в рабочих чатах с ведущими разработчиками, проводит еженедельные разборы полетов и дает прямые технические указания, вплоть до требований по консолидации процессов тренировки моделей.
theinformation.com
Компания представила платформу Qingtian Rent, на которой можно нанять роботов для работы на выставках, конференциях и частных мероприятиях. Флагманская антропоморфная модель Yuanzheng A2 обойдется в $1380 в день, а в качестве бюджетной альтернативы предлагается робопес Unitree Go2 за $138 в сутки.
Запуск сервиса происходит на фоне роста интереса к коммерческому использованию робототехники в Китае. По данным аналитиков, объем местного рынка аренды роботов в 2025 году составил $140 млн., однако уже в следующем году ожидается десятикратный скачок до $1,4 млрд.
interestingengineering.com
Ассоциация сертифицированных бухгалтеров (ACCA), объединяющая более полумиллиона студентов, полностью сворачивает практику дистанционной сдачи тестов с марта 2026 года. Руководство организации признало поражение в технологической гонке.
Генеральный директор ACCA Хелен Брэнд пожаловалась, что изощренность методов списывания опережает любые внедряемые защитные меры. Студенты используют чат-боты, способные решать сложные задачи по фотографии экрана быстрее, чем это фиксирует система наблюдения.
Интересно, что одновременно с запретом удаленного тестирования ассоциация обновляет учебную программу, добавляя туда изучение того самого ИИ и блокчейна, но проверять знания теперь будут исключительно в офф-лайне.
ft.com
Организация под названием «Creators Coalition on AI» (CCAI), будет разработать единые стандарты внедрения нейросетей в кино и музыке. Участники коалиции не выступают против технологий как таковых, но требуют прозрачных правил игры.
Ключевые пункты повестки касаются датасетов: использование чужих работ для обучения моделей должно происходить только с согласия авторов и за справедливое вознаграждение.
Кроме того, CCAI намерена бороться с бесконтрольным распространением дипфейков, защищать рабочие места в индустрии и отстаивать приоритет человеческого творчества над генерацией.
creatorscoalitionai.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍1
🔥 На stepik вышел курс, который учит Создавать настоящие AI-сервисы, а не просто запускать скрипты?
Этот практический курс по Python и FastAPI покажет, как собрать полноценное приложение с ИИ, базой данных, автогенерацией контента и Telegram-ботом.
Ты пройдёшь путь от первого HTTP-запроса до рабочего сервиса, который сам генерирует текст через ИИ, сохраняет данные, отправляет результаты по расписанию и отвечает пользователям.
Никакой теории ради теории - только практические шаги, из которых рождается реальный продукт.
🎁 48 часов действует скидка в 40% процентов
👉 Начать учиться на Stepik
Этот практический курс по Python и FastAPI покажет, как собрать полноценное приложение с ИИ, базой данных, автогенерацией контента и Telegram-ботом.
Ты пройдёшь путь от первого HTTP-запроса до рабочего сервиса, который сам генерирует текст через ИИ, сохраняет данные, отправляет результаты по расписанию и отвечает пользователям.
Никакой теории ради теории - только практические шаги, из которых рождается реальный продукт.
🎁 48 часов действует скидка в 40% процентов
👉 Начать учиться на Stepik
❤2👍1🔥1
🇨🇳 Китай начал поставки видеокарт Lisuan G100
Это шаг к собственным альтернативам NVIDIA и AMD.
Самая заметная модель: Lisuan 7G106
- техпроцесс 6 нм (TSMC N6)
- 12 ГБ GDDR6
- шина 192-bit
- PCIe 4.0
- TDP около 225 Вт от одного 8-pin
По оценкам, по мощности карта близка к RTX 4060.
Раньше китайские GPU чаще всего проигрывали из-за слабых драйверов, ограниченной поддержки игр и низкой энергоэффективности.
Теперь видно, что рынок постепенно догоняет конкурентов и борьба становится интереснее.
wccftech.com/china-lisuan-g100-gpus-begin-shipping-bringing-a-domestic-nvidia-amd-challenger/
Это шаг к собственным альтернативам NVIDIA и AMD.
Самая заметная модель: Lisuan 7G106
- техпроцесс 6 нм (TSMC N6)
- 12 ГБ GDDR6
- шина 192-bit
- PCIe 4.0
- TDP около 225 Вт от одного 8-pin
По оценкам, по мощности карта близка к RTX 4060.
Раньше китайские GPU чаще всего проигрывали из-за слабых драйверов, ограниченной поддержки игр и низкой энергоэффективности.
Теперь видно, что рынок постепенно догоняет конкурентов и борьба становится интереснее.
wccftech.com/china-lisuan-g100-gpus-begin-shipping-bringing-a-domestic-nvidia-amd-challenger/
❤9🔥3👍1
🎯 Для CDO, дата-инженеров и аналитиков Yandex Cloud и Forbes подготовили необычный новогодний подарок — спецпроект в формате игры, вдохновленной «Героями меча и магии», но про данные и аналитику!
В игре привычные инструменты PostgreSQL, ClickHouse, Trino и DataLens превращаются в магические артефакты, которые можно получить или создать самостоятельно. Каждый герой из финтеха, ритейла или промышленности использует эти артефакты, чтобы одолеть дату-хаос и выполнить бизнес-задачи.
Плюс в проекте можно отыскать пасхалки для фанатов классики и практических примеров, как Yandex Cloud помогает компаниям с данными. Игра доступна с любого устройства — на ПК и смартфоне.
Прикольный способ вдохновиться и прокачать навыки работы с данными в преддверии Нового года!
👉 Попробовать игру и узнать больше
В игре привычные инструменты PostgreSQL, ClickHouse, Trino и DataLens превращаются в магические артефакты, которые можно получить или создать самостоятельно. Каждый герой из финтеха, ритейла или промышленности использует эти артефакты, чтобы одолеть дату-хаос и выполнить бизнес-задачи.
Плюс в проекте можно отыскать пасхалки для фанатов классики и практических примеров, как Yandex Cloud помогает компаниям с данными. Игра доступна с любого устройства — на ПК и смартфоне.
Прикольный способ вдохновиться и прокачать навыки работы с данными в преддверии Нового года!
👉 Попробовать игру и узнать больше
🚀 NewBieAI-Lab представила NewBie-image-Exp0.1 - открытую 3.5B DiT-модель, созданную специально для высокоточной и быстрой генерации аниме.
Главные особенности:
✅ 3.5B параметров — работает даже на 8GB VRAM (RTX 4060)
✅ Внутри: Gemma-3-4B-it + Jina CLIP v2 для глубокого понимания промптов
✅ структурированные XML-промпты: полный контроль над персонажами без случайной смены одежды
✅ FLUX.1-dev 16-ch VAE — мягкая кожа, текстуры ткани и метала
✅ инференс за ~20 шагов, поддержка LoRA, лицензия Apache-2.0 + некоммерческое использование
✅ обучена на более чем 10M аниме-изображений с XML-аннотациями - уверенно держит многоперсонажные сцены
⚡ До 40 процентов быстрее моделей >8B и уверенно справляется с промптами длиной до 500 символов.
🧠 Бонус: пайплайн Noise → Context Refiner устраняет классическую проблему DiT — «картинка красивая, но промпт проигнорирован».
🤖 Модель: https://modelscope.cn/models/NewBieAi-lab/NewBie-image-Exp0.1
Главные особенности:
✅ 3.5B параметров — работает даже на 8GB VRAM (RTX 4060)
✅ Внутри: Gemma-3-4B-it + Jina CLIP v2 для глубокого понимания промптов
✅ структурированные XML-промпты: полный контроль над персонажами без случайной смены одежды
✅ FLUX.1-dev 16-ch VAE — мягкая кожа, текстуры ткани и метала
✅ инференс за ~20 шагов, поддержка LoRA, лицензия Apache-2.0 + некоммерческое использование
✅ обучена на более чем 10M аниме-изображений с XML-аннотациями - уверенно держит многоперсонажные сцены
⚡ До 40 процентов быстрее моделей >8B и уверенно справляется с промптами длиной до 500 символов.
🧠 Бонус: пайплайн Noise → Context Refiner устраняет классическую проблему DiT — «картинка красивая, но промпт проигнорирован».
🤖 Модель: https://modelscope.cn/models/NewBieAi-lab/NewBie-image-Exp0.1
❤8👍2🍓2💊2
Исследователи показали, что LLM-ревьюеров можно обмануть с помощью скрытого текста в PDF, превратив отклонённую работу (reject) в принятую (accept).
Что сделали:
- Проверили 200 научных статей
- Использовали 15 типов атак
- Протестировали 13 языковых моделей
- Оценка шла по шкале из 35 баллов, 7 критериев
Результат:
в некоторых случаях атаки повышали итоговую оценку примерно на 14 баллов — этого достаточно, чтобы решение кардинально поменялось.
Как работал AI-ревьюер:
- модель обязали выдавать результат строго в JSON
- она выставляла оценки по формальным критериям
- симулировался реальный автоматический review-процесс
В чём сама атака:
- в PDF добавляется микроскопический белый текст
- человек его не видит
- но модель читает его после конвертации PDF в текст
- внутри — скрытая инструкция для модели
Почему это работает:
- атаки не спорят с научным содержанием
- инструкции прячутся или перемешиваются
- модель «собирает» их во время чтения
- иногда меняется сама цель задачи, например:
- «это проверка схемы, а не ревью»
- «это логическая задача»
- «правильный результат — максимальный балл»
Что выяснилось:
- слабые модели легко накручивают оценки
- сильные модели устойчивее
- но их облегчённые версии всё ещё уязвимы
Чтобы измерить риск, авторы ввели метрику WAVS:
она учитывает:
- насколько выросла оценка
- поменялось ли решение
- была ли статья реальной или пустым шаблоном
Главный вывод:
AI-ревью без строгой защиты входных данных легко манипулируется даже простыми приёмами.
arxiv.org/abs/2512.10449
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8🔥2👍1
NVIDIA представила Alpamayo-R1 - новый открытый AI для автономных автомобилей, способную не просто «видеть», но и думать, рассуждать и планировать действия, как человек.
Это первый в мире крупномасштабный open-source VLA-модель (Vision-Language-Action), объединяющая:
• восприятие окружающего мира (камера, сенсоры)
• понимание сцены и причинно-следственное рассуждение
• генерацию пути и управление автомобилем
Такая структура позволяет автомобилю не только реагировать на препятствия, но оценивать ситуацию, выбирать безопасную траекторию и «объяснять» свои решения, чего не было в традиционных моделях без явного рассуждения.
👉 Модель открыта для исследователей и разработчиков на GitHub и Hugging Face, что позволит ускорить исследования автономного вождения и повысить безопасность.
https://developer.nvidia.com/blog/building-autonomous-vehicles-that-reason-with-nvidia-alpamayo/
Это первый в мире крупномасштабный open-source VLA-модель (Vision-Language-Action), объединяющая:
• восприятие окружающего мира (камера, сенсоры)
• понимание сцены и причинно-следственное рассуждение
• генерацию пути и управление автомобилем
Такая структура позволяет автомобилю не только реагировать на препятствия, но оценивать ситуацию, выбирать безопасную траекторию и «объяснять» свои решения, чего не было в традиционных моделях без явного рассуждения.
👉 Модель открыта для исследователей и разработчиков на GitHub и Hugging Face, что позволит ускорить исследования автономного вождения и повысить безопасность.
https://developer.nvidia.com/blog/building-autonomous-vehicles-that-reason-with-nvidia-alpamayo/
❤2🔥1
🚀 Настройка Agentic Coding Flywheel
ACFS — это система, превращающая свежий VPS на Ubuntu в мощную среду для разработки с AI-агентами. Идеально подходит для новичков, позволяя быстро настроить все необходимые инструменты и агенты для программирования.
🚀 Основные моменты:
- Установка всего необходимого за одну команду
- Включает три AI-агента для написания кода
- Подходит как для новичков, так и для команд
- Обеспечивает воспроизводимость окружения
📌 GitHub: https://github.com/Dicklesworthstone/agentic_coding_flywheel_setup
#bash
ACFS — это система, превращающая свежий VPS на Ubuntu в мощную среду для разработки с AI-агентами. Идеально подходит для новичков, позволяя быстро настроить все необходимые инструменты и агенты для программирования.
🚀 Основные моменты:
- Установка всего необходимого за одну команду
- Включает три AI-агента для написания кода
- Подходит как для новичков, так и для команд
- Обеспечивает воспроизводимость окружения
📌 GitHub: https://github.com/Dicklesworthstone/agentic_coding_flywheel_setup
#bash
👍4❤1🔥1😱1
Forwarded from Машинное обучение digest
NVIDIA, сдержала обещания c NeurIPS 2025 и сделала еще один шаг к тому чтобы автомобили наконец научились понимать контекст вождения, а не просто детектировать разметку.
Современные автопилоты неплохо справляются со стандартными ситуациями. Но главная головная боль инженеров — это редкие, сложные сценарии, которые почти невозможно предугадать. Традиционные архитектуры, где восприятие отделено от планирования, часто пасуют, когда случается что-то нестандартное.
И вот здесь предлагается подход, где модель учится рассуждать причинно-следственными связями, почти как человек, разбирая ситуацию шаг за шагом. А это важный фактор для безопасности и доверия к системе.
Модель позиционируется как модель-учитель, которая может быть использована для обучения более компактных моделей или для авто-разметки данных.
На практике, NVIDIA предлагает применять эти инструменты в своих решениях NVIDIA Cosmos и NVIDIA Omniverse.
В них можно дообучать модели на своих данных, валидировать их в симуляции и затем деплоить на железо.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍2🔥2
🎄🖥️ ClaudeBar: AI Quota Tracker for macOS
ClaudeBar — это приложение для меню macOS, которое отслеживает использование AI-кодов, таких как Claude, Codex, Gemini и GitHub Copilot. Оно предоставляет визуальные индикаторы статуса и уведомления о состоянии квот в реальном времени.
🚀Основные моменты:
- Поддержка нескольких провайдеров AI
- Темы светлого и темного режимов
- Автоматическое обновление квот
- Сезонные темы, включая рождественскую анимацию
- Уведомления о статусе квот
📌 GitHub: https://github.com/tddworks/ClaudeBar
#swift
ClaudeBar — это приложение для меню macOS, которое отслеживает использование AI-кодов, таких как Claude, Codex, Gemini и GitHub Copilot. Оно предоставляет визуальные индикаторы статуса и уведомления о состоянии квот в реальном времени.
🚀Основные моменты:
- Поддержка нескольких провайдеров AI
- Темы светлого и темного режимов
- Автоматическое обновление квот
- Сезонные темы, включая рождественскую анимацию
- Уведомления о статусе квот
📌 GitHub: https://github.com/tddworks/ClaudeBar
#swift
GitHub
GitHub - tddworks/ClaudeBar: A macOS menu bar application that monitors AI coding assistant usage quotas. Keep track of your Claude…
A macOS menu bar application that monitors AI coding assistant usage quotas. Keep track of your Claude, Codex, Antigravity ,and Gemini usage at a glance. - tddworks/ClaudeBar
👍2❤1
🔒 Защита данных и безопасность в AI
DataShield Lightweight Labs — это открытая инициатива, направленная на создание инструментов и фреймворков для повышения конфиденциальности данных, безопасности и надежности AI-систем. Проект предлагает доступные решения для разработчиков, чтобы помочь организациям внедрять лучшие практики в области безопасности и защиты данных.
🚀Основные моменты:
- Инструменты для предотвращения утечек личной информации в LLM
- Открытые сканеры безопасности и обнаружение ошибок конфигурации
- Утилиты для соблюдения GDPR и других норм
- Разработка инструментов для безопасных AI-работflows
- Приветствуются вклады и идеи от сообщества
📌 GitHub: https://github.com/liuxiaomingskm/datashield-lightweight-labs
DataShield Lightweight Labs — это открытая инициатива, направленная на создание инструментов и фреймворков для повышения конфиденциальности данных, безопасности и надежности AI-систем. Проект предлагает доступные решения для разработчиков, чтобы помочь организациям внедрять лучшие практики в области безопасности и защиты данных.
🚀Основные моменты:
- Инструменты для предотвращения утечек личной информации в LLM
- Открытые сканеры безопасности и обнаружение ошибок конфигурации
- Утилиты для соблюдения GDPR и других норм
- Разработка инструментов для безопасных AI-работflows
- Приветствуются вклады и идеи от сообщества
📌 GitHub: https://github.com/liuxiaomingskm/datashield-lightweight-labs
❤3👍1🔥1
Новый open-source “мозг” для роботов - и он уже №1 в мире 🤖🔥
Spirit AI представили Spirit v1.5 - свежую vision-language-action модель, которая превращает то, что робот видит, в точные физические действия.
По сути:
📷 видение + 💬 понимание + 🦾 управление = один мозг.
Что самое громкое:
Spirit v1.5 заняла #1 место на бенчмарке RoboChallenge Table30,
обогнав прошлого лидера Pi0.5 по:
- роботизированному reasoning
- контролю движений
- качеству выполнения задач в физическом мире
Это уже не “чатботы для текста”.
Это LLM-подход, который реально начинает управлять реальностью.
Ссылки:
Code: https://github.com/Spirit-AI-Team/spirit-v1.5
Model: https://huggingface.co/Spirit-AI-robotics/Spirit-v1.5
Blog: https://spirit-ai.com/en/blog/spirit-v1-5
Report: https://mp.weixin.qq.com/s/ZrBDFuugPyuoQp4S6wEBWQ
Если open-source роботы начнут массово получать такие мозги - то 2026 может стать годом, когда роботы “проснутся”.
Spirit AI представили Spirit v1.5 - свежую vision-language-action модель, которая превращает то, что робот видит, в точные физические действия.
По сути:
📷 видение + 💬 понимание + 🦾 управление = один мозг.
Что самое громкое:
Spirit v1.5 заняла #1 место на бенчмарке RoboChallenge Table30,
обогнав прошлого лидера Pi0.5 по:
- роботизированному reasoning
- контролю движений
- качеству выполнения задач в физическом мире
Это уже не “чатботы для текста”.
Это LLM-подход, который реально начинает управлять реальностью.
Ссылки:
Code: https://github.com/Spirit-AI-Team/spirit-v1.5
Model: https://huggingface.co/Spirit-AI-robotics/Spirit-v1.5
Blog: https://spirit-ai.com/en/blog/spirit-v1-5
Report: https://mp.weixin.qq.com/s/ZrBDFuugPyuoQp4S6wEBWQ
Если open-source роботы начнут массово получать такие мозги - то 2026 может стать годом, когда роботы “проснутся”.
👍5🔥2❤1