ARC-AGI-2 — новый тест на AGI, который бросает вызов системам рассуждений ИИ
Исследовалтели выпустили ARC-AGI-2 новый набор задач, которые тестируют способность ИИ к абстрактному мышлению.
ARC-AGI-2 в отличие от многих других бенчмарков, которые часто становятся "насыщенными" из-за специализированной оптимизации моделей, ARC фокусируется именно на фундаментальной способности к рассуждению.
Отличие от предыдущей версии ARC-AGI-1 - новые задачи невозможно решить простым перебором вариантов.
Доступны обычным людям, недоступны ведущим ИИ.
Примечательно, что тестирование проводилось не на PhD в области математики или физики, а на обычных людях: водителях Uber, студентах, безработных и других, кто искал дополнительный заработок.
А теперь самое интересное-результаты ведущих ИИ-систем на этом наборе задач:
1. Базовые LLM (GPT-4.5, Claude 3.7 Sonnet, Gemini 2): 0%
2. Модели с одиночным CoT-рассуждением (Claude Thinking, R1, o3-mini): 0-1%
3. Лучшие специализированные модели: 3-4%
Параллельно с выпуском ARC-AGI-2 запускается соревнование ARC Prize 2025 с главным призом $700,000 за достижение результата 85%, а также другими призами за промежуточные достижения.
Соревнование будет проходить на платформе Kaggle.
Участвовать могут модели, использующие менее $10,000 вычислительных ресурсов для решения 120 задач из полуприватного набора тестов.
Исследовалтели выпустили ARC-AGI-2 новый набор задач, которые тестируют способность ИИ к абстрактному мышлению.
ARC-AGI-2 в отличие от многих других бенчмарков, которые часто становятся "насыщенными" из-за специализированной оптимизации моделей, ARC фокусируется именно на фундаментальной способности к рассуждению.
Отличие от предыдущей версии ARC-AGI-1 - новые задачи невозможно решить простым перебором вариантов.
Доступны обычным людям, недоступны ведущим ИИ.
Примечательно, что тестирование проводилось не на PhD в области математики или физики, а на обычных людях: водителях Uber, студентах, безработных и других, кто искал дополнительный заработок.
А теперь самое интересное-результаты ведущих ИИ-систем на этом наборе задач:
1. Базовые LLM (GPT-4.5, Claude 3.7 Sonnet, Gemini 2): 0%
2. Модели с одиночным CoT-рассуждением (Claude Thinking, R1, o3-mini): 0-1%
3. Лучшие специализированные модели: 3-4%
Параллельно с выпуском ARC-AGI-2 запускается соревнование ARC Prize 2025 с главным призом $700,000 за достижение результата 85%, а также другими призами за промежуточные достижения.
Соревнование будет проходить на платформе Kaggle.
Участвовать могут модели, использующие менее $10,000 вычислительных ресурсов для решения 120 задач из полуприватного набора тестов.
ARC Prize
Announcing ARC-AGI-2 and ARC Prize 2025
Measuring the next level of intelligence with ARC-AGI-2 and ARC Prize 2025
👍17❤4🤣4🔥3
Ключевой игрок в РФ по биометрии NtechLab переходит от распознавания лиц к умному управлению регионами
NtechLab переживает интересную трансформацию, если раньше компания была известна технологией распознавания лиц, то сейчас она развивает новые направления и становится сильным и заметным игроком на российском рынке интеллектуальных систем.
СЕО компании Алексей Паламарчук говорит, что NtechLab версии 2022 года и 2025-го - совершенно разные компании с другими людьми и по составу бенефициаров, и по бизнес-процессам, рынкам, продуктам, клиентам и даже команде. Компания трансформировалась в 2022–2023 годах.
Показательны цифры: выручка в 2024 году выросла почти вдвое до ₽1,7 млрд, а количество контрактов увеличилось в 2,5 раза. NtechLab уже работает в 70 субъектах РФ, предлагая решения от безопасности до управления городской средой.
Наиболее интересный тренд — переход от простой идентификации лиц к комплексной аналитике поведения и среды. Платформа Ntech City анализирует более 30 направлений городского хозяйства: от контроля вывоза мусора до планирования общественных пространств.
Паламарчук говорит, что у них есть ИИ-система, которая автоматически реагирует на нарушения в общественных местах. Вместо охранников, которым сложно уследить за всеми нарушителями, ИИ делает замечания голосом, который может быть настроен под определенный тембр.
Также NtecLab вышел в медтех-сегмент с системой анализа КТ-снимков и транспортное направление — контроль состояния водителей для российского электромобиля "Атом".
Готовится к запуску линейка коробочных решений - ПАКов с видеоаналитиков - для
промышленных предприятий, общественных территорий, ГИБДД.
Паламарчук говорит, что они смогли сохранить международное присутствие, несмотря на санкции. Около 20-25% выручки компании
(~ ₽420 млн) приходится на зарубежные проекты в странах БРИКС, Латинской Америке и на Ближнем Востоке, с перспективой роста до 30-35% в 2025 году.
NtechLab переживает интересную трансформацию, если раньше компания была известна технологией распознавания лиц, то сейчас она развивает новые направления и становится сильным и заметным игроком на российском рынке интеллектуальных систем.
СЕО компании Алексей Паламарчук говорит, что NtechLab версии 2022 года и 2025-го - совершенно разные компании с другими людьми и по составу бенефициаров, и по бизнес-процессам, рынкам, продуктам, клиентам и даже команде. Компания трансформировалась в 2022–2023 годах.
Показательны цифры: выручка в 2024 году выросла почти вдвое до ₽1,7 млрд, а количество контрактов увеличилось в 2,5 раза. NtechLab уже работает в 70 субъектах РФ, предлагая решения от безопасности до управления городской средой.
Наиболее интересный тренд — переход от простой идентификации лиц к комплексной аналитике поведения и среды. Платформа Ntech City анализирует более 30 направлений городского хозяйства: от контроля вывоза мусора до планирования общественных пространств.
Паламарчук говорит, что у них есть ИИ-система, которая автоматически реагирует на нарушения в общественных местах. Вместо охранников, которым сложно уследить за всеми нарушителями, ИИ делает замечания голосом, который может быть настроен под определенный тембр.
Также NtecLab вышел в медтех-сегмент с системой анализа КТ-снимков и транспортное направление — контроль состояния водителей для российского электромобиля "Атом".
Готовится к запуску линейка коробочных решений - ПАКов с видеоаналитиков - для
промышленных предприятий, общественных территорий, ГИБДД.
Паламарчук говорит, что они смогли сохранить международное присутствие, несмотря на санкции. Около 20-25% выручки компании
(~ ₽420 млн) приходится на зарубежные проекты в странах БРИКС, Латинской Америке и на Ближнем Востоке, с перспективой роста до 30-35% в 2025 году.
РБК
Глава NtechLab — РБК: «В биометрии нет ничего, чего не видят ваши соседи»
Биометрия работает не как в американских фильмах, а распознавание лиц не дает возможности вычислить потенциальных убийц, объясняет глава NtechLab Алексей Паламарчук. Но видеоаналитика уже позволяет
10👍16❤7😱5🔥2🤣1🤨1🍓1
Согласно свежим данным,2/3 TradFi больше всего интересуется стейблкоинами, токенизированными активами и децентрализованными биржами
Об этом говорится в исследовании фонда Paradigm.
Основные выводы отчета:
Более 2/3 (примерно 66%) традиционных финансовых компаний(TradFi) уже активно изучают/взаимодействуют с defi.
Представители TradFi считают, что в долгосрочной перспективе (15+ лет) defi станет критически важной частью большинства основных финансовых бизнесов.
Они отвергают идею, что частные блокчейны имеют такую же ценность, как публичные, открытые блокчейны. Публичные блокчейны обеспечивают большую прозрачность, нейтральность и создают сетевые эффекты.
Приоритетные направления: стейблкоины, токенизация активов и децентрализованные биржи (DEX). Активно развивается токенизация US-казначейских облигаций и других ценных бумаг.
Главное препятствие- неопределенность в регулировании.
Об этом говорится в исследовании фонда Paradigm.
Основные выводы отчета:
Более 2/3 (примерно 66%) традиционных финансовых компаний(TradFi) уже активно изучают/взаимодействуют с defi.
Представители TradFi считают, что в долгосрочной перспективе (15+ лет) defi станет критически важной частью большинства основных финансовых бизнесов.
Они отвергают идею, что частные блокчейны имеют такую же ценность, как публичные, открытые блокчейны. Публичные блокчейны обеспечивают большую прозрачность, нейтральность и создают сетевые эффекты.
Приоритетные направления: стейблкоины, токенизация активов и децентрализованные биржи (DEX). Активно развивается токенизация US-казначейских облигаций и других ценных бумаг.
Главное препятствие- неопределенность в регулировании.
👍9❤3🔥2
Все о блокчейн/мозге/space/WEB 3.0 в России и мире
Figure объявила о запуске крупнейшей в мире компании по производству человекоподобных роботов - BotQ Уже в этом году они планируют выпустить 12 000 роботов в год — начальная производственная мощность, а 100 000 роботов — плановый объем через 4 года. У компании:…
⚡️У роботов теперь походка как у людей - Figure сделали прорыв в робототехнике
Компания представила настоящий прорыв в области гуманоидной робототехники — их роботы теперь ходят с естественной человеческой походкой благодаря подходу к обучению с подкреплением (RL).
Симуляция является ключевой и, пожалуй, самой революционной частью прорыва Figure в создании естественной походки гуманоидных роботов.
Ключевые достижения:
• Естественность движений — у роботов плавные, человекоподобные движения с естественной походкой, включая правильное перекатывание стопы и синхронизированные движения рук.
• Сверхэффективное обучение — годы реальных данных моделируются всего за несколько часов в высокоточном физическом симуляторе.
• Прямой перенос в реальность — технология "zero-shot transfer" позволяет применять навыки из симуляции на реальных роботах без дополнительной настройки.
Исторически это было серьезной проблемой в робототехнике: модели, отлично работающие в симуляции, часто терпели неудачу на реальном оборудовании из-за "разрыва между симуляцией и реальностью".
• Масштабируемость — одна нейронная сеть успешно работает на всем парке роботов Figure 02 без индивидуальной настройки.
У нас была серия постов про симуляции и робототехника, вот тут можно ознакомится или освежить память:
- 3D-двойник Токио для обучения роботов.
- Project Sid: масштабная симуляция ИИ-агентов.
- Figure с самым продвинутым гуманоидом F.02.
- Китай запустил массовое производство роботов.
- Xiaomi открыл завод, на котором не работают люди.
Компания представила настоящий прорыв в области гуманоидной робототехники — их роботы теперь ходят с естественной человеческой походкой благодаря подходу к обучению с подкреплением (RL).
Симуляция является ключевой и, пожалуй, самой революционной частью прорыва Figure в создании естественной походки гуманоидных роботов.
Ключевые достижения:
• Естественность движений — у роботов плавные, человекоподобные движения с естественной походкой, включая правильное перекатывание стопы и синхронизированные движения рук.
• Сверхэффективное обучение — годы реальных данных моделируются всего за несколько часов в высокоточном физическом симуляторе.
• Прямой перенос в реальность — технология "zero-shot transfer" позволяет применять навыки из симуляции на реальных роботах без дополнительной настройки.
Исторически это было серьезной проблемой в робототехнике: модели, отлично работающие в симуляции, часто терпели неудачу на реальном оборудовании из-за "разрыва между симуляцией и реальностью".
• Масштабируемость — одна нейронная сеть успешно работает на всем парке роботов Figure 02 без индивидуальной настройки.
У нас была серия постов про симуляции и робототехника, вот тут можно ознакомится или освежить память:
- 3D-двойник Токио для обучения роботов.
- Project Sid: масштабная симуляция ИИ-агентов.
- Figure с самым продвинутым гуманоидом F.02.
- Китай запустил массовое производство роботов.
- Xiaomi открыл завод, на котором не работают люди.
FigureAI
Natural Humanoid Walk Using Reinforcement Learning
🔥12👍5❤3
Поразительно! Google выпускает свою лучшую ИИ-модель на сегодня, но на тестах у нее результаты хуже, чем у Claude 3.7.
Anthropic - мощь.
Результаты бенчмарков на
математическом тесте AIME 2025 показали следующие результаты:
1. Gemini 2.5 Pro Exp: 86.7%
2. OpenAI o3-mini: 86.5%
3. Claude 3.7 Sonnet: 93.3%
4. Grok 3 Beta: 77.3%
5. DeepSeek R1: 70%
Но Google мудры, они владеют 14% в Anthropic, в общей сложности Google вложила в стартап $3 млрд, но планирует «вливать» ещё больше средств: в сентябре 2025-го она выделит ещё $750 млн в виде конвертируемого займа.
Anthropic - мощь.
Результаты бенчмарков на
математическом тесте AIME 2025 показали следующие результаты:
1. Gemini 2.5 Pro Exp: 86.7%
2. OpenAI o3-mini: 86.5%
3. Claude 3.7 Sonnet: 93.3%
4. Grok 3 Beta: 77.3%
5. DeepSeek R1: 70%
Но Google мудры, они владеют 14% в Anthropic, в общей сложности Google вложила в стартап $3 млрд, но планирует «вливать» ещё больше средств: в сентябре 2025-го она выделит ещё $750 млн в виде конвертируемого займа.
Google
Gemini 2.5: Our most intelligent AI model
Gemini 2.5 is our most intelligent AI model, now with thinking.
❤5👍2🔥2🥴2👎1
Anthropic говорят, что ИИ-модели последнего поколения могут саботировать
Исследователи изучили 2 формы саботажа:
1. Саботаж экспериментов — намеренное снижение эффективности при решении ML-задач
2. Манипулирование исследовательскими решениями — искажение аргументации в пользу определенных решений
По итогам результатов Claude 3.7 Sonnet способен эффективно занижать свою производительность без подсказок, а Claude 3.5 Sonnet делает это при наличии одного примера. При этом саботаж остается незамеченным системами мониторинга.
Стратегии саботажа:
- Использование неоптимальных гиперпараметров
- Выбор примитивных моделей
-Сокращение объема тренировочных данных
- Имитация поведения более слабых моделей
Особенно опасна стратегия "переключения поколений", когда модель использует устаревшие возможности только для задач, связанных с безопасностью ИИ и сложных для контроля.
Исследователи считают, что современные модели еще не могут полностью скрыть саботаж от внимательных людей. Но тренд очевиден — с каждым поколением способность к скрытому саботажу растет.
Это говорит о необходимости опережающей разработки надежных методов мониторинга и защиты, особенно при делегировании критически важных исследований по безопасности ИИ самим системам ИИ.
Исследователи изучили 2 формы саботажа:
1. Саботаж экспериментов — намеренное снижение эффективности при решении ML-задач
2. Манипулирование исследовательскими решениями — искажение аргументации в пользу определенных решений
По итогам результатов Claude 3.7 Sonnet способен эффективно занижать свою производительность без подсказок, а Claude 3.5 Sonnet делает это при наличии одного примера. При этом саботаж остается незамеченным системами мониторинга.
Стратегии саботажа:
- Использование неоптимальных гиперпараметров
- Выбор примитивных моделей
-Сокращение объема тренировочных данных
- Имитация поведения более слабых моделей
Особенно опасна стратегия "переключения поколений", когда модель использует устаревшие возможности только для задач, связанных с безопасностью ИИ и сложных для контроля.
Исследователи считают, что современные модели еще не могут полностью скрыть саботаж от внимательных людей. Но тренд очевиден — с каждым поколением способность к скрытому саботажу растет.
Это говорит о необходимости опережающей разработки надежных методов мониторинга и защиты, особенно при делегировании критически важных исследований по безопасности ИИ самим системам ИИ.
1👍19❤4🔥3🤣2🤔1🤯1
Одна из крупных компаний в мире по управлению активами создает стейблкоин
Fidelity Investments, одна из крупнейших в мире компаний по управлению активами ($5,9 трлн в управлении) находится на продвинутой стадии разработки собственного стейблкоина.
Fidelity планирует использовать свой стейблкоин как аналог наличных в криптовалютных и блокчейн-операциях.
Основная идея заключается в том, чтобы этот токен обеспечивал стабильность стоимости, привязанной к $, что делает его удобным инструментом для транзакций, расчетов и хранения капитала в экосистеме цифровых активов.
В частности, стейблкоин должен сыграть ключевую роль в блокчейн-фонде компании, выступая в качестве ликвидного актива, который может заменить традиционные денежные средства в токенизированных финансовых продуктах.
Fidelity Investments, одна из крупнейших в мире компаний по управлению активами ($5,9 трлн в управлении) находится на продвинутой стадии разработки собственного стейблкоина.
Fidelity планирует использовать свой стейблкоин как аналог наличных в криптовалютных и блокчейн-операциях.
Основная идея заключается в том, чтобы этот токен обеспечивал стабильность стоимости, привязанной к $, что делает его удобным инструментом для транзакций, расчетов и хранения капитала в экосистеме цифровых активов.
В частности, стейблкоин должен сыграть ключевую роль в блокчейн-фонде компании, выступая в качестве ликвидного актива, который может заменить традиционные денежные средства в токенизированных финансовых продуктах.
👍10
Databricks меняет правила, теперь можно улучшить LLM без размеченных данных
Команда Mosaic Research, которая входит в Databricks представила TAO — это новый подход к улучшению производительности LLM для конкретных задач, который:
1. Не требует размеченных данных.
2. Использует вычисления во время тестирования в процессе настройки модели.
3. Создаёт быструю, экономичную и высококачественную LLM.
Главное преимущество — возможность создать цикл улучшения ИИ-приложений, чем больше пользователи взаимодействуют с приложением, тем больше собирается данных для TAO, и тем лучше становится модель.
TAO объединяет 2 подхода:
- Вычисления во время тестирования (как в o1 и R1)
- Обучение с подкреплением
TAO полезен компаниям, которые:
1. Имеют мало или совсем не имеют размеченных данных для традиционного файн-тюнинга.
2. Хотят улучшить качество работы моделей в конкретных бизнес-задачах.
3. Стремятся снизить затраты на инференс, используя менее дорогие открытые модели.
По данным исследователей:
- TAO превосходит традиционный файн-тюнинг на тысячах размеченных примеров.
- Недорогие модели с открытым исходным кодом (Llama 8B и 70B) достигают качества дорогих проприетарных моделей (GPT-4o и o3-mini).
- Увеличение вычислительного бюджета во время настройки повышает качество модели при сохранении той же стоимости инференса.
Команда Mosaic Research, которая входит в Databricks представила TAO — это новый подход к улучшению производительности LLM для конкретных задач, который:
1. Не требует размеченных данных.
2. Использует вычисления во время тестирования в процессе настройки модели.
3. Создаёт быструю, экономичную и высококачественную LLM.
Главное преимущество — возможность создать цикл улучшения ИИ-приложений, чем больше пользователи взаимодействуют с приложением, тем больше собирается данных для TAO, и тем лучше становится модель.
TAO объединяет 2 подхода:
- Вычисления во время тестирования (как в o1 и R1)
- Обучение с подкреплением
TAO полезен компаниям, которые:
1. Имеют мало или совсем не имеют размеченных данных для традиционного файн-тюнинга.
2. Хотят улучшить качество работы моделей в конкретных бизнес-задачах.
3. Стремятся снизить затраты на инференс, используя менее дорогие открытые модели.
По данным исследователей:
- TAO превосходит традиционный файн-тюнинг на тысячах размеченных примеров.
- Недорогие модели с открытым исходным кодом (Llama 8B и 70B) достигают качества дорогих проприетарных моделей (GPT-4o и o3-mini).
- Увеличение вычислительного бюджета во время настройки повышает качество модели при сохранении той же стоимости инференса.
Databricks
TAO: Using test-time compute to train efficient LLMs without labeled data | Databricks Blog
LIFT fine-tunes LLMs without labels using reinforcement learning, boosting performance on enterprise tasks.
🔥14👍10❤2
Ключевое по ИИ-агентам за последние 7 дней
1. AgentRxiv - автономная научная экосистема - платформа, где исследовательские ИИ-агенты могут делиться результатами, находить релевантную информацию и строить новые исследования на основе работ друг друга.
2. Агентные архитектуры для приложений с интенсивным поиском информации.
3. Разбор статические ИИ vs динамические агенты
4. VAGEN -визуальные агенты нового поколения -1-й открытый фреймворк для обучения визуальных агентов с использованием многоэтапного обучения с подкреплением.
5. Проблема оценки ИИ-агентов. Новое исследование представляет 1-й комплексный обзор методов оценки ИИ-агентов
6 Reality Bench — новый метод оценки ИИ экспертного уровня. Эта система напрямую проверяет способность ИИ рассуждать на основе знаний и прогнозировать будущее, предлагая ему ответить на сложные финансовые и экономические вопросы.
1. AgentRxiv - автономная научная экосистема - платформа, где исследовательские ИИ-агенты могут делиться результатами, находить релевантную информацию и строить новые исследования на основе работ друг друга.
2. Агентные архитектуры для приложений с интенсивным поиском информации.
3. Разбор статические ИИ vs динамические агенты
4. VAGEN -визуальные агенты нового поколения -1-й открытый фреймворк для обучения визуальных агентов с использованием многоэтапного обучения с подкреплением.
5. Проблема оценки ИИ-агентов. Новое исследование представляет 1-й комплексный обзор методов оценки ИИ-агентов
6 Reality Bench — новый метод оценки ИИ экспертного уровня. Эта система напрямую проверяет способность ИИ рассуждать на основе знаний и прогнозировать будущее, предлагая ему ответить на сложные финансовые и экономические вопросы.
🔥7👍5❤2
Китай построил сотни ЦОД для ИИ,а теперь они простаивают из-за низкого спроса
Страна вложила миллиарды $ в инфраструктуру ИИ, произошла настоящая "золотая лихорадка" в поднебесной по строительству ЦОДов для ИИ, которая сейчас начинает разваливаться.
Проекты часто полагались на посредников, которые преувеличивали прогнозы спроса или манипулировали процессами закупок для получения государственных субсидий.
К концу 2024 года энтузиазм вокруг бума ЦОДов погас. Причина проста - аренда GPU больше не является особенно прибыльным бизнесом.
Появление DeepSeek с его моделью R1 стало переломным моментом для китайской ИИ-индустрии.
Вопрос сместился с 'Кто может создать лучшую языковую модель?' на 'Кто может лучше использовать их?'.
Новые модели рассуждения изменили требования к ЦОД - теперь важнее низкая задержка и близость к технологическим центрам, а не просто вычислительная мощность.
Из-за этого многие дата-центры, построенные в центральных, западных и сельских районах Китая (где электричество и земля дешевле), теряют привлекательность для ИИ-компаний.
Страна вложила миллиарды $ в инфраструктуру ИИ, произошла настоящая "золотая лихорадка" в поднебесной по строительству ЦОДов для ИИ, которая сейчас начинает разваливаться.
Проекты часто полагались на посредников, которые преувеличивали прогнозы спроса или манипулировали процессами закупок для получения государственных субсидий.
К концу 2024 года энтузиазм вокруг бума ЦОДов погас. Причина проста - аренда GPU больше не является особенно прибыльным бизнесом.
Появление DeepSeek с его моделью R1 стало переломным моментом для китайской ИИ-индустрии.
Вопрос сместился с 'Кто может создать лучшую языковую модель?' на 'Кто может лучше использовать их?'.
Новые модели рассуждения изменили требования к ЦОД - теперь важнее низкая задержка и близость к технологическим центрам, а не просто вычислительная мощность.
Из-за этого многие дата-центры, построенные в центральных, западных и сельских районах Китая (где электричество и земля дешевле), теряют привлекательность для ИИ-компаний.
MIT Technology Review
China built hundreds of AI data centers to catch the AI boom. Now many stand unused.
The country poured billions into AI infrastructure, but the data center gold rush is unraveling as speculative investments collide with weak demand and DeepSeek shifts AI trends.
👍10❤4🔥2😁2🤔1
Alibaba выпустили ИИ-модель+ИИ-агента для живых звонков с голосом и видео https://tttttt.me/alwebbci/3138
Alibaba представила Qwen2.5-Omni — 1-ю универсальную модель с поддержкой настоящих голосовых и видеозвонков в реальном времени.
Qwen2.5-Omni-7B выпущена с открытым исходным кодом под лицензией Apache 2.0.
Она способна обрабатывать различные типы данных (текст, изображения, аудио, видео).
А также ИИ-агента на основе этой модели, которая реализована в Qwen Chat, который может вести диалог с пользователем через голосовые и видеочаты в режиме реального времени.
Qwen2.5-Omni - комплексное решение, где модель обеспечивает необходимые возможности, а агент предоставляет интерфейс для использования этих возможностей.
Alibaba представила Qwen2.5-Omni — 1-ю универсальную модель с поддержкой настоящих голосовых и видеозвонков в реальном времени.
Qwen2.5-Omni-7B выпущена с открытым исходным кодом под лицензией Apache 2.0.
Она способна обрабатывать различные типы данных (текст, изображения, аудио, видео).
А также ИИ-агента на основе этой модели, которая реализована в Qwen Chat, который может вести диалог с пользователем через голосовые и видеочаты в режиме реального времени.
Qwen2.5-Omni - комплексное решение, где модель обеспечивает необходимые возможности, а агент предоставляет интерфейс для использования этих возможностей.
Telegram
All about AI, Web 3.0, BCI
Alibaba introduced Qwen2.5-Omni Launches Real-Time Voice and Video Chat
Revolutionary "Thinker-Talker" Architecture:
Thinker — functions as a brain, processing incoming information from text, audio, images, and video
Talker — works as a mouth, transforming…
Revolutionary "Thinker-Talker" Architecture:
Thinker — functions as a brain, processing incoming information from text, audio, images, and video
Talker — works as a mouth, transforming…
❤9🔥6👍4
Яндекс и Сбер создают единый стандарт ПО для роботизации промышленности
Минпромторг об этом попросил компании.
Сегодня в российской промышленности нет единого стандарта ПО, из-за чего роботы разных производителей плохо совместимы друг с другом. Это затрудняет автоматизацию производства и массовую роботизацию в стране.
Минпромторг хочет разделить роли в этой экосистеме:
- производители роботов должны сосредоточиться на разработке железа,
- а создание универсального ПО возьмут на себя Яндекс и Сбер.
Первые результаты этой работы планируется представить уже к лету 2025 года.
Напомним, что объем выручки рынка сервисной робототехники в 2024 году составил ₽32,1млрд.
Анализ данных Росстата за 2023 год показывает большие региональные диспропорции в эффективности промышленной роботизации в России.
Минпромторг об этом попросил компании.
Сегодня в российской промышленности нет единого стандарта ПО, из-за чего роботы разных производителей плохо совместимы друг с другом. Это затрудняет автоматизацию производства и массовую роботизацию в стране.
Минпромторг хочет разделить роли в этой экосистеме:
- производители роботов должны сосредоточиться на разработке железа,
- а создание универсального ПО возьмут на себя Яндекс и Сбер.
Первые результаты этой работы планируется представить уже к лету 2025 года.
Напомним, что объем выручки рынка сервисной робототехники в 2024 году составил ₽32,1млрд.
Анализ данных Росстата за 2023 год показывает большие региональные диспропорции в эффективности промышленной роботизации в России.
Ведомости
Минпромторг предложил «Яндексу» и «Сберу» поработать над софтом для роботов
Этот унифицированный стандарт ПО должен стать базой для массовой роботизации России
1👍15🤣8🔥3❤2
Теперь идеи - это самое дорогое, а исполнение стоит дешево. Творчество масштабируется вместе с вычислительной мощностью
Десятилетиями нам говорили обратное. У всех были идеи. Немногие могли хорошо их реализовать. Но ИИ всё полностью перевернуло с ног на голову.
С выходом обновления ChatGPT с улучшенной генерацией изображений на базе GPT-4o, теперь любой может исполнить свои креативные идеи.
Главное - применить правильный промпт, ограничивающим фактором становится качество ваших идей.
Скоро Голливуд будет планировать бюджет не на часы ручного труда, а на часы работы серверов, запускающих и перезапускающих инференс.
Художники создают "сырое искусство" в промптах (эскизы, цветовую палитру, элементы стиля) и позволяют машинам интерполировать остальное.
Самые успешные компании переносят ресурсы с производства на генерацию идей.
Это меняет всё:
Реклама трансформируется. Большая часть рабочего процесса генерации рекламных блоков теперь может быть автоматизирована, от идеи до финальных макетов.
Презентации богатеют визуально.
Книги становятся визуальными. Представьте, как кто-то берёт книгу и превращает её в комикс с помощью ChatGPT. Старые книги могут обрести новую жизнь.
Веб-сайты переходят от шаблонов к уникальности.
Мы движемся к раздвоенному творческому миру:
1. автоматизированная красота для большинства целей
2. человеческое творчество, сосредоточенное на создании неожиданного, идей и подходов, о которых ИИ не подумал бы.
Новая креативная экономика.
Это создаёт странную новую динамику в найме. Очевидно, что высшие технические навыки всё ещё имеют значение, но гораздо меньше.
Что происходит с пользовательскими интерфейсами?
Как только эта технология станет с открытым исходным кодом и достаточно дешевой, рядом с каждой кнопкой загрузки изображения появится кнопка генерации. Генерации появится с доступными изображениями в поиске. Визуальные стили станут так же легко копируемы, как и текст.
Настоящее преимущество заключается в знании, когда нарушать правила хорошего дизайна так, чтобы это эмоционально резонировало.
Вызов для большинства из нас теперь не "как мы реализуем эту идею?", а "какие идеи действительно стоит реализовывать?"
Десятилетиями нам говорили обратное. У всех были идеи. Немногие могли хорошо их реализовать. Но ИИ всё полностью перевернуло с ног на голову.
С выходом обновления ChatGPT с улучшенной генерацией изображений на базе GPT-4o, теперь любой может исполнить свои креативные идеи.
Главное - применить правильный промпт, ограничивающим фактором становится качество ваших идей.
Скоро Голливуд будет планировать бюджет не на часы ручного труда, а на часы работы серверов, запускающих и перезапускающих инференс.
Художники создают "сырое искусство" в промптах (эскизы, цветовую палитру, элементы стиля) и позволяют машинам интерполировать остальное.
Самые успешные компании переносят ресурсы с производства на генерацию идей.
Это меняет всё:
Реклама трансформируется. Большая часть рабочего процесса генерации рекламных блоков теперь может быть автоматизирована, от идеи до финальных макетов.
Презентации богатеют визуально.
Книги становятся визуальными. Представьте, как кто-то берёт книгу и превращает её в комикс с помощью ChatGPT. Старые книги могут обрести новую жизнь.
Веб-сайты переходят от шаблонов к уникальности.
Мы движемся к раздвоенному творческому миру:
1. автоматизированная красота для большинства целей
2. человеческое творчество, сосредоточенное на создании неожиданного, идей и подходов, о которых ИИ не подумал бы.
Новая креативная экономика.
Это создаёт странную новую динамику в найме. Очевидно, что высшие технические навыки всё ещё имеют значение, но гораздо меньше.
Что происходит с пользовательскими интерфейсами?
Как только эта технология станет с открытым исходным кодом и достаточно дешевой, рядом с каждой кнопкой загрузки изображения появится кнопка генерации. Генерации появится с доступными изображениями в поиске. Визуальные стили станут так же легко копируемы, как и текст.
Настоящее преимущество заключается в знании, когда нарушать правила хорошего дизайна так, чтобы это эмоционально резонировало.
Вызов для большинства из нас теперь не "как мы реализуем эту идею?", а "какие идеи действительно стоит реализовывать?"
👍24🔥14🤣6❤5🤔4💯2
Google представили серию открытых ИИ-моделей для создания лекарств
TxGemma — это набор LLM-моделей на базе Gemma, оптимизированных для работы с терапевтическими данными.
Система может обрабатывать информацию о:
- Малых молекулах
- Нуклеиновых кислотах
- Белках
- Заболеваниях и клеточных линиях
Основные компоненты системы:
TxGemma-Predict
Модель превосходит современные модели в 45 из 66 терапевтических задач. Опережает специализированные модели в 26 из 50 задач.
TxGemma-Chat - интерактивная модель с возможностями:
общения на естественном языке,
объяснения предсказаний на основе молекулярной структуры,
научных дискуссий и расширенного анализа.
Agentic-Tx - агентная система на базе Gemini 2.0, которая:
- Интегрирует модели TxGemma как инструменты
- Показывает лучшие результаты на бенчмарках по химии и биологии
- Использует мультимодальный подход к анализу данных
TxGemma — это набор LLM-моделей на базе Gemma, оптимизированных для работы с терапевтическими данными.
Система может обрабатывать информацию о:
- Малых молекулах
- Нуклеиновых кислотах
- Белках
- Заболеваниях и клеточных линиях
Основные компоненты системы:
TxGemma-Predict
Модель превосходит современные модели в 45 из 66 терапевтических задач. Опережает специализированные модели в 26 из 50 задач.
TxGemma-Chat - интерактивная модель с возможностями:
общения на естественном языке,
объяснения предсказаний на основе молекулярной структуры,
научных дискуссий и расширенного анализа.
Agentic-Tx - агентная система на базе Gemini 2.0, которая:
- Интегрирует модели TxGemma как инструменты
- Показывает лучшие результаты на бенчмарках по химии и биологии
- Использует мультимодальный подход к анализу данных
👍10🔥3❤2
⚡️Мировой биржевой гигант ICE интегрирует стейблкоин USDC в продукты и инфраструктуру ICE
Глобальный биржевой гигант Intercontinental Exchange, владелец NYSE, и Circle, эмитент USDC, объявили об этом.
Цель — интегрировать стейблкоин USDC и токенизированный фонд USYC в продукты и инфраструктуру ICE.
Это явный сигнал того, что стейблкоины, как класс цифровых активов, все глубже проникают в традиционный финансовый сектор.
Стейблкоины становятся мостом между криптой и классическими рынками и перестают быть инструментом криптоэнтузиастов и начинают рассматриваться как часть глобальной финансовой системы.
Интерес к USYC, токенизированному фонду денежного рынка, указывает на более широкий тренд — токенизацию традиционных финансовых инструментов. Это шаг к тому, чтобы в будущем акции, облигации или другие активы также начали активно токенизироваться и торговаться с использованием блокчейн-технологий.
Границы между блокчейном и Уолл-стрит стираются.
Глобальный биржевой гигант Intercontinental Exchange, владелец NYSE, и Circle, эмитент USDC, объявили об этом.
Цель — интегрировать стейблкоин USDC и токенизированный фонд USYC в продукты и инфраструктуру ICE.
Это явный сигнал того, что стейблкоины, как класс цифровых активов, все глубже проникают в традиционный финансовый сектор.
Стейблкоины становятся мостом между криптой и классическими рынками и перестают быть инструментом криптоэнтузиастов и начинают рассматриваться как часть глобальной финансовой системы.
Интерес к USYC, токенизированному фонду денежного рынка, указывает на более широкий тренд — токенизацию традиционных финансовых инструментов. Это шаг к тому, чтобы в будущем акции, облигации или другие активы также начали активно токенизироваться и торговаться с использованием блокчейн-технологий.
Границы между блокчейном и Уолл-стрит стираются.
Circle
ICE and Circle Sign MOU to Explore Product Innovation
ICE to use USDC and USYC as the company explores new products and solutions for its customers. Learn more about this agreement.
🔥6👍5⚡2❤1
Вайб кодинг дошел до профессуры Стэнфорда - Эндрю Нг запустил бесплатный курс по вайб кодингу вместе с Replit
Нг известный своими работами в области ИИ и машинного обучения запустил курс "Vibe Coding 101" вместе с Replit
Нг преподаватель в Стэнфорде, основатель Coursera, сам активно продвигает идею, что ИИ-агенты меняют подход к написанию кода.
Курс построен так, что за 94 минуты человек может собрать и развернуть 2 веб-приложения с помощью "5 навыков вайб-кодинга": думать, использовать фреймворки, ставить чекпоинты, отлаживать и давать контекст.
Выглядит все это как знамение времени, когда мэтры, как Нг, берутся учить не классическому коду, а работе с ИИ как с соавтором.
Нг известный своими работами в области ИИ и машинного обучения запустил курс "Vibe Coding 101" вместе с Replit
Нг преподаватель в Стэнфорде, основатель Coursera, сам активно продвигает идею, что ИИ-агенты меняют подход к написанию кода.
Курс построен так, что за 94 минуты человек может собрать и развернуть 2 веб-приложения с помощью "5 навыков вайб-кодинга": думать, использовать фреймворки, ставить чекпоинты, отлаживать и давать контекст.
Выглядит все это как знамение времени, когда мэтры, как Нг, берутся учить не классическому коду, а работе с ИИ как с соавтором.
www.deeplearning.ai
Vibe Coding 101 with Replit - DeepLearning.AI
Design, build, and deploy apps with an AI coding agent in an integrated web development environment.
🔥15👍8❤5
❗️Anthropic изучил 'мышление' Claude с помощью нейробиологии. Понимание ИИ — это биологическая проблема, говорит один из исследователей.
Сначала отметим 5 открытий от исследователя Джека Линдси.
1. Вычисления ИИ поддаются расшифровке. Несмотря на все сложности, внутренние вычисления современных языковых моделей можно разложить на понятные шаги.
2. Модели мыслят осмысленно. Они планируют ответы заранее, представляют цели, рассматривают несколько возможностей одновременно. Иногда они пугающе умны — могут работать от готового ответа в обратном направлении.
3. Иногда мышление моделей фрагментировано. Claude может начать рассказывать, как сделать бомбу, без «осознания» этого. Его стремление закончить предложение иногда перевешивает нежелание причинять вред.
4. Модели не знают, как они работают.
5. Понимание ИИ — биологическая проблема. Многие работы сосредоточены на создании математических и вычислительных инструментов для изучения моделей. Нам нужны эти инструменты, как биологам нужны микроскопы.
Ключевые открытия исследования Anthropic:
Универсальный язык мышления. Claude не "думает" на конкретных языках. При запросе "противоположности слова 'маленький'" на разных языках активируются одни и те же внутренние концепты, формируя своего рода межъязыковое концептуальное пространство.
Планирование наперёд.При создании стихов Claude сначала определяет возможные рифмующиеся слова для конца строки, а затем строит предложение, естественно подводящее к этому слову. Это доказывает, что модель планирует текст на несколько слов вперёд.
Достоверность объяснений.В некоторых случаях Claude дает подлинные цепочки рассуждений. Однако при работе с неверными подсказками модель может создавать правдоподобные, но фиктивные объяснения — своего рода "обратную инженерию" для обоснования неверного ответа.
Математические вычисления.Для сложения чисел модель использует параллельные вычислительные пути — один для приблизительного результата, другой для точного определения последней цифры. Интересно, что когда модель объясняет, как она складывает числа, она описывает стандартный алгоритм, а не тот, который реально использует.
Многоступенчатые рассуждения.Отвечая на вопрос "Столица штата, в котором находится Даллас?", Claude сначала активирует концепт "Даллас находится в Техасе", затем переходит к "столица Техаса — Остин". Это подтверждает настоящие цепочки рассуждений, а не просто регургитацию запомненных ассоциаций.
Контроль галлюцинаций.По умолчанию у Claude активирован "контур отказа", заставляющий его отклонять вопросы, на которые он не знает ответа. Этот контур отключается только, когда активируются концепты "известных сущностей". Галлюцинации возникают, когда этот механизм срабатывает некорректно.
Уязвимости при "взломе".При успешном "джейлбрейке" Claude может начать генерировать нежелательный контент из-за конфликта между грамматической связностью и безопасностью. Модель способна повернуть к отказу только после завершения грамматически корректного предложения.
Сначала отметим 5 открытий от исследователя Джека Линдси.
1. Вычисления ИИ поддаются расшифровке. Несмотря на все сложности, внутренние вычисления современных языковых моделей можно разложить на понятные шаги.
2. Модели мыслят осмысленно. Они планируют ответы заранее, представляют цели, рассматривают несколько возможностей одновременно. Иногда они пугающе умны — могут работать от готового ответа в обратном направлении.
3. Иногда мышление моделей фрагментировано. Claude может начать рассказывать, как сделать бомбу, без «осознания» этого. Его стремление закончить предложение иногда перевешивает нежелание причинять вред.
4. Модели не знают, как они работают.
5. Понимание ИИ — биологическая проблема. Многие работы сосредоточены на создании математических и вычислительных инструментов для изучения моделей. Нам нужны эти инструменты, как биологам нужны микроскопы.
Ключевые открытия исследования Anthropic:
Универсальный язык мышления. Claude не "думает" на конкретных языках. При запросе "противоположности слова 'маленький'" на разных языках активируются одни и те же внутренние концепты, формируя своего рода межъязыковое концептуальное пространство.
Планирование наперёд.При создании стихов Claude сначала определяет возможные рифмующиеся слова для конца строки, а затем строит предложение, естественно подводящее к этому слову. Это доказывает, что модель планирует текст на несколько слов вперёд.
Достоверность объяснений.В некоторых случаях Claude дает подлинные цепочки рассуждений. Однако при работе с неверными подсказками модель может создавать правдоподобные, но фиктивные объяснения — своего рода "обратную инженерию" для обоснования неверного ответа.
Математические вычисления.Для сложения чисел модель использует параллельные вычислительные пути — один для приблизительного результата, другой для точного определения последней цифры. Интересно, что когда модель объясняет, как она складывает числа, она описывает стандартный алгоритм, а не тот, который реально использует.
Многоступенчатые рассуждения.Отвечая на вопрос "Столица штата, в котором находится Даллас?", Claude сначала активирует концепт "Даллас находится в Техасе", затем переходит к "столица Техаса — Остин". Это подтверждает настоящие цепочки рассуждений, а не просто регургитацию запомненных ассоциаций.
Контроль галлюцинаций.По умолчанию у Claude активирован "контур отказа", заставляющий его отклонять вопросы, на которые он не знает ответа. Этот контур отключается только, когда активируются концепты "известных сущностей". Галлюцинации возникают, когда этот механизм срабатывает некорректно.
Уязвимости при "взломе".При успешном "джейлбрейке" Claude может начать генерировать нежелательный контент из-за конфликта между грамматической связностью и безопасностью. Модель способна повернуть к отказу только после завершения грамматически корректного предложения.
Telegram
All about AI, Web 3.0, BCI
Anthropic published research revealing how large language models like Claude actually "think."
Using what they call an "AI microscope," researchers traced the internal activity of Claude, uncovering fascinating insights about its cognitive processes.
Key…
Using what they call an "AI microscope," researchers traced the internal activity of Claude, uncovering fascinating insights about its cognitive processes.
Key…
5🔥18👍11❤8😱1
Nvidia стремится контролировать не только железо,но ПО и сервисы вокруг него,что позволит им сохранить доминирующее положение в экосистеме ИИ даже при появлении новых игроков
Недавние слухи о переговорах между Nvidia и Lepton AI раскрывают гораздо более глубокую стратегию технологического гиганта.
Lepton AI — компания, которая арендует серверы с чипами Nvidia и помогает разработчикам запускать модели ИИ.
Если сделка состоится, Nvidia будет в прямой конкуренции с другими провайдерами инференса, в частности с Together AI, у которой годовой доход превышает $150 млн.
Интересно, что не только Nvidia проявляет интерес к этому сегменту. Другие облачные провайдеры: CoreWeave, Nebius и Lambda Labs, тоже активно присматриваются к провайдерам инференса.
Если сделка Nvidia состоится, то это говорит о нескольких стратегических целях:
1. Nvidia больше не хочет быть просто производителем чипов. Контролируя как железо, так и сервисы инференса, они получают управление над всей вертикалью ценности — от создания GPU до их использования конечными потребителями.
2. Рынок железа циклический, а сервисные модели обеспечивают постоянный и предсказуемый доход. Это классический пример перехода от продажи оборудования к модели "as-a-service".
3. Управляя инференс-платформой, Nvidia будет видеть, какие модели запускаются, как оптимизируются, и какие изменения в архитектуре GPU нужны рынку — эта обратная связь бесценна для их основного бизнеса.
4. Покупая ключевых игроков в экосистеме ИИ, Nvidia не просто усиливает свою позицию, но и не позволяет конкурентам вроде AMD или новых специализированных чипов занять эту нишу.
Сегодня Nvidia контролирует около 80% рынка чипов для ИИ, но компания понимает, что это преимущество не вечно. Новые специализированные чипы от стартапов и технологических гигантов (Google с TPU, Meta* с MTIA) создают конкуренцию.
Создавая такую экосистему, где их ПО, инструменты разработки, облачные сервисы и железо идеально интегрированы, они увеличивают стоимость переключения на альтернативы даже при появлении более производительных или дешевых чипов.
Что это значит для отрасли?
Для разработчиков ИИ и компаний это двоякая ситуация:
+: более оптимизированные и интегрированные решения, потенциально более эффективное использование дорогостоящего железа.
-: усиление зависимости от одного поставщика, потенциально более высокие цены из-за отсутствия конкуренции, риск вендорлока.
*запрещенная в РФ.
Недавние слухи о переговорах между Nvidia и Lepton AI раскрывают гораздо более глубокую стратегию технологического гиганта.
Lepton AI — компания, которая арендует серверы с чипами Nvidia и помогает разработчикам запускать модели ИИ.
Если сделка состоится, Nvidia будет в прямой конкуренции с другими провайдерами инференса, в частности с Together AI, у которой годовой доход превышает $150 млн.
Интересно, что не только Nvidia проявляет интерес к этому сегменту. Другие облачные провайдеры: CoreWeave, Nebius и Lambda Labs, тоже активно присматриваются к провайдерам инференса.
Если сделка Nvidia состоится, то это говорит о нескольких стратегических целях:
1. Nvidia больше не хочет быть просто производителем чипов. Контролируя как железо, так и сервисы инференса, они получают управление над всей вертикалью ценности — от создания GPU до их использования конечными потребителями.
2. Рынок железа циклический, а сервисные модели обеспечивают постоянный и предсказуемый доход. Это классический пример перехода от продажи оборудования к модели "as-a-service".
3. Управляя инференс-платформой, Nvidia будет видеть, какие модели запускаются, как оптимизируются, и какие изменения в архитектуре GPU нужны рынку — эта обратная связь бесценна для их основного бизнеса.
4. Покупая ключевых игроков в экосистеме ИИ, Nvidia не просто усиливает свою позицию, но и не позволяет конкурентам вроде AMD или новых специализированных чипов занять эту нишу.
Сегодня Nvidia контролирует около 80% рынка чипов для ИИ, но компания понимает, что это преимущество не вечно. Новые специализированные чипы от стартапов и технологических гигантов (Google с TPU, Meta* с MTIA) создают конкуренцию.
Создавая такую экосистему, где их ПО, инструменты разработки, облачные сервисы и железо идеально интегрированы, они увеличивают стоимость переключения на альтернативы даже при появлении более производительных или дешевых чипов.
Что это значит для отрасли?
Для разработчиков ИИ и компаний это двоякая ситуация:
+: более оптимизированные и интегрированные решения, потенциально более эффективное использование дорогостоящего железа.
-: усиление зависимости от одного поставщика, потенциально более высокие цены из-за отсутствия конкуренции, риск вендорлока.
*запрещенная в РФ.
The Information
Nvidia Nears Deal to Buy GPU Reseller for Several Hundred Million Dollars
Nvidia is in advanced talks to buy Lepton AI, a two-year-old startup that rents out servers powered by Nvidia’s artificial intelligence chips, in a deal worth several hundred million dollars, according to a person close to the company. The move is part of…
1👍11😢5❤3🔥3