Stripe создает инструмент для монетизации ИИ-модели в приложениях.
Платежная система Stripe автоматически рассчитывает стоимость использования ИИ по количеству токенов и выставляет счета пользователям.
Разработчикам не нужно вручную настраивать биллинг или разбираться в сложных расчетах — все автоматизировано.
Как это работает?
1. Выбираете ИИ-модель (например, OpenAI o3, Claude Sonnet 4 или Gemini 1.5 Flash).
2. Устанавливаете свою наценку (например, +10% к стоимости вычислений модели).
3. Добавляете две строки кода в приложение.
Если хотите попробовать, напишите Джеффу jweinstein@stripe.com
Ранее компания выпустила свою ИИ-модель для платежей.
Платежная система Stripe автоматически рассчитывает стоимость использования ИИ по количеству токенов и выставляет счета пользователям.
Разработчикам не нужно вручную настраивать биллинг или разбираться в сложных расчетах — все автоматизировано.
Как это работает?
1. Выбираете ИИ-модель (например, OpenAI o3, Claude Sonnet 4 или Gemini 1.5 Flash).
2. Устанавливаете свою наценку (например, +10% к стоимости вычислений модели).
3. Добавляете две строки кода в приложение.
Если хотите попробовать, напишите Джеффу jweinstein@stripe.com
Ранее компания выпустила свою ИИ-модель для платежей.
🔥11
Все о блокчейн/мозге/space/WEB 3.0 в России и мире
Google DeepMind наносит контрудар OpenAI - мы получили золото на IMO "Мы были среди первой группы, чьи результаты официально оценены и сертифицированы координаторами IMO по тем же критериям, что и решения студентов", - только что заявил Google. Президент…
Ещё одна ИИ-модель получила 🥇на международной олимпиаде по математике для школьников (IMO)
ИИ-модель для математики Aristotle от Harmonic - стартап со-основателя Robinhood Влада Тенева.
Вчера команда представила бета-версию своего чат-бота Aristotle, ориентированного на математическое мышление.
Компания хочет создать математический супер интеллект (MSI). Aristotle позиционируется как ИИ, способный предоставлять ответы без галлюцинаций в количественных дисциплинах, таких как математика, физика, статистика и компьютерные науки.
Основные особенности Aristotle:
1. В отличие от ChatGPT или Gemini, которые могут галлюцинировать, Aristotle использует формальную верификацию. Это достигается с помощью языка программирования Lean 4, который позволяет переводить математические задачи из естественного языка в машинно-читаемые доказательства.
2. Перед выдачей ответа Aristotle проверяет корректность решения с помощью алгоритмического процесса, не зависящего от ИИ, что схоже с методами, используемыми в высоконагруженных отраслях, таких как авиация и медицина. Это обеспечивает отсутствие ошибок в расчетах и повышает доверие к результатам.
Harmonic объявила, что Aristotle достиг золотого уровня на Международной математической олимпиаде 2025 года (IMO).
В отличие от моделей Google и OpenAI, которые также показали высокие результаты, Aristotle использовал формальные машинно-читаемые тесты, что подчеркивает его уникальный подход к верификации.
Модель использует синтетические данные и самообучение, что позволяет ей генерировать собственные задачи и доказательства, обходя ограничения, связанные с нехваткой данных, характерные для других ИИ.
ИИ-модель для математики Aristotle от Harmonic - стартап со-основателя Robinhood Влада Тенева.
Вчера команда представила бета-версию своего чат-бота Aristotle, ориентированного на математическое мышление.
Компания хочет создать математический супер интеллект (MSI). Aristotle позиционируется как ИИ, способный предоставлять ответы без галлюцинаций в количественных дисциплинах, таких как математика, физика, статистика и компьютерные науки.
Основные особенности Aristotle:
1. В отличие от ChatGPT или Gemini, которые могут галлюцинировать, Aristotle использует формальную верификацию. Это достигается с помощью языка программирования Lean 4, который позволяет переводить математические задачи из естественного языка в машинно-читаемые доказательства.
2. Перед выдачей ответа Aristotle проверяет корректность решения с помощью алгоритмического процесса, не зависящего от ИИ, что схоже с методами, используемыми в высоконагруженных отраслях, таких как авиация и медицина. Это обеспечивает отсутствие ошибок в расчетах и повышает доверие к результатам.
Harmonic объявила, что Aristotle достиг золотого уровня на Международной математической олимпиаде 2025 года (IMO).
В отличие от моделей Google и OpenAI, которые также показали высокие результаты, Aristotle использовал формальные машинно-читаемые тесты, что подчеркивает его уникальный подход к верификации.
Модель использует синтетические данные и самообучение, что позволяет ей генерировать собственные задачи и доказательства, обходя ограничения, связанные с нехваткой данных, характерные для других ИИ.
aristotle.harmonic.fun
Aristotle, by Harmonic
Mathematical Superintelligence at your fingertips
👍19🤯1
Новый рынок! ИИ-стартапы по созданию видео идут в робототехнику
ИИ-стартапы, изначально работавшие с кино, теперь переходят в робототехнику, предлагая более реалистичные симуляции.
Стартапы Runway и Luma AI ведут переговоры с компаниями, разрабатывающими роботов и автономные машины.
Амит Джейн, CEO Luma AI, заявил, что робототехника может стать крупнейшим источником дохода для них.
А Анастасис Германидис, CTO Runway, считает, что генерация видео в реальном времени для роботов и игр в будущем принесёт больше денег, чем работа с киностудиями.
Почему ИИ-видео лучше традиционных симуляций?
Сейчас роботов обучают в виртуальных симуляторах, но у этого подхода есть недостатки:
- Симуляции слишком упрощённые
- ИИ-видео может генерировать сложную физику, что делает обучение роботов более реалистичным.
Пример от Runway:
- Их ИИ может создать видео с разными сценариями для беспилотника, например, что будет, если повернуть налево или направо. Это поможет автопилоту выбрать более безопасный вариант.
Luma AI хочет создать «мозг» для роботов. Компания не только обучает ИИ для роботов, но и планирует управлять ими. Их модель сможет симулировать последствия действий и выбирать лучший вариант. Luma уже работает с компаниями, разрабатывающими гуманоидных роботов.
Но не все верят в симуляции. Многие компании считают, что лучше тестировать роботов в реальном мире. Генерация видео требует огромных вычислительных мощностей.
Но OpenAI, Nvidia, Meta(запрещенная в РФ) и Google DeepMind уже изучают, как применить свои видео-модели в робототехнике.
ИИ-стартапы, изначально работавшие с кино, теперь переходят в робототехнику, предлагая более реалистичные симуляции.
Стартапы Runway и Luma AI ведут переговоры с компаниями, разрабатывающими роботов и автономные машины.
Амит Джейн, CEO Luma AI, заявил, что робототехника может стать крупнейшим источником дохода для них.
А Анастасис Германидис, CTO Runway, считает, что генерация видео в реальном времени для роботов и игр в будущем принесёт больше денег, чем работа с киностудиями.
Почему ИИ-видео лучше традиционных симуляций?
Сейчас роботов обучают в виртуальных симуляторах, но у этого подхода есть недостатки:
- Симуляции слишком упрощённые
- ИИ-видео может генерировать сложную физику, что делает обучение роботов более реалистичным.
Пример от Runway:
- Их ИИ может создать видео с разными сценариями для беспилотника, например, что будет, если повернуть налево или направо. Это поможет автопилоту выбрать более безопасный вариант.
Luma AI хочет создать «мозг» для роботов. Компания не только обучает ИИ для роботов, но и планирует управлять ими. Их модель сможет симулировать последствия действий и выбирать лучший вариант. Luma уже работает с компаниями, разрабатывающими гуманоидных роботов.
Но не все верят в симуляции. Многие компании считают, что лучше тестировать роботов в реальном мире. Генерация видео требует огромных вычислительных мощностей.
Но OpenAI, Nvidia, Meta(запрещенная в РФ) и Google DeepMind уже изучают, как применить свои видео-модели в робототехнике.
YouTube
AI Video, VC Metrics, and Crusoe's Cloud Ambition | July 23, 2025
This episode kicks off with an exclusive interview featuring Cristóbal Valenzuela, CEO of AI video company Runway, who discusses their innovative enterprise sales strategy and the "forward-deployed technical artists" helping companies embrace non-traditional…
🔥7👍2
Все о блокчейн/мозге/space/WEB 3.0 в России и мире
⚡️Создана 1-я в мире виртуальная лаба из команды ИИ-ученых под руководством ИИ-профессора Работа выполнена исследователями из Стэнфордского университета и Chan Zuckerberg Biohub (организация Марка Цукерберга и его супруги). Как это работает? • ИИ-профессор…
Виртуальная лаба из ИИ-агентов за несколько дней создала 92 варианта нанотел против COVID-19
Это работа команды из Стэнфорда и Chan Zuckerberg Biohub (компания Марка Цукерберга и его супруги).
Что получилось?
1. ИИ-агенты за несколько дней создали 92 варианта нанотел против COVID-19
2. 2 молекулы показали хорошие результаты в лабораторных тестах
3. Система работает как команда: ИИ-PI, специалисты по иммунологии, биоинформатике + агент-критик.
4. 99% обсуждений ведут сами агенты, человек только направляет.
Пока работает только с GPT-4o, нужна экспериментальная проверка людьми, агенты иногда дают расплывчатые ответы.
Это один из первых примеров, где ИИ-агенты показали результат уровня профессиональных исследователей с публикацией в Nature..
Это работа команды из Стэнфорда и Chan Zuckerberg Biohub (компания Марка Цукерберга и его супруги).
Что получилось?
1. ИИ-агенты за несколько дней создали 92 варианта нанотел против COVID-19
2. 2 молекулы показали хорошие результаты в лабораторных тестах
3. Система работает как команда: ИИ-PI, специалисты по иммунологии, биоинформатике + агент-критик.
4. 99% обсуждений ведут сами агенты, человек только направляет.
Пока работает только с GPT-4o, нужна экспериментальная проверка людьми, агенты иногда дают расплывчатые ответы.
Это один из первых примеров, где ИИ-агенты показали результат уровня профессиональных исследователей с публикацией в Nature..
GitHub
GitHub - zou-group/virtual-lab: A virtual lab of LLM agents for science research
A virtual lab of LLM agents for science research. Contribute to zou-group/virtual-lab development by creating an account on GitHub.
🔥21❤3👍2😱1🦄1
Как часто вы/ваши дети учите что-то новое? OpenAI выпустил новую функцию - режим обучения в ChatGPT
Это пошаговые инструкции для обучения, а не быстрые ответы.
Интересна статистика, в которой будут показатели как часто люди что-то учат в ChatGPT.
Это может сильно повлиять на образование в целом, начиная от школы.
Это пошаговые инструкции для обучения, а не быстрые ответы.
Интересна статистика, в которой будут показатели как часто люди что-то учат в ChatGPT.
Это может сильно повлиять на образование в целом, начиная от школы.
Openai
Introducing study mode
A new way to learn in ChatGPT that offers step by step guidance instead of quick answers.
❤15👍7👀2🔥1🤔1
Вот это скорость развития нейротехнологий! Сразу 3 больших события этой недели
Вообще сейчас бум инвестиций в нейротех, об этом мы писали тут.
Вот три значимых события этой недели:
1. Немецкая компания CorTec впервые имплантировала человеку свою BCI-систему. Она не только "слушает" мозг, но и стимулирует его, помогая восстановить утраченные функции, например, после инсульта.
Ключевая особенность этой BCI — её замкнутый контур: она не только записывает активность мозга, но и в онлайне интерпретирует сигналы, обеспечивая целенаправленную электрическую стимуляцию.
Испытания уже идут в Сиэтле.
2. Стартап INBRAIN представил промежуточные результаты первого в истории исследования графенового интерфейса мозг-компьютер на людях. Об этом стартапе можно прочитать тут и тут.
Основными выводами стали высокая безопасность (отсутствие связанных с устройством побочных эффектов у первых четырех пациентов) и исключительное качество сигнала, что может помочь в лечении Паркинсона или эпилепсии.
3. В США ученые из NINDS совершенствуют адаптивную стимуляцию мозга (aDBS). Она подстраивается под сигналы мозга в реальном времени, улучшая лечение эпилепсии, депрессии и даже хронической боли. Персонализированная медицина уже здесь.
Вообще сейчас бум инвестиций в нейротех, об этом мы писали тут.
Вот три значимых события этой недели:
1. Немецкая компания CorTec впервые имплантировала человеку свою BCI-систему. Она не только "слушает" мозг, но и стимулирует его, помогая восстановить утраченные функции, например, после инсульта.
Ключевая особенность этой BCI — её замкнутый контур: она не только записывает активность мозга, но и в онлайне интерпретирует сигналы, обеспечивая целенаправленную электрическую стимуляцию.
Испытания уже идут в Сиэтле.
2. Стартап INBRAIN представил промежуточные результаты первого в истории исследования графенового интерфейса мозг-компьютер на людях. Об этом стартапе можно прочитать тут и тут.
Основными выводами стали высокая безопасность (отсутствие связанных с устройством побочных эффектов у первых четырех пациентов) и исключительное качество сигнала, что может помочь в лечении Паркинсона или эпилепсии.
3. В США ученые из NINDS совершенствуют адаптивную стимуляцию мозга (aDBS). Она подстраивается под сигналы мозга в реальном времени, улучшая лечение эпилепсии, депрессии и даже хронической боли. Персонализированная медицина уже здесь.
🔥15👍4❤2👎2
Одно из самых трансформирующих партнерств - Coinbase и JPMorgan принесут криптовалюты в каждый дом
Напомним, что у Coinbase есть еще партнерство с Anthropic, тут о новой платёжной инфраструктуре x402.
А вот подробнее про партнерство с JPMorgan:
1. С 2026 года клиенты JP Morgan смогут легко привязать свои банковские счета к крипто кошельку Coinbase. Это позволит быстро и безопасно переводить деньги на криптобиржу.
2. Клиенты JP Morgan смогут конвертировать баллы из программы лояльности Chase Ultimate Rewards в деньги на своем счете Coinbase. Например, 100 баллов = 1$. Эта функция тоже появится в 2026 году.
3. С осени 2025 года можно будет пополнять счет на Coinbase с помощью кредитных карт Chase.
Напомним, что у Coinbase есть уже инструменты для ИИ-агентов, тут подробно.
Напомним, что у Coinbase есть еще партнерство с Anthropic, тут о новой платёжной инфраструктуре x402.
А вот подробнее про партнерство с JPMorgan:
1. С 2026 года клиенты JP Morgan смогут легко привязать свои банковские счета к крипто кошельку Coinbase. Это позволит быстро и безопасно переводить деньги на криптобиржу.
2. Клиенты JP Morgan смогут конвертировать баллы из программы лояльности Chase Ultimate Rewards в деньги на своем счете Coinbase. Например, 100 баллов = 1$. Эта функция тоже появится в 2026 году.
3. С осени 2025 года можно будет пополнять счет на Coinbase с помощью кредитных карт Chase.
Напомним, что у Coinbase есть уже инструменты для ИИ-агентов, тут подробно.
Telegram
All about AI, Web 3.0, BCI
Coinbase and JPMorgan have partnered to crypto access for over 80 million Chase customers, introducing three 3 methods:
- converting Chase Ultimate Rewards to USDC,
- funding Coinbase accounts with Chase credit cards,
- direct bank integration.
The integration…
- converting Chase Ultimate Rewards to USDC,
- funding Coinbase accounts with Chase credit cards,
- direct bank integration.
The integration…
👍6🔥2
Цукерберг выпустил свой манифест/стратегию по сверхИИ
Основное в стратегии Марка Цукерберга - дать каждому человеку по персональному сверхинтеллекту.
Вот ключевые аспекты его стратегии:
1. Персонализация ИИ. Вместо централизованного ИИ, который автоматизирует все задачи, Meta* создает персональный сверхинтеллект, который будет глубоко знать пользователя, понимать его цели и помогать ему достигать их. Это касается как повседневных задач, так и личностного роста, творчества и улучшения отношений.
2. Расширение возможностей людей, чтобы каждый мог создавать то, что хочет видеть в мире. Это противопоставляется идее, что ИИ заменит всю ценную работу, а люди будут жить на пособии.
3. Интеграция с повседневной жизнью. Персональный сверхинтеллект будет работать через персональные устройства, такие как очки, которые Meta создает, тут подробнее. А здесь о том, как очки будут управляться с использованием нейроинтерфейса.
4. Масштабирование и безопасность. Марк признает, что сверхинтеллект вызовет новые вопросы безопасности, и Meta будет строго подходить к снижению рисков, тщательно обдумывая, что открывать для общего доступа(!). Недавно стало известно, что компания может поменять свою стратегию по опен сорсу.
По мнению Цукерберга, это десятилетие будет решающим для определения того, по какому пути пойдет эта технология: станет ли она инструментом личной силы или силой, замещающей значительные слои общества. Meta выбирает первый путь.
*Запрещенная в РФ организация.
Основное в стратегии Марка Цукерберга - дать каждому человеку по персональному сверхинтеллекту.
Вот ключевые аспекты его стратегии:
1. Персонализация ИИ. Вместо централизованного ИИ, который автоматизирует все задачи, Meta* создает персональный сверхинтеллект, который будет глубоко знать пользователя, понимать его цели и помогать ему достигать их. Это касается как повседневных задач, так и личностного роста, творчества и улучшения отношений.
2. Расширение возможностей людей, чтобы каждый мог создавать то, что хочет видеть в мире. Это противопоставляется идее, что ИИ заменит всю ценную работу, а люди будут жить на пособии.
3. Интеграция с повседневной жизнью. Персональный сверхинтеллект будет работать через персональные устройства, такие как очки, которые Meta создает, тут подробнее. А здесь о том, как очки будут управляться с использованием нейроинтерфейса.
4. Масштабирование и безопасность. Марк признает, что сверхинтеллект вызовет новые вопросы безопасности, и Meta будет строго подходить к снижению рисков, тщательно обдумывая, что открывать для общего доступа(!). Недавно стало известно, что компания может поменять свою стратегию по опен сорсу.
По мнению Цукерберга, это десятилетие будет решающим для определения того, по какому пути пойдет эта технология: станет ли она инструментом личной силы или силой, замещающей значительные слои общества. Meta выбирает первый путь.
*Запрещенная в РФ организация.
Meta
Personal Superintelligence
Explore Meta's vision of personal superintelligence, where AI empowers individuals to achieve their goals, create, connect, and lead fulfilling lives. Insights from Mark Zuckerberg on the future of AI and human empowerment.
👍9🔥6😁4😍2
Intentionally_vs_spontaneously_prolonged_gaze_Cortex2025.pdf
5.9 MB
Российские ученые из МГППУ выяснили, как мозг управляет компьютером взглядом
Исследователи изучали, как мозг управляет намеренными фиксациями взгляда, чтобы решить ключевую проблему eye-tracking систем — различение осознанных действий, например, выбор объекта взглядом, от случайных взглядов.
Основная цель работы — улучшить гибридные интерфейсы мозг-компьютер, где eye-tracking дополняется сигналами мозга для повышения надежности, особенно для людей с двигательными нарушениями.
В их исследовании 32 человека играли в игру, где нужно было выбирать объекты взглядом, фиксируя его на полсекунды и подтверждая выбор. МЭГ-датчики фиксировали, что происходит в мозге во время этих действий.
Что нашли?
- Мозг заранее "готовится" к осознанному взгляду: за полсекунды в лобной коре подавляются лишние движения глаз.
- В височной коре усиливается внимание к выбранному объекту.
- Эти процессы работают вместе, как двойной контроль.
Исследование впервые изучило контроль взгляда в естественных условиях, а не в лабораторных тестах. Найденные сигналы мозга помогут создать точные интерфейсы для управления компьютером взглядом, особенно для людей с ограниченной подвижностью.
Что впечатляет?
- Естественная игровая задача и точные методы анализа.
- Понимание, что мозг начинает подготовку раньше, чем мы думали.
- Возможность улучшить технологии eye-tracking, решив проблему случайных взглядов.
Исследователи изучали, как мозг управляет намеренными фиксациями взгляда, чтобы решить ключевую проблему eye-tracking систем — различение осознанных действий, например, выбор объекта взглядом, от случайных взглядов.
Основная цель работы — улучшить гибридные интерфейсы мозг-компьютер, где eye-tracking дополняется сигналами мозга для повышения надежности, особенно для людей с двигательными нарушениями.
В их исследовании 32 человека играли в игру, где нужно было выбирать объекты взглядом, фиксируя его на полсекунды и подтверждая выбор. МЭГ-датчики фиксировали, что происходит в мозге во время этих действий.
Что нашли?
- Мозг заранее "готовится" к осознанному взгляду: за полсекунды в лобной коре подавляются лишние движения глаз.
- В височной коре усиливается внимание к выбранному объекту.
- Эти процессы работают вместе, как двойной контроль.
Исследование впервые изучило контроль взгляда в естественных условиях, а не в лабораторных тестах. Найденные сигналы мозга помогут создать точные интерфейсы для управления компьютером взглядом, особенно для людей с ограниченной подвижностью.
Что впечатляет?
- Естественная игровая задача и точные методы анализа.
- Понимание, что мозг начинает подготовку раньше, чем мы думали.
- Возможность улучшить технологии eye-tracking, решив проблему случайных взглядов.
👍13❤2
Китай поверил в себя. Ex-CTO Alibaba: будущее ИИ строит Китай, а не Кремниевая долина
В интервью Bloomberg Wang Jian также рассказал, почему к 2030 году ИИ не будет совсем похож на ChatGPT, и почему подход Китая опережает его на десятилетия.
Вот его мысли:
1/ Кремниевая долина верит в принцип "двигайся быстро и ломай вещи".
Но Китай работает по-другому.
Философия китайского ИИ-рынка: Строй медленно. Строй глубоко. Строй надолго.
2/ Китай не фокусируется на погоне за хайпом.
Никаких новых инструментов. Никаких новых приложений. Никаких новых демо.
ИИ интегрируется на уровне инфраструктуры:
производство, здравоохранение, сельское хозяйство, транспорт, государственные услуги.
3/ ИИ изменит не только то, что мы делаем. Он изменит то, как мы думаем. Это не просто инструмент. Он становится вторым мозгом.Мы будем выгружать память, ускорять решение проблем и полагаться на него в формировании наших идей.
Будущие мыслители не будут думать больше. Они будут думать с ИИ.
4/ Забудьте про ИИ против AGI. Это неправильные дебаты.
Доктор Ван не верит в проведение жестких границ.
Для него это всё интеллект, просто с разными возможностями.
Одержимость AGI отвлекает нас от того, что текущий ИИ уже может делать.
5/ Открытый исходный код недостаточен. Применение — это всё.
Китай не ждет, пока модели с открытым кодом догонят.
Они настраивают их и делают полезными прямо сейчас в реальных условиях.
От заводских линий до систем управления трафиком — ИИ уже встроен.
6/ Успех ИИ не придет от большего финансирования.
Доктор Ван говорит, что самый большой вызов — это не деньги или модели.
Это подготовка инженеров, которые глубоко понимают ИИ и могут строить ответственно и креативно.
7/ Китай не видит ИИ как продукт. Они видят его как инфраструктуру.
Эта смена мышления меняет всё.
Кремниевая долина оптимизирует для роста пользователей.
Пекин оптимизирует для национальной устойчивости.
Это не стартап-игра. Это цивилизационный сдвиг.
А вот реальный взгляд на то, что делает ИИ.
В интервью Bloomberg Wang Jian также рассказал, почему к 2030 году ИИ не будет совсем похож на ChatGPT, и почему подход Китая опережает его на десятилетия.
Вот его мысли:
1/ Кремниевая долина верит в принцип "двигайся быстро и ломай вещи".
Но Китай работает по-другому.
Философия китайского ИИ-рынка: Строй медленно. Строй глубоко. Строй надолго.
2/ Китай не фокусируется на погоне за хайпом.
Никаких новых инструментов. Никаких новых приложений. Никаких новых демо.
ИИ интегрируется на уровне инфраструктуры:
производство, здравоохранение, сельское хозяйство, транспорт, государственные услуги.
3/ ИИ изменит не только то, что мы делаем. Он изменит то, как мы думаем. Это не просто инструмент. Он становится вторым мозгом.Мы будем выгружать память, ускорять решение проблем и полагаться на него в формировании наших идей.
Будущие мыслители не будут думать больше. Они будут думать с ИИ.
4/ Забудьте про ИИ против AGI. Это неправильные дебаты.
Доктор Ван не верит в проведение жестких границ.
Для него это всё интеллект, просто с разными возможностями.
Одержимость AGI отвлекает нас от того, что текущий ИИ уже может делать.
5/ Открытый исходный код недостаточен. Применение — это всё.
Китай не ждет, пока модели с открытым кодом догонят.
Они настраивают их и делают полезными прямо сейчас в реальных условиях.
От заводских линий до систем управления трафиком — ИИ уже встроен.
6/ Успех ИИ не придет от большего финансирования.
Доктор Ван говорит, что самый большой вызов — это не деньги или модели.
Это подготовка инженеров, которые глубоко понимают ИИ и могут строить ответственно и креативно.
7/ Китай не видит ИИ как продукт. Они видят его как инфраструктуру.
Эта смена мышления меняет всё.
Кремниевая долина оптимизирует для роста пользователей.
Пекин оптимизирует для национальной устойчивости.
Это не стартап-игра. Это цивилизационный сдвиг.
А вот реальный взгляд на то, что делает ИИ.
Bloomberg.com
Alibaba Cloud Visionary Expects Big Shakeup After OpenAI Hype
OpenAI’s ChatGPT started a revolution in artificial intelligence development and investment. Yet nine-tenths of the technology and services that’ve sprung up since could be gone in under a decade, according to the founder of Alibaba Group Holding Ltd.’s cloud…
🤔9❤🔥8🔥8❤5👍3🥴2🐳2😁1🤬1
Китай сегодня выпустил сразу 2 ⚡️ работы: новую ИИ-модель и агенты с мета-рассуждениями
1. Step 3: Мультимодальный ИИ с открытым кодом:
- Новая визуально-языковая модель (VLM) с 321 млрд параметров (38 млрд активных), которая обрабатывает текст и изображения со скоростью — до 4039 токенов/сек/GPU (на 70% быстрее DeepSeek-V3!). Попробовать можно тут.
Фишки этой модели:
- Инновации в архитектуре (MFA и AFD) позволяют запускать модель даже на скромных GPU.
- Обучена на 20+ трлн токенов, включая 4 трлн мультимодальных данных, что снижает галлюцинации.
Идеальна для анализа текста, изображений, генерации контента и задач, где нужна скорость и экономичность.
2. Tencent выпустили RLVMR: Умные агенты с мета-рассуждениями:
RLVMR - фреймворк обучения с подкреплением (RL), который учит ИИ-агентов рассуждать правильно. Вознаграждает за планирование, исследование и исправление ошибок. GitHub.
Фишки:
- Решает проблему RL-агентов, которые ошибаются в новых задачах.
- Достигла 83.6% успеха на сложных невидимых задачах в ALFWorld и ScienceWorld с моделью всего на 7 млрд параметров.
- Улучшает обобщение: агенты меньше повторяются и лучше адаптируются.
Для чего это нужно?
Робототехника, автономные агенты, научные исследования — везде, где нужны сложные и надёжные рассуждения.
1. Step 3: Мультимодальный ИИ с открытым кодом:
- Новая визуально-языковая модель (VLM) с 321 млрд параметров (38 млрд активных), которая обрабатывает текст и изображения со скоростью — до 4039 токенов/сек/GPU (на 70% быстрее DeepSeek-V3!). Попробовать можно тут.
Фишки этой модели:
- Инновации в архитектуре (MFA и AFD) позволяют запускать модель даже на скромных GPU.
- Обучена на 20+ трлн токенов, включая 4 трлн мультимодальных данных, что снижает галлюцинации.
Идеальна для анализа текста, изображений, генерации контента и задач, где нужна скорость и экономичность.
2. Tencent выпустили RLVMR: Умные агенты с мета-рассуждениями:
RLVMR - фреймворк обучения с подкреплением (RL), который учит ИИ-агентов рассуждать правильно. Вознаграждает за планирование, исследование и исправление ошибок. GitHub.
Фишки:
- Решает проблему RL-агентов, которые ошибаются в новых задачах.
- Достигла 83.6% успеха на сложных невидимых задачах в ALFWorld и ScienceWorld с моделью всего на 7 млрд параметров.
- Улучшает обобщение: агенты меньше повторяются и лучше адаптируются.
Для чего это нужно?
Робототехника, автономные агенты, научные исследования — везде, где нужны сложные и надёжные рассуждения.
Please open Telegram to view this post
VIEW IN TELEGRAM
阶跃AI
阶跃AI是一个聪明可靠的个人效率助手,可以帮你获取知识、查询信息、学习语言、创意写作、编写代码,在工作、学习、生活等各种场景下帮你解决问题。带你发现和理解世界~
👍16❤5🤔1
Anthropic забрала половину рыночной доли OpenAI за 2 года, с годовым доходом $4.5 млрд стала самой быстрорастущей софтверной компанией в истории в таком масштабе
Свежий отчет Menlo Ventures говорит о следующем:
1. Anthropic обогнала OpenAI:
OpenAI потеряла половину рыночной доли за 2 года (с 50% до 25%).
Anthropic стала новым лидером с 32% корпоративного рынка.
Переломный момент — выпуск Claude Sonnet 3.5 в июне 2024.
2. Взрывной рост рынка API:
Расходы на LLM API удвоились за 6 месяцев: с $3.5 до $8.4 млрд. Это показывает переход от экспериментов к реальному внедрению
3. Код стал первым киллер-приложением ИИ:
Claude захватил 42% рынка генерации кода (вдвое больше OpenAI).
Из однопродуктового рынка (GitHub Copilot) выросла экосистема на $1.9 млрд.
Появились новые категории: ИИ-IDE, конструкторы приложений, агенты для кодирования.
4. Бизнес платит за качество, а не экономит:
66% обновляются до новых моделей у того же провайдера. Только 11% меняют провайдеров
Несмотря на 10-кратное падение цен, компании массово переходят к самым новым моделям.
5. Кардинальный сдвиг в расходах:
От обучения к инференсу: 74% стартапов теперь тратят больше на производственное использование (было 48%).
Это означает, что ИИ переходит от R&D к реальным продуктам.
6. Открытый код проигрывает гонку:
Доля open-source упала с 19% до 13%. Отстает от закрытых моделей на 9-12 месяцев по производительности. Компании из США избегают китайских API из-за геополитических рисков.
7. 2025 — год агентов
Модели учат не просто отвечать, а использовать инструменты пошагово. Обучение с подкреплением + верификаторы стало новым способом масштабирования интеллекта
MCP (Model Context Protocol) от Anthropic стал стандартом интеграции.
Свежий отчет Menlo Ventures говорит о следующем:
1. Anthropic обогнала OpenAI:
OpenAI потеряла половину рыночной доли за 2 года (с 50% до 25%).
Anthropic стала новым лидером с 32% корпоративного рынка.
Переломный момент — выпуск Claude Sonnet 3.5 в июне 2024.
2. Взрывной рост рынка API:
Расходы на LLM API удвоились за 6 месяцев: с $3.5 до $8.4 млрд. Это показывает переход от экспериментов к реальному внедрению
3. Код стал первым киллер-приложением ИИ:
Claude захватил 42% рынка генерации кода (вдвое больше OpenAI).
Из однопродуктового рынка (GitHub Copilot) выросла экосистема на $1.9 млрд.
Появились новые категории: ИИ-IDE, конструкторы приложений, агенты для кодирования.
4. Бизнес платит за качество, а не экономит:
66% обновляются до новых моделей у того же провайдера. Только 11% меняют провайдеров
Несмотря на 10-кратное падение цен, компании массово переходят к самым новым моделям.
5. Кардинальный сдвиг в расходах:
От обучения к инференсу: 74% стартапов теперь тратят больше на производственное использование (было 48%).
Это означает, что ИИ переходит от R&D к реальным продуктам.
6. Открытый код проигрывает гонку:
Доля open-source упала с 19% до 13%. Отстает от закрытых моделей на 9-12 месяцев по производительности. Компании из США избегают китайских API из-за геополитических рисков.
7. 2025 — год агентов
Модели учат не просто отвечать, а использовать инструменты пошагово. Обучение с подкреплением + верификаторы стало новым способом масштабирования интеллекта
MCP (Model Context Protocol) от Anthropic стал стандартом интеграции.
Menlo Ventures
2025 Mid-Year LLM Market Update: Foundation Model Landscape + Economics | Menlo Ventures
As foundation models’ capabilities and economics evolve, so will the systems, applications, and industries built on top of them.
❤13👍10🔥6
Alchemy представили 1-й в мире ИИ-движок для блокчейн -приложений
Alchemy представили Cortex — новый движок, который создан для ускорения работы криптоприложений, таких как Polymarket, World Chain и стейблкоины (USDC, PYUSD).
Новая архитектура Cortex Engine сокращает среднее время отклика с 300-400 миллисекунд до 50 миллисекунд и увеличение пропускной способности узлов до 500 раз по сравнению со стандартными решениями.
Это достигается за счёт ИИ, который оптимизирует маршрутизацию запросов и адаптируется к нагрузкам сети.
Движок обучен на данных за 7+ лет работы Alchemy с крупными проектами, включая Circle, PayPal и пилотный проект токена от J.P. Morgan.
Alchemy представили Cortex — новый движок, который создан для ускорения работы криптоприложений, таких как Polymarket, World Chain и стейблкоины (USDC, PYUSD).
Новая архитектура Cortex Engine сокращает среднее время отклика с 300-400 миллисекунд до 50 миллисекунд и увеличение пропускной способности узлов до 500 раз по сравнению со стандартными решениями.
Это достигается за счёт ИИ, который оптимизирует маршрутизацию запросов и адаптируется к нагрузкам сети.
Движок обучен на данных за 7+ лет работы Alchemy с крупными проектами, включая Circle, PayPal и пилотный проект токена от J.P. Morgan.
Alchemy
The world's first intelligent blockchain engine
Your apps are now 2.5x faster, 5x more reliable, with 500x more throughput.
🏆10👍9❤2
Итоги уходящей недели, то, что имеет значение
ИИ:
Google создала масштабную модель из данных пользователей смартфонов и часов
OpenAI добавила новую функцию обучения в ChatGPT
Новые кейсы использования Claude Code за пределами программирования
Новая китайская ИИ-модель обогнала DeepSeek-V3 по скорости, а GLM-4.5 с 355B параметров стала лучшей среди открытых моделей мира
Aristotle - еще одна ИИ-модель завоевала золото на международной олимпиаде по математике для школьников
Meta представила MetaCLIP 2 — решение проблемы "проклятия многоязычности" в компьютерном зрении
Китай выпустил новую ИИ-модель, которая быстрее быстрее DeepSeek-V3 и RLVMR - фреймворк обучения с подкреплением (RL), который учит ИИ-агентов рассуждать правильно
Stripe создает инструмент для заработка на ИИ-моделях в приложениях
Google представила AlphaEarth — модель, которая объединила петабайты спутниковых данных в единую цифровую копию Земли
Виртуальная лаборатория из ИИ-агентов создала 92 варианта нанотел против коронавируса за несколько дней
Deep Cogito выпустила 4 гибридные модели, которые рассуждают на 60% быстрее #DeepSeek R1 благодаря внутренней "интуиции"
Meta* представила DINO-универсальную видео-модель, которая предсказывает будущие кадры в скрытом пространстве
Модель с всего 27M параметров решает сложнейшие судоку и лабиринты, обучившись на 1000 примерах
Microsoft выпустил ИИ-браузер Copilot Mode внутри Edge
Бизнес и корпоративные решения:
OpenAI потеряла половину рыночной доли за 2 года — Anthropic стала новым лидером с 32% корпоративного рынка. Свежий отчет Menlo Ventures.
PayPal запустил криптоплатежи для бизнеса, а Coinbase и JPMorgan объединили усилия, чтобы сделать криптовалюты ещё ближе для пользователей
Нейроинтерфейсы:
Российские ученые из МГППУ и ВШЭ раскрыли механизм управления компьютером взглядом
Крупные 3 проекта недели в области нейротехнологий тут.
Блокчейн и криптовалюты
PayPal запустил криптоплатежи для бизнеса, а Coinbase и JPMorgan объединили усилия, чтобы сделать криптовалюты ещё ближе для пользователей
Свежий отчет Messari о том, как стейблкоины меняют глобальные финансы в 2025 году
Alchemy запустила первый в мире ИИ-движок для блокчейн-приложений
Инструменты и платформы:
Команда ИИ-агентов Eigent для параллельного решения сложных задач
BlockDL — бесплатный GUI для визуального проектирования нейросетей Keras
Langchain представила Deep Agents с улучшенным планированием и файловой системой
Стратегии и прогнозы:
Цукерберг представил свою стратегию развития сверхискусственного интеллекта
Демис Хассабис и Сэм Альтман обсуждают строительство дата-центров для ИИ в космосе
Экс-CTO Alibaba заявляет, что будущее ИИ строит Китай
ИИ-стартапы переходят из киноиндустрии в робототехнику для реалистичных симуляций
*запрещенная компания в РФ.
ИИ:
Google создала масштабную модель из данных пользователей смартфонов и часов
OpenAI добавила новую функцию обучения в ChatGPT
Новые кейсы использования Claude Code за пределами программирования
Новая китайская ИИ-модель обогнала DeepSeek-V3 по скорости, а GLM-4.5 с 355B параметров стала лучшей среди открытых моделей мира
Aristotle - еще одна ИИ-модель завоевала золото на международной олимпиаде по математике для школьников
Meta представила MetaCLIP 2 — решение проблемы "проклятия многоязычности" в компьютерном зрении
Китай выпустил новую ИИ-модель, которая быстрее быстрее DeepSeek-V3 и RLVMR - фреймворк обучения с подкреплением (RL), который учит ИИ-агентов рассуждать правильно
Stripe создает инструмент для заработка на ИИ-моделях в приложениях
Google представила AlphaEarth — модель, которая объединила петабайты спутниковых данных в единую цифровую копию Земли
Виртуальная лаборатория из ИИ-агентов создала 92 варианта нанотел против коронавируса за несколько дней
Deep Cogito выпустила 4 гибридные модели, которые рассуждают на 60% быстрее #DeepSeek R1 благодаря внутренней "интуиции"
Meta* представила DINO-универсальную видео-модель, которая предсказывает будущие кадры в скрытом пространстве
Модель с всего 27M параметров решает сложнейшие судоку и лабиринты, обучившись на 1000 примерах
Microsoft выпустил ИИ-браузер Copilot Mode внутри Edge
Бизнес и корпоративные решения:
OpenAI потеряла половину рыночной доли за 2 года — Anthropic стала новым лидером с 32% корпоративного рынка. Свежий отчет Menlo Ventures.
PayPal запустил криптоплатежи для бизнеса, а Coinbase и JPMorgan объединили усилия, чтобы сделать криптовалюты ещё ближе для пользователей
Нейроинтерфейсы:
Российские ученые из МГППУ и ВШЭ раскрыли механизм управления компьютером взглядом
Крупные 3 проекта недели в области нейротехнологий тут.
Блокчейн и криптовалюты
PayPal запустил криптоплатежи для бизнеса, а Coinbase и JPMorgan объединили усилия, чтобы сделать криптовалюты ещё ближе для пользователей
Свежий отчет Messari о том, как стейблкоины меняют глобальные финансы в 2025 году
Alchemy запустила первый в мире ИИ-движок для блокчейн-приложений
Инструменты и платформы:
Команда ИИ-агентов Eigent для параллельного решения сложных задач
BlockDL — бесплатный GUI для визуального проектирования нейросетей Keras
Langchain представила Deep Agents с улучшенным планированием и файловой системой
Стратегии и прогнозы:
Цукерберг представил свою стратегию развития сверхискусственного интеллекта
Демис Хассабис и Сэм Альтман обсуждают строительство дата-центров для ИИ в космосе
Экс-CTO Alibaba заявляет, что будущее ИИ строит Китай
ИИ-стартапы переходят из киноиндустрии в робототехнику для реалистичных симуляций
*запрещенная компания в РФ.
❤4❤🔥4
Google близка к решению 1-й из 7 «Задач тысячелетия» с ИИ
Команда из 20 человек уже 3 года в строгой секретности пытается доказать, сохраняют ли решения уравнений Навье-Стокса регулярность или могут привести к «взрыву» — сингулярности, подобной внезапному цунами в спокойной воде. Это имеет огромное значение для метеорологии, авиации и медицины.
Команда использует нейронные сети, чтобы усовершенствовать симуляции, основанные на более простых уравнениях Эйлера, и определить, где и как может возникнуть сингулярность.
Задачи тысячелетия — 7 математических проблем, отобраных Математическим институтом Клэя в 2000 году как ключевые нерешённые вопросы, которые имеют глубокое значение для математики и науки в целом.
Команда из 20 человек уже 3 года в строгой секретности пытается доказать, сохраняют ли решения уравнений Навье-Стокса регулярность или могут привести к «взрыву» — сингулярности, подобной внезапному цунами в спокойной воде. Это имеет огромное значение для метеорологии, авиации и медицины.
Команда использует нейронные сети, чтобы усовершенствовать симуляции, основанные на более простых уравнениях Эйлера, и определить, где и как может возникнуть сингулярность.
Задачи тысячелетия — 7 математических проблем, отобраных Математическим институтом Клэя в 2000 году как ключевые нерешённые вопросы, которые имеют глубокое значение для математики и науки в целом.
EL PAÍS English
Spanish mathematician Javier Gómez Serrano and Google DeepMind team up to solve the Navier-Stokes million-dollar problem
A team of researchers and engineers has been secretly working for three years on one of humanity’s most devilish enigmas, the solution of which is considered imminent thanks to artificial intelligence
🔥21👍8❤3
Как работают ИИ-агенты-инструкция от создателей Manus как для пользователей, так и разработчиков
Manus говорит:Проектируйте ИИ-агентов с учётом KV-кэша
— это самая важная метрика для продакшн-агента, она напрямую влияет на задержку и стоимость. У агентов соотношение входных и выходных токенов крайне неравномерное — в Manus оно составляет примерно 100:1.
Вот, что говорит команда Manus:
1. Агент часто создаёт список задач и постоянно его обновляет, отмечая выполненные пункты. Это способ управления вниманием. Без этого он может потеряться в длинных задачах.
Что делать: Не удаляйте эти файлы во время работы. Если хотите добавить пункт в план — лучше скажите агенту словами, а не редактируйте файл напрямую.
2. Агент делает неправильное действие, получает ошибку, но не стирает неудачную попытку из истории.
Что делать: Дайте агенту возможность исправиться. Фраза "попробуй другой подход" работает лучше, чем "сделай заново".
3. Как правильно формулировать задачи? Структурируйте запросы последовательно. Агент работает пошагово. Чёткая структура помогает ему не потеряться и выполнить всё по порядку.
4. Работа с файлами и памятью. Агент создаёт множество промежуточных файлов, сохраняет данные в разные места.
Что делать:
Не удаляйте рабочие файлы до завершения задачи. Если нужно освободить место — спросите агента, какие файлы можно удалить. Организуйте рабочую папку заранее: создайте структуру папок для проекта.
5. Почему агент повторяет похожие действия?
При обработке однотипных задач агент начинает действовать по шаблону.
Что делать:
- Разбивайте большие однотипные задачи на части
- Периодически давайте промежуточную обратную связь
- Просите агента "подумать о разных подходах" для каждого элемента.
6. Оптимизация скорости работы.Держите контекст стабильным:
- Не меняйте инструкции в середине задачи
- Избегайте противоречивых требований
- Добавляйте новую информацию, а не переписывайте старую.
Используйте файлы для больших данных.
Manus говорит:Проектируйте ИИ-агентов с учётом KV-кэша
— это самая важная метрика для продакшн-агента, она напрямую влияет на задержку и стоимость. У агентов соотношение входных и выходных токенов крайне неравномерное — в Manus оно составляет примерно 100:1.
Вот, что говорит команда Manus:
1. Агент часто создаёт список задач и постоянно его обновляет, отмечая выполненные пункты. Это способ управления вниманием. Без этого он может потеряться в длинных задачах.
Что делать: Не удаляйте эти файлы во время работы. Если хотите добавить пункт в план — лучше скажите агенту словами, а не редактируйте файл напрямую.
2. Агент делает неправильное действие, получает ошибку, но не стирает неудачную попытку из истории.
Что делать: Дайте агенту возможность исправиться. Фраза "попробуй другой подход" работает лучше, чем "сделай заново".
3. Как правильно формулировать задачи? Структурируйте запросы последовательно. Агент работает пошагово. Чёткая структура помогает ему не потеряться и выполнить всё по порядку.
4. Работа с файлами и памятью. Агент создаёт множество промежуточных файлов, сохраняет данные в разные места.
Что делать:
Не удаляйте рабочие файлы до завершения задачи. Если нужно освободить место — спросите агента, какие файлы можно удалить. Организуйте рабочую папку заранее: создайте структуру папок для проекта.
5. Почему агент повторяет похожие действия?
При обработке однотипных задач агент начинает действовать по шаблону.
Что делать:
- Разбивайте большие однотипные задачи на части
- Периодически давайте промежуточную обратную связь
- Просите агента "подумать о разных подходах" для каждого элемента.
6. Оптимизация скорости работы.Держите контекст стабильным:
- Не меняйте инструкции в середине задачи
- Избегайте противоречивых требований
- Добавляйте новую информацию, а не переписывайте старую.
Используйте файлы для больших данных.
manus.im
Context Engineering for AI Agents: Lessons from Building Manus
This post shares the local optima Manus arrived at through our own "SGD". If you're building your own AI agent, we hope these principles help you converge faster.
👍15🔥10🐳3❤2
Международный валютный фонд:стейблкойны стали цифровым $ для развивающихся стран
За 2024 год $2 трлн общий объем транзакций в стейблкоинах:
1. США: $633 млрд
2. Азия и Тихоокеанский регион: $519 млрд.
Относительно ВВП наиболее значимы потоки в:
- Латинской Америке и Карибском бассейне: 7.7% от ВВП
- Африке и Ближнем Востоке: 6.7% от ВВП.
USDT популярен в развивающихся регионах (Африка, Азия, Латинская Америка), а USDC доминирует в развитых экономиках (Европа, Северная Америка).
Обход традиционной финансовой системы через стейблкоины, которые
решают проблемы, которые не могут банки:
- Быстрые международные переводы
- Доступ к $ там, где его ограничивают. Особенно актуально для стран с валютными ограничениями.
$18 млрд чистых притоков в Китай через стейблкойны:
- Несмотря на официальный запрет криптовалют
- Массовое использование VPN для доступа к Binance
- Это фактически капитальное бегство, замаскированное под криптотранзакции.
К чему это ведет?
Фрагментация валютной системы - $ остается главным, но теперь "течет" через новые каналы.
Снижение эффективности валютного регулирования - стейблкойны помогают его обходить.
Новые инструменты монетарной политики - центробанкам придется учитывать крипто-потоки.
По сути, это параллельная международная денежная система, где стейблкойны выполняют функции, которые раньше были монополией банков и государств.
За 2024 год $2 трлн общий объем транзакций в стейблкоинах:
1. США: $633 млрд
2. Азия и Тихоокеанский регион: $519 млрд.
Относительно ВВП наиболее значимы потоки в:
- Латинской Америке и Карибском бассейне: 7.7% от ВВП
- Африке и Ближнем Востоке: 6.7% от ВВП.
USDT популярен в развивающихся регионах (Африка, Азия, Латинская Америка), а USDC доминирует в развитых экономиках (Европа, Северная Америка).
Обход традиционной финансовой системы через стейблкоины, которые
решают проблемы, которые не могут банки:
- Быстрые международные переводы
- Доступ к $ там, где его ограничивают. Особенно актуально для стран с валютными ограничениями.
$18 млрд чистых притоков в Китай через стейблкойны:
- Несмотря на официальный запрет криптовалют
- Массовое использование VPN для доступа к Binance
- Это фактически капитальное бегство, замаскированное под криптотранзакции.
К чему это ведет?
Фрагментация валютной системы - $ остается главным, но теперь "течет" через новые каналы.
Снижение эффективности валютного регулирования - стейблкойны помогают его обходить.
Новые инструменты монетарной политики - центробанкам придется учитывать крипто-потоки.
По сути, это параллельная международная денежная система, где стейблкойны выполняют функции, которые раньше были монополией банков и государств.
👍14❤5🔥3
Google только что представили новую платформу для оценки ИИ
Современные ИИ-бенчмарки с трудом успевают за современными моделями. Хотя они полезны для измерения производительности модели в конкретных задачах, трудно понять, действительно ли модели, обученные на интернет-данных, решают проблемы или просто запоминают ответы.
Kaggle Game Arena - платформа с открытым исходным кодом, где модели соревнуются в сложных играх, чтобы помочь оценить их возможности. Game Arena построена на платформе Kaggle для справедливой, стандартизированной среды оценки моделей.
Google говорит, что игры могут служить отличной площадкой для измерения широкого спектра способностей, которые мы часто интерпретируем как интеллект.
Напомним, что Google и Anthropic часто заставляют свои последние модели играть в игры. Об этом мы писали и объясняли тут.
Завтра 5 августа состоится специальная шахматная выставка, где 8 передовых моделей сразятся в турнире на выбывание. Мероприятие будет проводиться лучшими шахматными экспертами мира.
Современные ИИ-бенчмарки с трудом успевают за современными моделями. Хотя они полезны для измерения производительности модели в конкретных задачах, трудно понять, действительно ли модели, обученные на интернет-данных, решают проблемы или просто запоминают ответы.
Kaggle Game Arena - платформа с открытым исходным кодом, где модели соревнуются в сложных играх, чтобы помочь оценить их возможности. Game Arena построена на платформе Kaggle для справедливой, стандартизированной среды оценки моделей.
Google говорит, что игры могут служить отличной площадкой для измерения широкого спектра способностей, которые мы часто интерпретируем как интеллект.
Напомним, что Google и Anthropic часто заставляют свои последние модели играть в игры. Об этом мы писали и объясняли тут.
Завтра 5 августа состоится специальная шахматная выставка, где 8 передовых моделей сразятся в турнире на выбывание. Мероприятие будет проводиться лучшими шахматными экспертами мира.
Kaggle
Introducing Kaggle Game Arena | Kaggle
Watch models compete in complex games providing a verifiable and dynamic measure of their capabilities
👍16🔥4
Сегодня самый лучший день! Нашему каналу 9 лет! ❤️
Отдельный пост ещё будет 🐌
Отдельный пост ещё будет 🐌
4❤48🎉26🍾13🔥10❤🔥1😱1
ByteDance создали ИИ-модель, которая превзошла AlphaGeometry2 от Google и завоевала 🥇на Международной математической олимпиаде (IMO) 2025
Seed Prover показала впечатляющие результаты, решив более 50% всех задач конкурса Putnam и 78% исторических задач IMO.
Эта модель превзошла AlphaGeometry 2 от Google DeepMind и достигла 100% точности на бенчмарке miniF2F от OpenAI.
Seed Prover решает задачи, генерируя доказательства, которые проверяются Lean-компилятором. Например, задача по геометрии IMO 2025 была решена за 2 секунды, а задачи по теории чисел потребовали до 3-х дней вычислений, создавая доказательства длиной в тысячи строк кода.
Чтобы вы понимали, в Bytedance работает более 150 тыс. сотрудников. Подразделение ИИ, которое называлось Flow, было разделено на Seed (создают модели), Stone (инфраструктура и инструменты) и Flow (приложения и продукты).
Seed Prover показала впечатляющие результаты, решив более 50% всех задач конкурса Putnam и 78% исторических задач IMO.
Эта модель превзошла AlphaGeometry 2 от Google DeepMind и достигла 100% точности на бенчмарке miniF2F от OpenAI.
Seed Prover решает задачи, генерируя доказательства, которые проверяются Lean-компилятором. Например, задача по геометрии IMO 2025 была решена за 2 секунды, а задачи по теории чисел потребовали до 3-х дней вычислений, создавая доказательства длиной в тысячи строк кода.
Чтобы вы понимали, в Bytedance работает более 150 тыс. сотрудников. Подразделение ИИ, которое называлось Flow, было разделено на Seed (создают модели), Stone (инфраструктура и инструменты) и Flow (приложения и продукты).
👍9🔥7🏆4❤1🤔1