Итоги уходящей недели, то, что имеет значение в России и мире
История о том, как мы @blockchainrf умеем находить таланты мирового уровня на раннем этапе.
ИИ, агенты и новые продукты:
В Европе впервые в мире чат-бот получил сертификацию медицинского устройства
Google представил новую модель GFM для сложных корпоративных баз данных
EPFL обнаружили, что ведущие LLM плохо видят
MIT предлагает новую систему измерения экономики, учитывающую людей и ИИ-агентов
Google готовится к 1-м клиническим испытаниям препаратов, разработанных с помощью ИИ
ЦБ России выпустил кодекс этики ИИ для финрынка
Маск представил Grok 4: умеет создавать игры и работать в многоагентном режиме, но стоит дороже конкурентов
HuggingFace выпустил SmolLM3
Google DeepMind представил T5Gemma — новое поколение encoder-decoder моделей с 32 вариантами
HeyGen запустил Video Agent для end-to-end производства контента
Genspark дополнил свою линейку AI Docs к AI Slides и Sheets
Google выпустил опен сорс медмодели: MedGemma 27B для анализа медкарт и MedSigLIP для классификации
Mistral выпустил Devstral Small и Medium 2507 с улучшенными возможностями кодирования
Meta* представила работу о воплощённых ИИ-агентов для виртуальных и физических миров
Топ-5 ИИ-агентов от китайских разработчиков завоевывают Кремниевую долину
Amazon запускает маркетплейс ИИ-агентов совместно с Anthropic. И планирует вложить ещё миллиарды $ в Anthropic
ИИ-агент MiniMax создаёт монетизируемые приложения одним предложением и имеет Browser Agent Self-Hosted
ИИ-агенты приступили к работе в Goldman Sachs
Salesforce представил GTA1 — GUI агента, занявшего #1 место в OSWorld с результатом 45,2%
Исследования и разработки:
Исследователи представили Foundation Model Self-Play для многоагентных игр
GPU MODE выпустил крупнейший датасет из 40k образцов кода для GPU
Mistral опубликовал cookbook по настройке ИИ для анализа спутниковых изображений
Стартапы и инвестиции:
Стартап от экс-VP OpenAI и главы отдела материаловедения Google DeepMind оценен в $1,5 млрд, хотя ему всего 2 месяца
Varda Space получила $187 млн на производство лекарств в космосе
Криптовалюты и блокчейн:
ОАЭ отрицают совместную программу с Дуровым по золотой визе за стейкинг TON
Соцсеть Трампа запускает криптовалютный инвестфонд
Дочка Alibaba добавит стейблкоины в платёжную платформу
Ординанс о стейблкоинах Гонконга вступает в силу 1 августа
Корпоративные новости:
Цукерберг купил долю в производителе очков Ray-Ban — начало конкуренции за смену интерфейса с 📱 на 🕶️
OpenAI не смог купить стартап Windsurf, зато это удалось Google
Государственные инициативы:
В России готовится реестр ЦОДов с запретом майнинга в дата-центрах
Казахстан запустил самый мощный суперкомпьютер в Центральной Азии
Образовательные инициативы:
Anthropic запустил бесплатные курсы по API, MCP и лучшим практикам Claude Code
OpenAI опубликовал отчёт о работе с 400,000 учителями для формирования будущего ИИ в школах.
*запрещенная в России организация.
История о том, как мы @blockchainrf умеем находить таланты мирового уровня на раннем этапе.
ИИ, агенты и новые продукты:
В Европе впервые в мире чат-бот получил сертификацию медицинского устройства
Google представил новую модель GFM для сложных корпоративных баз данных
EPFL обнаружили, что ведущие LLM плохо видят
MIT предлагает новую систему измерения экономики, учитывающую людей и ИИ-агентов
Google готовится к 1-м клиническим испытаниям препаратов, разработанных с помощью ИИ
ЦБ России выпустил кодекс этики ИИ для финрынка
Маск представил Grok 4: умеет создавать игры и работать в многоагентном режиме, но стоит дороже конкурентов
HuggingFace выпустил SmolLM3
Google DeepMind представил T5Gemma — новое поколение encoder-decoder моделей с 32 вариантами
HeyGen запустил Video Agent для end-to-end производства контента
Genspark дополнил свою линейку AI Docs к AI Slides и Sheets
Google выпустил опен сорс медмодели: MedGemma 27B для анализа медкарт и MedSigLIP для классификации
Mistral выпустил Devstral Small и Medium 2507 с улучшенными возможностями кодирования
Meta* представила работу о воплощённых ИИ-агентов для виртуальных и физических миров
Топ-5 ИИ-агентов от китайских разработчиков завоевывают Кремниевую долину
Amazon запускает маркетплейс ИИ-агентов совместно с Anthropic. И планирует вложить ещё миллиарды $ в Anthropic
ИИ-агент MiniMax создаёт монетизируемые приложения одним предложением и имеет Browser Agent Self-Hosted
ИИ-агенты приступили к работе в Goldman Sachs
Salesforce представил GTA1 — GUI агента, занявшего #1 место в OSWorld с результатом 45,2%
Исследования и разработки:
Исследователи представили Foundation Model Self-Play для многоагентных игр
GPU MODE выпустил крупнейший датасет из 40k образцов кода для GPU
Mistral опубликовал cookbook по настройке ИИ для анализа спутниковых изображений
Стартапы и инвестиции:
Стартап от экс-VP OpenAI и главы отдела материаловедения Google DeepMind оценен в $1,5 млрд, хотя ему всего 2 месяца
Varda Space получила $187 млн на производство лекарств в космосе
Криптовалюты и блокчейн:
ОАЭ отрицают совместную программу с Дуровым по золотой визе за стейкинг TON
Соцсеть Трампа запускает криптовалютный инвестфонд
Дочка Alibaba добавит стейблкоины в платёжную платформу
Ординанс о стейблкоинах Гонконга вступает в силу 1 августа
Корпоративные новости:
Цукерберг купил долю в производителе очков Ray-Ban — начало конкуренции за смену интерфейса с 📱 на 🕶️
OpenAI не смог купить стартап Windsurf, зато это удалось Google
Государственные инициативы:
В России готовится реестр ЦОДов с запретом майнинга в дата-центрах
Казахстан запустил самый мощный суперкомпьютер в Центральной Азии
Образовательные инициативы:
Anthropic запустил бесплатные курсы по API, MCP и лучшим практикам Claude Code
OpenAI опубликовал отчёт о работе с 400,000 учителями для формирования будущего ИИ в школах.
*запрещенная в России организация.
❤6👍4🔥4
Китайцы снова всех взбодрили, что даже OpenAI отложили выпуск своей open source модели
Самая обсуждаемая новая ИИ-модель - китайская Kimi K2 от Moonshot https://tttttt.me/alwebbci/3453
K2 переживает свой мини-момент DeepSeek благодаря тому, что open-source, своей высокой производительности (на уровне/ выше Claude 3.5 Sonnet в некоторых задачах) и низкой стоимости (20% от Claude).
Из интересных фактов: CEO Moonshot AI был первым автором XLNet и TransformerXL, внёс значительный вклад в развитие NLP.
Он особенно хорош для кодирования, генерации UI и агентских задач, что делает его отличным выбором для разработчиков и компаний с ограниченным бюджетом.
Claude 4 может быть лучше в сценариях, требующих высокой стабильности и точного следования инструкциям.
Возможна эффектная интеграция Kimi K2 с Claude Code, но для сложных задач лучше рассмотреть другие платформы, такие как opencode/cline.
Вчера Сэм Альтман написал, что они планировали выпуск своей опен сорс модели на этой неделе, но им ещё нужно время на доработку. Его сообщение вышло после релиза K2.
Самая обсуждаемая новая ИИ-модель - китайская Kimi K2 от Moonshot https://tttttt.me/alwebbci/3453
K2 переживает свой мини-момент DeepSeek благодаря тому, что open-source, своей высокой производительности (на уровне/ выше Claude 3.5 Sonnet в некоторых задачах) и низкой стоимости (20% от Claude).
Из интересных фактов: CEO Moonshot AI был первым автором XLNet и TransformerXL, внёс значительный вклад в развитие NLP.
Он особенно хорош для кодирования, генерации UI и агентских задач, что делает его отличным выбором для разработчиков и компаний с ограниченным бюджетом.
Claude 4 может быть лучше в сценариях, требующих высокой стабильности и точного следования инструкциям.
Возможна эффектная интеграция Kimi K2 с Claude Code, но для сложных задач лучше рассмотреть другие платформы, такие как opencode/cline.
Вчера Сэм Альтман написал, что они планировали выпуск своей опен сорс модели на этой неделе, но им ещё нужно время на доработку. Его сообщение вышло после релиза K2.
Telegram
All about AI, Web 3.0, BCI
China’s Kimi K2 is having its mini DeepSeek moment: Open-Source Agentic Model
1. 1T total / 32B active MoE model
2. SOTA on SWE Bench Verified, Tau2 & AceBench among open models
3. Strong in coding and agentic tasks
4. Multimodal & thought-mode not supported…
1. 1T total / 32B active MoE model
2. SOTA on SWE Bench Verified, Tau2 & AceBench among open models
3. Strong in coding and agentic tasks
4. Multimodal & thought-mode not supported…
👍13❤5
Как 8 млн жителей Долины "переиграли" 1,7 млрд человек из трех стран: Индии, Японии и Германии
Согласно последним данным, рыночная стоимость всех публичных компаний в регионе Bay Area (область залива Сан-Франциско) с населением 8 млн человек превышает совокупную стоимость компаний Индии, Японии и Германии вместе взятых (население ~1,68 млрд человек).
Формула успеха Кремниевой долины: высокая концентрация венчурных инвесторов с капиталом + таланты из Стэнфорда и Беркли + развитая экосистема поставщиков и юристов + культура риска = более быстрые итерации и больше стартапов, что привлекает еще больше капитала и талантов.
Знания в Долине распространяются за 20 минут, а не через часовые пояса. Именно поэтому этот регион называют глобальным центром инноваций.
Механизм этого успеха легко объяснить:
1. рост происходит в процентах, а не фиксированными суммами - поэтому разрыв увеличивается экспоненциально
2. "богатые становятся еще богаче"
3. пользователи и идеи усиливают друг друга
4. работа рядом друг с другом снижает время и затраты.
Такой же цикл могут создать завтрашние центры инноваций в других городах: Бангалор, Шэньчжэнь, если там появятся первоначальные преимущества, которые начнут накапливаться.
Согласно последним данным, рыночная стоимость всех публичных компаний в регионе Bay Area (область залива Сан-Франциско) с населением 8 млн человек превышает совокупную стоимость компаний Индии, Японии и Германии вместе взятых (население ~1,68 млрд человек).
Формула успеха Кремниевой долины: высокая концентрация венчурных инвесторов с капиталом + таланты из Стэнфорда и Беркли + развитая экосистема поставщиков и юристов + культура риска = более быстрые итерации и больше стартапов, что привлекает еще больше капитала и талантов.
Знания в Долине распространяются за 20 минут, а не через часовые пояса. Именно поэтому этот регион называют глобальным центром инноваций.
Механизм этого успеха легко объяснить:
1. рост происходит в процентах, а не фиксированными суммами - поэтому разрыв увеличивается экспоненциально
2. "богатые становятся еще богаче"
3. пользователи и идеи усиливают друг друга
4. работа рядом друг с другом снижает время и затраты.
Такой же цикл могут создать завтрашние центры инноваций в других городах: Бангалор, Шэньчжэнь, если там появятся первоначальные преимущества, которые начнут накапливаться.
🔥20👍8❤5🏆1👀1
Российские математики с помощью психологии решили задачу 57-летней давности
Иван Ремизов и Олег Галкин решили задачу, которая не давалась ученым с 1968 года. Речь идет о скорости сходимости в методе Чернова — способе вычисления полугрупп операторов.
Причём, Ремизов рассказал, что ему помогла его вторая специальность – практикующий психолог-психотерапевт. Он предположил, что предыдущие исследователи использовали слишком сложные методы, тогда как решение можно было найти более простым путем.
В 1968 году американский математик Пол Чернов предложил метод последовательных приближений для вычисления полугрупп в сложных случаях. Метод работал, но никто не знал, сколько шагов потребуется для достижения нужной точности.
Ремизов и Галкин нашли условия, при выполнении которых можно заранее определить скорость сходимости метода Чернова.
Ключевой элемент доказательства — простая алгебраическая формула для выражения X^n-Y^n.
Результат позволит исследовательским институтам по всему миру более эффективно решать задачи в:
1. Термодинамике
2. Квантовой механике и квантовой информатике
3. Теории управления
4. Транспортных задачах.
Иван Ремизов и Олег Галкин решили задачу, которая не давалась ученым с 1968 года. Речь идет о скорости сходимости в методе Чернова — способе вычисления полугрупп операторов.
Причём, Ремизов рассказал, что ему помогла его вторая специальность – практикующий психолог-психотерапевт. Он предположил, что предыдущие исследователи использовали слишком сложные методы, тогда как решение можно было найти более простым путем.
В 1968 году американский математик Пол Чернов предложил метод последовательных приближений для вычисления полугрупп в сложных случаях. Метод работал, но никто не знал, сколько шагов потребуется для достижения нужной точности.
Ремизов и Галкин нашли условия, при выполнении которых можно заранее определить скорость сходимости метода Чернова.
Ключевой элемент доказательства — простая алгебраическая формула для выражения X^n-Y^n.
Результат позволит исследовательским институтам по всему миру более эффективно решать задачи в:
1. Термодинамике
2. Квантовой механике и квантовой информатике
3. Теории управления
4. Транспортных задачах.
SpringerLink
Upper and lower estimates for rate of convergence in the Chernoff product formula for semigroups of operators
Israel Journal of Mathematics - This paper studies the rates of convergence of Chernoff approximations to operator semigroups. We show that the convergence, in general, can be arbitrarily fast or...
🔥22👍9⚡8❤2🏆2
ИИ-агенты замедляют работу программистов на 19% — исследование METR
METR опубликовала исследование, которое противоречит популярному мнению об эффективности ИИ-агентов в программировании.
Анализ показал, что при работе с ИИ-агентами:
1. Меньше времени тратят на активное программирование (25% vs 37% без ИИ)
2. Больше времени уходит на промптинг ИИ, ожидание ответов и проверку выводов
3. Много времени уходит на исправление ошибок, которые вносит ИИ-код.
4. Новые модели (Opus 4, o3) работают значительно лучше предыдущих версий.
Важный методологический момент - разработчики выбирали для исследования только определенные типы задач, избегая критически важных проектов.
METR честно признает ограничения:
- Исследование не охватывает всю разработку ПО
- Не делает выводов о будущих возможностях ИИ
- Фокусируется на создании системы раннего предупреждения для ускорения R&D ИИ
Исследование показывает 2 важных момента:
1. разработчики переоценивают влияние ИИ на свою продуктивность
2. вместо опросов следует измерять фактические результаты.
Результаты не означают, что ИИ бесполезен в программировании, но подчеркивают необходимость более осознанного подхода к его использованию. При быстром развитии ИИ-моделей эти выводы могут быстро устареть, но методология измерения реального воздействия остается актуальной.
METR опубликовала исследование, которое противоречит популярному мнению об эффективности ИИ-агентов в программировании.
Анализ показал, что при работе с ИИ-агентами:
1. Меньше времени тратят на активное программирование (25% vs 37% без ИИ)
2. Больше времени уходит на промптинг ИИ, ожидание ответов и проверку выводов
3. Много времени уходит на исправление ошибок, которые вносит ИИ-код.
4. Новые модели (Opus 4, o3) работают значительно лучше предыдущих версий.
Важный методологический момент - разработчики выбирали для исследования только определенные типы задач, избегая критически важных проектов.
METR честно признает ограничения:
- Исследование не охватывает всю разработку ПО
- Не делает выводов о будущих возможностях ИИ
- Фокусируется на создании системы раннего предупреждения для ускорения R&D ИИ
Исследование показывает 2 важных момента:
1. разработчики переоценивают влияние ИИ на свою продуктивность
2. вместо опросов следует измерять фактические результаты.
Результаты не означают, что ИИ бесполезен в программировании, но подчеркивают необходимость более осознанного подхода к его использованию. При быстром развитии ИИ-моделей эти выводы могут быстро устареть, но методология измерения реального воздействия остается актуальной.
metr.org
Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity
We conduct a randomized controlled trial to understand how early-2025 AI tools affect the productivity of experienced open-source developers working on their own repositories. Surprisingly, we find that when developers use AI tools, they take 19% longer than…
💯11❤5🤣5👍3🤯1
Прочитайте и запомните этот пост, и через пару месяцев вы станете свидетелями того, что миру будет презентовано. Это будет совершенно новый продукт, не представленный ранее.
Мы @blockchainrf знаем о трендах ещё до того, как об этом узнают жители Долины😎
Мы @blockchainrf знаем о трендах ещё до того, как об этом узнают жители Долины😎
❤🔥11👍7👌2🥴1👀1😎1
Meta* может уйти от open source и создаёт 2 гигантских суперкластера для ИИ мощностью в несколько гигаватт.
Новая лаборатория MSL рассматривает идею прекращения поддержки Behemoth — открытой модели ИИ Meta. Вместо этого планирует сосредоточиться на разработке закрытой модели. Это сейчас обсуждается среди новых членов команды. Марк Цукерберг пока не дал на это одобрения.
Между тем, вчера Цукерберг заявил, что строится 2 вычислительных кластера — «Prometheus», который начнёт работать в 2026 году, и «Hyperion», масштабом сравнимый с большей частью Манхэттена, он сможет масштабироваться до 5 гигаватт за несколько лет
По данным SemiAnalysis, Meta станет первой лабораторией, которая запустит суперкластер мощностью 1 гигаватт+.
Для ускорения развертывания компания отказалась от традиционных дата-центров в пользу модульных "палаточных" конструкций. Для обеспечения энергией строятся собственные газовые электростанции.
В этом году компания потратит до $72 млрд на капвложения, в основном на ИИ-дата-центры.
Для сравнения, OpenAI планирует потратить $320 млрд с 2025 по 2030 год, но вынуждена постоянно привлекать внешние инвестиции. xAI Илона Маска "скребет деньги по углам" из всей империи Маска. Так SpaceX инвестирует $2 млрд в xAI, но у SpaceX и Tesla есть собственные потребности в капитале.
Ключевое преимущество Meta - самофинансирование за счёт рекламного бизнеса, генерирующего ~$100 млрд в год. Это создаёт давление на конкурентов вроде OpenAI и xAI, которые зависят от внешнего финансирования.
Цукерберг скорее всего делает агрессивные заявления об инвестициях на ИИ, чтобы психологически давить на конкурентов.
*запрещенная в России организация.
Новая лаборатория MSL рассматривает идею прекращения поддержки Behemoth — открытой модели ИИ Meta. Вместо этого планирует сосредоточиться на разработке закрытой модели. Это сейчас обсуждается среди новых членов команды. Марк Цукерберг пока не дал на это одобрения.
Между тем, вчера Цукерберг заявил, что строится 2 вычислительных кластера — «Prometheus», который начнёт работать в 2026 году, и «Hyperion», масштабом сравнимый с большей частью Манхэттена, он сможет масштабироваться до 5 гигаватт за несколько лет
По данным SemiAnalysis, Meta станет первой лабораторией, которая запустит суперкластер мощностью 1 гигаватт+.
Для ускорения развертывания компания отказалась от традиционных дата-центров в пользу модульных "палаточных" конструкций. Для обеспечения энергией строятся собственные газовые электростанции.
В этом году компания потратит до $72 млрд на капвложения, в основном на ИИ-дата-центры.
Для сравнения, OpenAI планирует потратить $320 млрд с 2025 по 2030 год, но вынуждена постоянно привлекать внешние инвестиции. xAI Илона Маска "скребет деньги по углам" из всей империи Маска. Так SpaceX инвестирует $2 млрд в xAI, но у SpaceX и Tesla есть собственные потребности в капитале.
Ключевое преимущество Meta - самофинансирование за счёт рекламного бизнеса, генерирующего ~$100 млрд в год. Это создаёт давление на конкурентов вроде OpenAI и xAI, которые зависят от внешнего финансирования.
Цукерберг скорее всего делает агрессивные заявления об инвестициях на ИИ, чтобы психологически давить на конкурентов.
*запрещенная в России организация.
Threads
Mark Zuckerberg (@zuck) on Threads
For our superintelligence effort, I'm focused on building the most elite and talent-dense team in the industry. We're also going to invest hundreds of billions of dollars into compute to build...
❤8🤯1
Казахстан хочет вложить часть средств Нацфонда в криптовалюты
Об этом заявил глава Национального банка страны Тимур Сулейменов. Он говорит, что Казахстан смотрит на опыт Норвежского фонда, США и ближневосточных фондов.
Хотя Казахстан — относительно небольшая экономика, но она играет роль в криптоиндустрии. На страну приходится около 13% глобального хешрейта биткоина.
При этом глава Нацбанка заявил, что они хотят создать отдельный госрезерв криптовалют из конфискованных у преступников.
Об этом заявил глава Национального банка страны Тимур Сулейменов. Он говорит, что Казахстан смотрит на опыт Норвежского фонда, США и ближневосточных фондов.
Хотя Казахстан — относительно небольшая экономика, но она играет роль в криптоиндустрии. На страну приходится около 13% глобального хешрейта биткоина.
При этом глава Нацбанка заявил, что они хотят создать отдельный госрезерв криптовалют из конфискованных у преступников.
The Block
Kazakhstan mulls investing national reserves into crypto: report
The move would follow a trend of countries around the world further embracing digital assets in one way or another.
👍5
Apple создали 1-ю модель для анализа поведенческих данных человека с Apple Watch и iPhone.
WBM (Wearable Behavior foundation Model) - 1-я большая фундаментальная модель для анализа поведенческих данных с носимых устройств. Она обучена на 2,5 миллиардах часов данных от 162 тысяч участников исследования Apple Heart and Movement Study.
Модель не публикуется из-за ограничений согласия участников исследования.
Это уже 2-й крупный проект Apple в области анализа биологических данных человека после представления протокола BCI HID для нейроинтерфейсов в мае.
Вместо анализа сырых сенсорных данных (пульс, акселерометр) команда сосредоточилась на поведенческих метриках:
количестве шагов, времени активности, показателях походки, качестве сна. Эти данные агрегируются по часам и анализируются недельными интервалами.
Модель проверили на 57 задачах прогнозирования состояний здоровья:
1. Определение базовых характеристик (возраст, пол, хронические заболевания)
2.Отслеживание временных изменений (беременность, инфекции, травмы)
3.Анализ качества сна.
WBM показала особенно хорошие результаты в задачах, где важны поведенческие паттерны: прогнозирование сна, обнаружение беременности (точность >90%), выявление респираторных инфекций.
Потенциальные применения: мониторинг хронических заболеваний, раннее выявление изменений в состоянии здоровья, персонализация рекомендаций по здоровью.
Ограничения:
- Данные только с устройств Apple
- Выборка не полностью репрезентативна для населения США
- Часть диагнозов основана на самоотчетах пользователей.
WBM (Wearable Behavior foundation Model) - 1-я большая фундаментальная модель для анализа поведенческих данных с носимых устройств. Она обучена на 2,5 миллиардах часов данных от 162 тысяч участников исследования Apple Heart and Movement Study.
Модель не публикуется из-за ограничений согласия участников исследования.
Это уже 2-й крупный проект Apple в области анализа биологических данных человека после представления протокола BCI HID для нейроинтерфейсов в мае.
Вместо анализа сырых сенсорных данных (пульс, акселерометр) команда сосредоточилась на поведенческих метриках:
количестве шагов, времени активности, показателях походки, качестве сна. Эти данные агрегируются по часам и анализируются недельными интервалами.
Модель проверили на 57 задачах прогнозирования состояний здоровья:
1. Определение базовых характеристик (возраст, пол, хронические заболевания)
2.Отслеживание временных изменений (беременность, инфекции, травмы)
3.Анализ качества сна.
WBM показала особенно хорошие результаты в задачах, где важны поведенческие паттерны: прогнозирование сна, обнаружение беременности (точность >90%), выявление респираторных инфекций.
Потенциальные применения: мониторинг хронических заболеваний, раннее выявление изменений в состоянии здоровья, персонализация рекомендаций по здоровью.
Ограничения:
- Данные только с устройств Apple
- Выборка не полностью репрезентативна для населения США
- Часть диагнозов основана на самоотчетах пользователей.
🔥10❤3👍3🤬1
Google представили инструмент для создания виртуальных миров, где множество ИИ-агентов могут взаимодействовать друг с другом в различных сценариях.
Concordia 2.0 - это обновленная библиотека для построения симуляций с несколькими ИИ-агентами.
Разработчики подходят к многоагентному генеративному ИИ как к игровому движку. Это любимый подход СЕО DeepMind.
Возможности применения:
1. Симуляции социальных наук
2. Оценка LLM
3. Интерактивные нарративы
4. Генерация синтетических данных для обучения других ИИ-систем.
Concordia 2.0 - это обновленная библиотека для построения симуляций с несколькими ИИ-агентами.
Разработчики подходят к многоагентному генеративному ИИ как к игровому движку. Это любимый подход СЕО DeepMind.
Возможности применения:
1. Симуляции социальных наук
2. Оценка LLM
3. Интерактивные нарративы
4. Генерация синтетических данных для обучения других ИИ-систем.
Telegram
All about AI, Web 3.0, BCI
Google DeepMind introduced Concordia 2.0, an update to Google’s library for building multi-actor LLM simulations
At the core:
- Entity-Component Architecture — where even the “Game Master” (GM) is just another configurable entity
- Engineers build components…
At the core:
- Entity-Component Architecture — where even the “Game Master” (GM) is just another configurable entity
- Engineers build components…
🔥8
США сняли ограничения на продажу ИИ-чипов Китаю, речь идет о H20 от Nvidia
Дженсен Хуанг оказался на одном уровне с Илоном Маском, лоббирующим интересы своего бизнеса в Китае.
Снятие ограничений связано с доминированием Китая в сфере редкоземельных металлов: диспрозий, галлий и германий, которые необходимы для производства полупроводников. Китай контролирует ~ 90% мировой переработки редкоземельных металлов, что делает его критически важным игроком в глобальной цепочке поставок технологий.
Запрет на продажу H20 стал серьезным ударом для Nvidia, так как Китай является ключевым рынком, на который приходится около 13% от общего дохода компании ($17 млрд в последнем финансовом году).
Ограничения привели к тому, что Nvidia была вынуждена списать $5,5 млрд из-за невозможности продать запасы чипов H20 и выполнить обязательства по заказам.
В дополнение к возобновлению продаж H20, Дженсен Хуанг анонсировал новый графический процессор для китайского рынка — RTX PRO GPU, основанный на новейшей технологии Blackwell. Этот чип, по словам Хуанга, разработан с учетом требований экспортного контроля и предназначен для использования в «умных» фабриках и логистике.
Дженсен Хуанг оказался на одном уровне с Илоном Маском, лоббирующим интересы своего бизнеса в Китае.
Снятие ограничений связано с доминированием Китая в сфере редкоземельных металлов: диспрозий, галлий и германий, которые необходимы для производства полупроводников. Китай контролирует ~ 90% мировой переработки редкоземельных металлов, что делает его критически важным игроком в глобальной цепочке поставок технологий.
Запрет на продажу H20 стал серьезным ударом для Nvidia, так как Китай является ключевым рынком, на который приходится около 13% от общего дохода компании ($17 млрд в последнем финансовом году).
Ограничения привели к тому, что Nvidia была вынуждена списать $5,5 млрд из-за невозможности продать запасы чипов H20 и выполнить обязательства по заказам.
В дополнение к возобновлению продаж H20, Дженсен Хуанг анонсировал новый графический процессор для китайского рынка — RTX PRO GPU, основанный на новейшей технологии Blackwell. Этот чип, по словам Хуанга, разработан с учетом требований экспортного контроля и предназначен для использования в «умных» фабриках и логистике.
NY Times
Nvidia Says U.S. Has Lifted Restrictions on A.I. Chip Sales to China
The Silicon Valley chip giant said the Trump administration, which had shut down its sales to China three months ago, had assured it that licenses for the sales would now be granted.
👍9😁8❤4🐳2
Лучшие ИИ-модели справляются только с половиной реальных финзадач.
Согласно лидерборду Snorkel AI, у которой есть платформа Snorkel Flow(помогает компаниям разрабатывать специализированные наборы данных и модели ИИ) выявлено, что лучшие ИИ-модели справляются только с половиной реальных финансовых задач (52% у Claude 3.7), хотя на академических тестах показывают 90%+.
Разрыв между 90%+ на MMLU и 51.9% на Finance Reasoning показывает, что индустрия оценивает ИИ по неправильным метрикам. Умение отвечать на вопросы из учебников кардинально отличается от способности работать с реальными бизнес-задачами.
Агентские возможности — это узкое место современных LLM
Все топовые модели проваливаются на задачах, требующих:
- Многошагового планирования (в среднем 12 шагов)
- Работы с инструментами (SQL, анализ документов)
- Самокоррекции при ошибках
- Интеграции разрозненной информации.
Это говорит о том, что текущая архитектура LLM плохо подходит для автономной работы в сложных средах.
Специализация домена критически важна
51.9% точности даже у лучших моделей на финансовых задачах показывает, что универсальные LLM недостаточны для корпоративного применения. Нужны либо специализированные модели, либо кардинально другие подходы к обучению.
Проблема не в размере модели, а в подходе
Факт, что открытые модели показывают 10-20% при том, что закрытые достигают 50-80%, указывает не только на разницу в вычислительных ресурсах, но и на фундаментальные различия в архитектуре или методах обучения.
Корпоративные ожидания завышены.
Если модели с трудом справляются с анализом финансовых документов (задача, которую делают тысячи аналитиков), то автоматизация более сложных бизнес-процессов пока невозможна. Это объясняет, почему многие корпоративные внедрения ИИ не оправдывают ожиданий.
Неструктурированные данные остаются проблемой.
Нужны новые метрики и подходы к оценке
Традиционные бенчмарки не только бесполезны, но и вредны — они создают ложное ощущение прогресса.
Ближайшее будущее — гибридные системы
Раз ИИ не может автономно решать сложные задачи, логичный путь — системы с участием человека, где ИИ берет на себя рутинные операции, а человек — контроль и принятие решений.
Согласно лидерборду Snorkel AI, у которой есть платформа Snorkel Flow(помогает компаниям разрабатывать специализированные наборы данных и модели ИИ) выявлено, что лучшие ИИ-модели справляются только с половиной реальных финансовых задач (52% у Claude 3.7), хотя на академических тестах показывают 90%+.
Разрыв между 90%+ на MMLU и 51.9% на Finance Reasoning показывает, что индустрия оценивает ИИ по неправильным метрикам. Умение отвечать на вопросы из учебников кардинально отличается от способности работать с реальными бизнес-задачами.
Агентские возможности — это узкое место современных LLM
Все топовые модели проваливаются на задачах, требующих:
- Многошагового планирования (в среднем 12 шагов)
- Работы с инструментами (SQL, анализ документов)
- Самокоррекции при ошибках
- Интеграции разрозненной информации.
Это говорит о том, что текущая архитектура LLM плохо подходит для автономной работы в сложных средах.
Специализация домена критически важна
51.9% точности даже у лучших моделей на финансовых задачах показывает, что универсальные LLM недостаточны для корпоративного применения. Нужны либо специализированные модели, либо кардинально другие подходы к обучению.
Проблема не в размере модели, а в подходе
Факт, что открытые модели показывают 10-20% при том, что закрытые достигают 50-80%, указывает не только на разницу в вычислительных ресурсах, но и на фундаментальные различия в архитектуре или методах обучения.
Корпоративные ожидания завышены.
Если модели с трудом справляются с анализом финансовых документов (задача, которую делают тысячи аналитиков), то автоматизация более сложных бизнес-процессов пока невозможна. Это объясняет, почему многие корпоративные внедрения ИИ не оправдывают ожиданий.
Неструктурированные данные остаются проблемой.
Нужны новые метрики и подходы к оценке
Традиционные бенчмарки не только бесполезны, но и вредны — они создают ложное ощущение прогресса.
Ближайшее будущее — гибридные системы
Раз ИИ не может автономно решать сложные задачи, логичный путь — системы с участием человека, где ИИ берет на себя рутинные операции, а человек — контроль и принятие решений.
❤14👍7
Слушайте, а что от OpenAI останется? Ещё 2 лучших исследователей переходят к Цукербергу - Джейсон Вэй и Хён Вон Чунг
Вэй участвовал в разработке моделей O3 и Deep Research. Он присоединился к OpenAI в 2023 году после работы в Google, где занимался исследованиями в области chain-of-thought — метода, обучающего ИИ-модели последовательно обрабатывать сложные запросы.
Чун также работал над проектами Deep Research и моделью O1 вместе с Вэем. Чун, как и Вэй, ранее работал в Google и присоединился к OpenAI одновременно с ним.
Если вы тоже хотите, чтобы вас купил Цукерберг, оставьте коммент у нас под этим постом 😁
Вэй участвовал в разработке моделей O3 и Deep Research. Он присоединился к OpenAI в 2023 году после работы в Google, где занимался исследованиями в области chain-of-thought — метода, обучающего ИИ-модели последовательно обрабатывать сложные запросы.
Чун также работал над проектами Deep Research и моделью O1 вместе с Вэем. Чун, как и Вэй, ранее работал в Google и присоединился к OpenAI одновременно с ним.
Если вы тоже хотите, чтобы вас купил Цукерберг, оставьте коммент у нас под этим постом 😁
WIRED
Another High-Profile OpenAI Researcher Departs for Meta
Jason Wei, who worked on OpenAI’s o1 and deep research models, will be joining Meta’s superintelligence lab. His colleague Hyung Won Chung is also joining Meta, a source tells WIRED.
😁19🔥5❤2
Команда Цукерберга выпустила ИИ-модель, которая думает как живая клетка
Chan Zuckerberg Initiative (CZI) представили GREmLN — опен сорс модель ИИ, которая анализирует гены не как статистические данные, а как живую биологическую систему. GREmLN — часть большого проекта по созданию виртуальной модели клетки. Цель: от описания болезней перейти к их предсказанию и предотвращению на клеточном уровне. Другие проекты CZI мы описали здесь.
Обычные модели машинного обучения находят корреляции между генной активностью и болезнями, но не могут ответить на главный вопрос: какой именно ген запустил болезнь? Они видят следствия, но не причины.
GREmLN встраивает знания о генных регуляторных сетях прямо в свою архитектуру. Вместо анализа всех возможных комбинаций генов, она фокусируется только на тех взаимодействиях, которые реально происходят в клетках.
Результат: GREmLN может отследить цепочку от симптома к первопричине — найти конкретную мутацию, которая запустила каскад изменений.
Практическое значение этой модели:
Онкология: определить, какая именно мутация привела к раку
Иммунотерапия: понять, как перенастроить иммунные клетки для атаки на опухоль
Разработка лекарств: найти ключевые гены-регуляторы для точечного воздействия
Модель уже обучена на 11 миллионах клеточных профилей и доступна исследователям.
Chan Zuckerberg Initiative (CZI) представили GREmLN — опен сорс модель ИИ, которая анализирует гены не как статистические данные, а как живую биологическую систему. GREmLN — часть большого проекта по созданию виртуальной модели клетки. Цель: от описания болезней перейти к их предсказанию и предотвращению на клеточном уровне. Другие проекты CZI мы описали здесь.
Обычные модели машинного обучения находят корреляции между генной активностью и болезнями, но не могут ответить на главный вопрос: какой именно ген запустил болезнь? Они видят следствия, но не причины.
GREmLN встраивает знания о генных регуляторных сетях прямо в свою архитектуру. Вместо анализа всех возможных комбинаций генов, она фокусируется только на тех взаимодействиях, которые реально происходят в клетках.
Результат: GREmLN может отследить цепочку от симптома к первопричине — найти конкретную мутацию, которая запустила каскад изменений.
Практическое значение этой модели:
Онкология: определить, какая именно мутация привела к раку
Иммунотерапия: понять, как перенастроить иммунные клетки для атаки на опухоль
Разработка лекарств: найти ключевые гены-регуляторы для точечного воздействия
Модель уже обучена на 11 миллионах клеточных профилей и доступна исследователям.
Cziscience
GREmLN | v0.0.1 | Virtual Cells Platform
GREmLN is a graph-aware model for single-cell RNA-seq that integrates gene-regulatory network structure into its attention mechanism to address the missing positional order of gene tokens. By inducing a graph-based ordering, the model learns biologically…
👍8🔥6❤🔥4👎1😱1
Google интегрировал ИИ-агента в поиск + еще 2 новые функции в поиске
1. Теперь во время поиска через Google, например, услуг (грумеры, химчистки и т.д.) появляется опция "Have AI check pricing". ИИ самостоятельно обзванивает компании, узнает цены и доступность, затем консолидирует информацию для пользователя.
Это первое массовое внедрение ИИ-агентов, которые реально взаимодействуют с внешним миром от имени пользователя.
Эта функция доступна всем пользователям в США.
2. Deep Search-исследовательский инструмент на базе Gemini 2.5 Pro. Выполняет поисковые запросы, анализирует разрозненные источники и создает структурированный отчет с цитатами.
По сути — прямой конкурент Claude Advanced Research и Perplexity Pro, но интегрированный в основной продукт Google.
3. Доступ к Gemini 2.5 Pro в прямо в поиске через выпадающее меню.
Специализируется на сложных рассуждениях, математике и программировании. Дополняет стандартную быструю модель для базовых запросов.
Deep Search и Gemini 2.5 Pro пока доступны для подписчиков AI Pro/Ultra в США (через экспериментальную программу Labs).
Ранее Google добавлял ИИ в поиск.
1. Теперь во время поиска через Google, например, услуг (грумеры, химчистки и т.д.) появляется опция "Have AI check pricing". ИИ самостоятельно обзванивает компании, узнает цены и доступность, затем консолидирует информацию для пользователя.
Это первое массовое внедрение ИИ-агентов, которые реально взаимодействуют с внешним миром от имени пользователя.
Эта функция доступна всем пользователям в США.
2. Deep Search-исследовательский инструмент на базе Gemini 2.5 Pro. Выполняет поисковые запросы, анализирует разрозненные источники и создает структурированный отчет с цитатами.
По сути — прямой конкурент Claude Advanced Research и Perplexity Pro, но интегрированный в основной продукт Google.
3. Доступ к Gemini 2.5 Pro в прямо в поиске через выпадающее меню.
Специализируется на сложных рассуждениях, математике и программировании. Дополняет стандартную быструю модель для базовых запросов.
Deep Search и Gemini 2.5 Pro пока доступны для подписчиков AI Pro/Ultra в США (через экспериментальную программу Labs).
Ранее Google добавлял ИИ в поиск.
Google
More advanced AI capabilities are coming to Search
For Google AI Pro and AI Ultra subscribers, AI Mode in Search now features the ability to use Gemini 2.5 Pro and do deeper research for you.
🔥11❤5👍5⚡3
OpenAI внедрит в ChatGPT функцию покупки товаров
Скоро в чате можно будет купить любой товар, OpenAI и её партнёры, среди которых Shopify, уже тестируют ранние версии системы с брендами.
Это впервые позволит OpenAI монетизировать бесплатных пользователей, так как компания будет получать комиссию с каждой покупки от продавцов.
Ранее мы писали о том, как будет меняться электронная коммерция, где будут играть роль в том числе ИИ-агенты и стейблкоины.
Скоро в чате можно будет купить любой товар, OpenAI и её партнёры, среди которых Shopify, уже тестируют ранние версии системы с брендами.
Это впервые позволит OpenAI монетизировать бесплатных пользователей, так как компания будет получать комиссию с каждой покупки от продавцов.
Ранее мы писали о том, как будет меняться электронная коммерция, где будут играть роль в том числе ИИ-агенты и стейблкоины.
Ft
OpenAI to take cut of ChatGPT shopping sales in hunt for revenues
Artificial intelligence start-up has shown brands a prototype of its new checkout feature
👍4👎1
Вот это времена: инвесторы просят Anthropic взять у них деньги
К Anthropic обращаются инвесторы, которые хотят войти со своими $ в новый раунд, сегодня компания Дарио Амодея уже оценивается свыше $100 млрд.
Это почти вдвое превышает оценку 4-х месячной давности. Годовая выручка компании выросла с 3 до 4 млрд $ за последний месяц.
В течение многих лет инвесторы предполагали, что потребители не будут платить за ПО
Теперь люди с радостью платят $200+ в месяц за такие продукты, как Claude, Grok 4 Heavy и Gemini.
Не потому, что они подходят всем, а потому, что для кого-то они в 100 раз лучше.
Бесплатный уровень — это воронка продаж. Реальный продукт узкий.
К Anthropic обращаются инвесторы, которые хотят войти со своими $ в новый раунд, сегодня компания Дарио Амодея уже оценивается свыше $100 млрд.
Это почти вдвое превышает оценку 4-х месячной давности. Годовая выручка компании выросла с 3 до 4 млрд $ за последний месяц.
В течение многих лет инвесторы предполагали, что потребители не будут платить за ПО
Теперь люди с радостью платят $200+ в месяц за такие продукты, как Claude, Grok 4 Heavy и Gemini.
Не потому, что они подходят всем, а потому, что для кого-то они в 100 раз лучше.
Бесплатный уровень — это воронка продаж. Реальный продукт узкий.
Bloomberg.com
Anthropic Draws Investor Interest at More Than $100 Billion Valuation
OpenAI rival Anthropic is in the early stages of planning another investment round that could value the company at more than $100 billion, according to a person familiar with the matter.
🔥11⚡4❤1🆒1
OKX_and_Blockwords_Research_Blockchain_Applications_1752698313.pdf
3.7 MB
Новая экономмодель с
$10трлн токенизированных активов к 2030 - данные из отчета OKX и Blockworks Research.
Основные тренды:
1. Растущая волна токенизации активов - децентрализованные приложения (dApps) позволяют создавать, торговать и управлять токенизированными активами.
2. Изменения в обработке данных - переход к пользоцентричному владению данными изменит способы их сбора и использования.
3. Инновации цифровых кошельков упрощают пользовательский опыт и способствуют массовому принятию.
4. Конвергенция ИИ и крипто - ИИ позволит более эффективное программирование, а крипто создаст стимулы для развития ИИ.
5. Новые источники дохода для компаний благодаря росту dApps и цифровых активов.
Традиционные посредники будут устранены: банки, брокеры, платформы.
Появляются программируемые деньги и автоматизированные финансы. Финансовая система перестраивается - стейблкоины это новая инфраструктура (уже $180 млрд), а ИИ-агенты новые участники системы.
Walmart, LVMH, Goldman Sachs уже внедряют блокчейн и ИИ.
ИИ + блокчейн = новая операционная система экономики. ИИ-агенты будут совершать транзакции автономно.
Сегодня общая капитализация всей блокчейн-экосистемы составляет $2.6трлн.
Временные горизонты:
1. 2025-2027 - Массовое принятие стейблкоинов. Токенизация основных активов.
Регуляторная ясность.
2. 2027-2030 - 10% мирового ВВП токенизировано. ИИ-агенты как экономические акторы.
Программируемая экономика.
$10трлн токенизированных активов к 2030 - данные из отчета OKX и Blockworks Research.
Основные тренды:
1. Растущая волна токенизации активов - децентрализованные приложения (dApps) позволяют создавать, торговать и управлять токенизированными активами.
2. Изменения в обработке данных - переход к пользоцентричному владению данными изменит способы их сбора и использования.
3. Инновации цифровых кошельков упрощают пользовательский опыт и способствуют массовому принятию.
4. Конвергенция ИИ и крипто - ИИ позволит более эффективное программирование, а крипто создаст стимулы для развития ИИ.
5. Новые источники дохода для компаний благодаря росту dApps и цифровых активов.
Традиционные посредники будут устранены: банки, брокеры, платформы.
Появляются программируемые деньги и автоматизированные финансы. Финансовая система перестраивается - стейблкоины это новая инфраструктура (уже $180 млрд), а ИИ-агенты новые участники системы.
Walmart, LVMH, Goldman Sachs уже внедряют блокчейн и ИИ.
ИИ + блокчейн = новая операционная система экономики. ИИ-агенты будут совершать транзакции автономно.
Сегодня общая капитализация всей блокчейн-экосистемы составляет $2.6трлн.
Временные горизонты:
1. 2025-2027 - Массовое принятие стейблкоинов. Токенизация основных активов.
Регуляторная ясность.
2. 2027-2030 - 10% мирового ВВП токенизировано. ИИ-агенты как экономические акторы.
Программируемая экономика.
🔥5👍4❤1❤🔥1
Вот это движ: Вчера Google внедрил ИИ-агентов в поиск, сегодня OpenAI сделает похожую историю в своих продуктах, через 3 часа узнаем подробности.
Но самое крутое - это то, что Langchain представил Open Deep Research — это опен сорс инструмент для автоматизированного глубокого исследования.
Вместо одного ИИ-агента используется система подчиненных агентов, каждый из которых выполняет свою узкую задачу (поиск информации, анализ данных, написание текста и тд.).
Супервизор координирует их работу, распределяя задачи и контролируя процесс.
Но самое крутое - это то, что Langchain представил Open Deep Research — это опен сорс инструмент для автоматизированного глубокого исследования.
Вместо одного ИИ-агента используется система подчиненных агентов, каждый из которых выполняет свою узкую задачу (поиск информации, анализ данных, написание текста и тд.).
Супервизор координирует их работу, распределяя задачи и контролируя процесс.
👍15🔥2
Anthropic только что запустили Claude для финансовых услуг
Теперь Claude интегрируется с ведущими платформами данных и отраслевыми поставщиками для доступа в онлайн-режиме к комплексной финансовой информации, проверенной по внутренним и отраслевым источникам.
Теперь Claude интегрируется с ведущими платформами данных и отраслевыми поставщиками для доступа в онлайн-режиме к комплексной финансовой информации, проверенной по внутренним и отраслевым источникам.
YouTube
Claude for Financial Services Keynote
Visit https://anthropic.com/solutions/financial-services to learn more about Claude's finance-specific capabilities.
Hear directly from Anthropic executives and industry leaders at Claude for Financial Services, where Anthropic leadership and senior financial…
Hear directly from Anthropic executives and industry leaders at Claude for Financial Services, where Anthropic leadership and senior financial…
🔥7