Крутой свежий отчет о мировом рынке роботов от Morgan Stanley: роботизация будет быстрее, чем внедрение беспилотных автомобилей, благодаря контролируемым условиям применения.
В отчете делается акцент на лидерстве Китая в "теле" роботов и США в "мозге", с Tesla как ключевым интегратором.
Morgan Stanley видит человекоподобных роботов как трансформационную силу, способную изменить рынок труда и глобальную экономику к 2050 году. Однако успех зависит от преодоления текущих барьеров и конкуренции между Востоком и Западом.
Вот ключевые моменты из отчета:
1. Экономический потенциал
Глобальный рынок к 2050 году рынок может достичь $10–12 трлн.
В США 2040 году будет до 8,4 млн роботов, экономический эффект от этого $357 млрд.
К 2050 году: до 63 млн роботов, замещающих 75% рабочей силы, с эффектом в $3 трлн.
Китайский рынок - 6 триллионов юаней (~ $850 млрд) к 2050 году.
Экономия на рабочей силе оценивается в $500 000–1 000 000 на одного робота за 20 лет эксплуатации.
2. Отрасли применения
- Логистика и склады: автоматизация погрузки, сортировки.
- Производство: сборка и контроль качества (Toyota, Tesla).
- Здравоохранение: уход за пожилыми людьми.
- Сельское хозяйство: сбор урожая.
- Опасные работы: горнодобыча, строительство.
3. Технологические драйверы
- ИИ: генеративные модели для обучения роботов сложным задачам.
- Сенсоры: LiDAR и камеры (RoboSense, Sony) для восприятия среды.
- Аппаратное обеспечение: actuators (приводы) и батареи (CATL, Tesla).
- Симуляции: платформы вроде NVIDIA Omniverse для ускоренного обучения.
Morgan Stanley выделяет 100 ключевых компаний, разделенных на три категории:
1. "Мозг": Разработка ИИ и вычислительных систем.
- Лидеры:
- NVIDIA: чипы (H100, Jetson) и платформа Omniverse.
- Google (DeepMind): алгоритмы обучения.
- Microsoft: облачные решения.
Западные компании доминируют в этой категории благодаря лидерству в софте.
2. "Тело": Производство компонентов: сенсоры, приводы, батареи.
- Лидеры:
- RoboSense (Китай): LiDAR и системы зрения.
- Sony: камеры.
- CATL: батареи.
- Inovance: приводы.
Китай занимает 63% цепочки поставок, включая 90% обработки редкоземельных металлов, необходимых для моторов.
3. "Интеграторы". Сборка и внедрение роботов.
- Лидеры:
- Tesla (Optimus): интеграция ИИ из FSD в робототехнику.
- Boston Dynamics (Atlas): мобильные роботы.
- Amazon: складская роботизация.
Китай также силен здесь: 56% компаний и 45% интеграторов из КНР.
Из 100 компаний 37 — китайские, 35 — американские, что подчеркивает конкуренцию между этими странами.
Инвестиционные перспективы
- Лидеры роста: NVIDIA, Tesla, RoboSense.
- Потенциал акций: рост на 15–20% ежегодно в ближайшие 5–10 лет.
- Стартапы: Figure AI, Agility Robotics — возможные цели для поглощений.
- Рекомендация: инвестировать в цепочку поставок (компоненты, софт) для долгосрочной прибыли.
Риски:
- Технологические: ограничения в ловкости и автономности.
- Регуляторные: стандарты безопасности и ответственности.
- Социальные: массовая безработица и протесты.
- Китайская конкуренция: доминирование КНР может вытеснить западные фирмы, как в случае с электромобилями.
В отчете делается акцент на лидерстве Китая в "теле" роботов и США в "мозге", с Tesla как ключевым интегратором.
Morgan Stanley видит человекоподобных роботов как трансформационную силу, способную изменить рынок труда и глобальную экономику к 2050 году. Однако успех зависит от преодоления текущих барьеров и конкуренции между Востоком и Западом.
Вот ключевые моменты из отчета:
1. Экономический потенциал
Глобальный рынок к 2050 году рынок может достичь $10–12 трлн.
В США 2040 году будет до 8,4 млн роботов, экономический эффект от этого $357 млрд.
К 2050 году: до 63 млн роботов, замещающих 75% рабочей силы, с эффектом в $3 трлн.
Китайский рынок - 6 триллионов юаней (~ $850 млрд) к 2050 году.
Экономия на рабочей силе оценивается в $500 000–1 000 000 на одного робота за 20 лет эксплуатации.
2. Отрасли применения
- Логистика и склады: автоматизация погрузки, сортировки.
- Производство: сборка и контроль качества (Toyota, Tesla).
- Здравоохранение: уход за пожилыми людьми.
- Сельское хозяйство: сбор урожая.
- Опасные работы: горнодобыча, строительство.
3. Технологические драйверы
- ИИ: генеративные модели для обучения роботов сложным задачам.
- Сенсоры: LiDAR и камеры (RoboSense, Sony) для восприятия среды.
- Аппаратное обеспечение: actuators (приводы) и батареи (CATL, Tesla).
- Симуляции: платформы вроде NVIDIA Omniverse для ускоренного обучения.
Morgan Stanley выделяет 100 ключевых компаний, разделенных на три категории:
1. "Мозг": Разработка ИИ и вычислительных систем.
- Лидеры:
- NVIDIA: чипы (H100, Jetson) и платформа Omniverse.
- Google (DeepMind): алгоритмы обучения.
- Microsoft: облачные решения.
Западные компании доминируют в этой категории благодаря лидерству в софте.
2. "Тело": Производство компонентов: сенсоры, приводы, батареи.
- Лидеры:
- RoboSense (Китай): LiDAR и системы зрения.
- Sony: камеры.
- CATL: батареи.
- Inovance: приводы.
Китай занимает 63% цепочки поставок, включая 90% обработки редкоземельных металлов, необходимых для моторов.
3. "Интеграторы". Сборка и внедрение роботов.
- Лидеры:
- Tesla (Optimus): интеграция ИИ из FSD в робототехнику.
- Boston Dynamics (Atlas): мобильные роботы.
- Amazon: складская роботизация.
Китай также силен здесь: 56% компаний и 45% интеграторов из КНР.
Из 100 компаний 37 — китайские, 35 — американские, что подчеркивает конкуренцию между этими странами.
Инвестиционные перспективы
- Лидеры роста: NVIDIA, Tesla, RoboSense.
- Потенциал акций: рост на 15–20% ежегодно в ближайшие 5–10 лет.
- Стартапы: Figure AI, Agility Robotics — возможные цели для поглощений.
- Рекомендация: инвестировать в цепочку поставок (компоненты, софт) для долгосрочной прибыли.
Риски:
- Технологические: ограничения в ловкости и автономности.
- Регуляторные: стандарты безопасности и ответственности.
- Социальные: массовая безработица и протесты.
- Китайская конкуренция: доминирование КНР может вытеснить западные фирмы, как в случае с электромобилями.
👍14🔥11❤8
Дубай официально признал первые стейблкоины - USDC и EURC
Эмитент стейблкоинов Circle объявил, что ее продукты USDC и EURC стали первыми официально признанными в Международном финансовом центре Дубая (DIFC).
DIFC — один из ключевых финансовых хабов Ближнего Востока, ориентированный на инновации. Признание USDC и EURC открывает им дорогу к институциональным игрокам региона: банкам, корпорациям и фондам. Circle укрепляет свой имидж регулируемого лидера.
Для рынка это шаг к легитимизации стейблкоинов. Если другие юрисдикции последуют примеру DIFC, фокус сместится на регулируемые активы, что может изменить расстановку сил.
Tether (эмитент USDT) остается королем стейблкоинов, но успех Circle в DIFC — это вызов.
Если компании в DIFC выберут USDC, это может снизить объемы USDT в MENA.
USDC и EURC становятся мостом между фиатом и криптой в регионах, где регуляторы готовы сотрудничать. Tether же стоит перед выбором: либо продолжать доминировать в DeFi и менее регулируемых зонах, либо пойти на компромисс с правилами, чтобы не уступить институционалам.
Еще больше материалов про стейблкоины тут.
Эмитент стейблкоинов Circle объявил, что ее продукты USDC и EURC стали первыми официально признанными в Международном финансовом центре Дубая (DIFC).
DIFC — один из ключевых финансовых хабов Ближнего Востока, ориентированный на инновации. Признание USDC и EURC открывает им дорогу к институциональным игрокам региона: банкам, корпорациям и фондам. Circle укрепляет свой имидж регулируемого лидера.
Для рынка это шаг к легитимизации стейблкоинов. Если другие юрисдикции последуют примеру DIFC, фокус сместится на регулируемые активы, что может изменить расстановку сил.
Tether (эмитент USDT) остается королем стейблкоинов, но успех Circle в DIFC — это вызов.
Если компании в DIFC выберут USDC, это может снизить объемы USDT в MENA.
USDC и EURC становятся мостом между фиатом и криптой в регионах, где регуляторы готовы сотрудничать. Tether же стоит перед выбором: либо продолжать доминировать в DeFi и менее регулируемых зонах, либо пойти на компромисс с правилами, чтобы не уступить институционалам.
Еще больше материалов про стейблкоины тут.
Circle
USDC and EURC Become First Stablecoins Recognized by DIFC | Circle
Building on regulatory firsts in the EU and Canada, Circle advances global stablecoin adoption with DFSA recognition. Learn more.
👍10🔥7❤2
Это гонка $: Apple объявили о вложении $500 млрд в ИИ, Microsoft отказались инвестировать в OpenAI проект Stargate, а Alibaba $52 млрд вкладывает в ИИ и облачную инфраструктуру в течение 3-х лет.
Microsoft заявили, что не будут участвовать в проекте OpenAI Stargate из-за переоценки спроса.
Microsoft заявили, что не будут участвовать в проекте OpenAI Stargate из-за переоценки спроса.
👍14❤3
Perplexity AI запускает новый браузер на основе ИИ-агентов под названием "Comet"
Лист ожидания тут.
Поиск на основе ИИ-агентов предполагает:
1. Понимание контекста — браузер может понимать ваши намерения, а не просто искать ключевые слова.
2. Исследование — может самостоятельно переходить по ссылкам и собирать информацию с разных сайтов
3. Синтез информации — вместо выдачи списка ссылок может обобщать информацию и представлять готовые ответы
4. Выполнение сложных задач — например, сравнение продуктов, анализ отзывов, поиск лучших предложений.
Лист ожидания тут.
Поиск на основе ИИ-агентов предполагает:
1. Понимание контекста — браузер может понимать ваши намерения, а не просто искать ключевые слова.
2. Исследование — может самостоятельно переходить по ссылкам и собирать информацию с разных сайтов
3. Синтез информации — вместо выдачи списка ссылок может обобщать информацию и представлять готовые ответы
4. Выполнение сложных задач — например, сравнение продуктов, анализ отзывов, поиск лучших предложений.
www.perplexity.ai
Comet Browser: a Personal AI Assistant
Comet browser by Perplexity is the AI browser that acts as a personal assistant. Automate tasks, research the web, organize your email, and more with Comet.
👍19❤5👎1🤔1
⚡️Anthropic только что выпустили новую гибридную модель Claude 3.7 Sonnet, которая умеет рассуждать и не только:
1. Расширенное мышление (extended thinking) - возможность тщательно и пошагово решать сложные задачи. Этот режим доступен пользователям с Pro-аккаунтами.
Можно выбирать между:
- Быстрыми ответами (standard thinking)
- Углубленным анализом (extended thinking)
- Продвинутыми рассуждениями (advanced reasoning)
Ключевые возможности:
- Продвинутая работа с кодом
- Улучшенное использование компьютера
- Сложные рассуждения
- Генерация контента
- Работа в качестве AI-агента
Основные сценарии использования:
- Поиск и обработка больших объемов информации (RAG)
- Рекомендации продуктов
- Прогнозирование
- Таргетированный маркетинг
- Генерация кода
- Контроль качества
- Распознавание текста из изображений
Доступно как в браузере , так и в приложении.
1. Расширенное мышление (extended thinking) - возможность тщательно и пошагово решать сложные задачи. Этот режим доступен пользователям с Pro-аккаунтами.
Можно выбирать между:
- Быстрыми ответами (standard thinking)
- Углубленным анализом (extended thinking)
- Продвинутыми рассуждениями (advanced reasoning)
Ключевые возможности:
- Продвинутая работа с кодом
- Улучшенное использование компьютера
- Сложные рассуждения
- Генерация контента
- Работа в качестве AI-агента
Основные сценарии использования:
- Поиск и обработка больших объемов информации (RAG)
- Рекомендации продуктов
- Прогнозирование
- Таргетированный маркетинг
- Генерация кода
- Контроль качества
- Распознавание текста из изображений
Доступно как в браузере , так и в приложении.
👍22❤🔥11🏆3❤1
Anthropic: в 2027 году ИИ сможет давать решения сложных проблем без помощи человека
В свежей статье о новой гибридной модели Claude 3.7 Sonnet и сопутствующих продуктах Anthropic показывает график развития их ИИ Claude с 2024 по 2027 год:
1. В 2024 году Claude просто помогает людям
2. К 2025 году Claude будет активно сотрудничать с людьми
3. К 2027 году Claude будет предлагать новаторские решения сложных проблем
Claude 3.7 Sonnet - гибридная модель рассуждения, которая проводит пошаговые рассуждения перед формулированием окончательного ответа. У модели есть интеграция с GitHub. Более того модель прямо в чате может визуализировать данные в виде интерактивных графиков и диаграмм, игр и головоломок, простые иллюстрации, схемы и диаграммы, визуальные представления концепций.
А еще может создавать простые веб-страницы с HTML, CSS и JavaScript.
Также есть Claude Code — новый инструмент командной строки для программирования с помощью ИИ:
- Доступен пока в виде ограниченного исследовательского превью
- Позволяет разработчикам делегировать задачи программирования непосредственно из терминала
- Умеет искать и читать код, редактировать файлы, писать и запускать тесты, а также работать с GitHub.
Модель обучалась на смеси общедоступной информации из интернета (до ноября 2024 года) и непубличных данных. Anthropic говорит, что модель не обучалась на пользовательских запросах или ответах.
После множества оценок, модель была классифицирована как ASL-2 - это означает, что она не достигает пороговых значений для более строгих мер безопасности ASL-3, но требует некоторых мер предосторожности.
Anthropic говорит, что следующая версия модели может потребовать мер безопасности уровня ASL-3, и компания уже готовится к этому.
В свежей статье о новой гибридной модели Claude 3.7 Sonnet и сопутствующих продуктах Anthropic показывает график развития их ИИ Claude с 2024 по 2027 год:
1. В 2024 году Claude просто помогает людям
2. К 2025 году Claude будет активно сотрудничать с людьми
3. К 2027 году Claude будет предлагать новаторские решения сложных проблем
Claude 3.7 Sonnet - гибридная модель рассуждения, которая проводит пошаговые рассуждения перед формулированием окончательного ответа. У модели есть интеграция с GitHub. Более того модель прямо в чате может визуализировать данные в виде интерактивных графиков и диаграмм, игр и головоломок, простые иллюстрации, схемы и диаграммы, визуальные представления концепций.
А еще может создавать простые веб-страницы с HTML, CSS и JavaScript.
Также есть Claude Code — новый инструмент командной строки для программирования с помощью ИИ:
- Доступен пока в виде ограниченного исследовательского превью
- Позволяет разработчикам делегировать задачи программирования непосредственно из терминала
- Умеет искать и читать код, редактировать файлы, писать и запускать тесты, а также работать с GitHub.
Модель обучалась на смеси общедоступной информации из интернета (до ноября 2024 года) и непубличных данных. Anthropic говорит, что модель не обучалась на пользовательских запросах или ответах.
После множества оценок, модель была классифицирована как ASL-2 - это означает, что она не достигает пороговых значений для более строгих мер безопасности ASL-3, но требует некоторых мер предосторожности.
Anthropic говорит, что следующая версия модели может потребовать мер безопасности уровня ASL-3, и компания уже готовится к этому.
👍15🔥15❤🔥5❤4🤔3
Сооснователь «Моторики» инвестирует ₽100 млн в биореактор для Луны
Сооснователь и экс-гендиректор разработчика киберпротезов «Моторика» Илья Чех основал новую научно-технологическую компанию «Гильдия «Рубежи науки».
Компания займется разработкой биореактора для жизнеобеспечения будущих лунных станций и созданием лазерного комплекса для исследований гравитационных волн.
Помимо того, компания будет инвестировать в другие стартапы и проекты, занимающиеся исследованиями и разработками в этой сфере.
Начало разработки биореактора запланировано на I квартал 2025 г., всего реализация может занять от 3 до 5 лет.
Сооснователь и экс-гендиректор разработчика киберпротезов «Моторика» Илья Чех основал новую научно-технологическую компанию «Гильдия «Рубежи науки».
Компания займется разработкой биореактора для жизнеобеспечения будущих лунных станций и созданием лазерного комплекса для исследований гравитационных волн.
Помимо того, компания будет инвестировать в другие стартапы и проекты, занимающиеся исследованиями и разработками в этой сфере.
Начало разработки биореактора запланировано на I квартал 2025 г., всего реализация может занять от 3 до 5 лет.
Ведомости
Сооснователь «Моторики» Илья Чех вложит 100 млн рублей в космические технологии
Инвестор намерен за 3–5 лет создать биореактор для Луны
❤14🔥11👍7
⚡️Прорыв в обучении ИИ от Яна ЛеКуна, позволяющий создавать сильные ИИ-агенты из слабых данных
Команда исследователей из NYU и Meta AI (запрещенная в РФ) под руководством Яна ЛеКуна представила новый метод обучения ИИ-агентов — PLDM (Planning with Latent Dynamics Model), основанный на архитектуре JEPA от Лекуна.
Это возможность использовать "сырые" данные без дорогостоящей разметки значительно снижает затраты на разработку ИИ-решений и открывает новые сценарии применения в областях, где качественные данные труднодоступны.
Большинство современных методов ИИ требуют высококачественных данных с четкими аннотациями для обучения.
PLDM решает фундаментальную проблему перехода от узкоспециализированных агентов к системам, способным адаптироваться к новым задачам без дополнительного обучения.
PLDM реализует на практике концепцию JEPA — подход к самообучению, который Ян ЛеКун считает ключевым для создания по-настоящему интеллектуальных систем. В отличие от генеративных моделей (как GPT), JEPA фокусируется на предсказании абстрактных представлений будущего, а не конкретных наблюдений.
Это может стать альтернативным путем к AGI через предсказательные мировые модели, понимание причинно-следственных связей и планирование, а не через масштабирование параметров и данных.
Способность учиться из неидеальных данных и адаптироваться к новым средам — именно те качества, которые отличают интеллектуальные системы от простых шаблонных решателей.
Команда исследователей из NYU и Meta AI (запрещенная в РФ) под руководством Яна ЛеКуна представила новый метод обучения ИИ-агентов — PLDM (Planning with Latent Dynamics Model), основанный на архитектуре JEPA от Лекуна.
Это возможность использовать "сырые" данные без дорогостоящей разметки значительно снижает затраты на разработку ИИ-решений и открывает новые сценарии применения в областях, где качественные данные труднодоступны.
Большинство современных методов ИИ требуют высококачественных данных с четкими аннотациями для обучения.
PLDM решает фундаментальную проблему перехода от узкоспециализированных агентов к системам, способным адаптироваться к новым задачам без дополнительного обучения.
PLDM реализует на практике концепцию JEPA — подход к самообучению, который Ян ЛеКун считает ключевым для создания по-настоящему интеллектуальных систем. В отличие от генеративных моделей (как GPT), JEPA фокусируется на предсказании абстрактных представлений будущего, а не конкретных наблюдений.
Это может стать альтернативным путем к AGI через предсказательные мировые модели, понимание причинно-следственных связей и планирование, а не через масштабирование параметров и данных.
Способность учиться из неидеальных данных и адаптироваться к новым средам — именно те качества, которые отличают интеллектуальные системы от простых шаблонных решателей.
19🔥17👍7❤5⚡3
AI-агенты и платежи, как бизнес пользуется этим
Ранее мы писали, что Stripe запустили SDK для ИИ-агентов, и за 3 месяца появились интересные кейсы использования.
Разберем, как бизнес применяет эту технологию:
1. Голосовой контроль платежей.
- Разработчики интегрируют Stripe через голосовые команды (Cursor AI + Superwhisper)
- Возможность управлять платежами без написания кода
- Идеально для предпринимателей, которые хотят быстро настроить прием платежей
2. ИИ-ассистенты в продажах
- Автоматическое создание и отправка счетов
- Генерация платежных ссылок по запросу клиента
- Отслеживание статуса платежей и автоматические напоминания
3. Интеграция с sales-платформами
- Arrows Intelligence встраивает платежные ссылки в sales rooms
- ИИ анализирует поведение клиента и предлагает оптимальный момент для выставления счета
- Автоматическая генерация персонализированных коммерческих предложений
4. Автоматизация биллинга
- ИИ отслеживает usage-based pricing
- Автоматическая генерация и корректировка подписок
- Проактивное управление рефандами
5. Практические преимущества:
- Снижение ручной работы с платежами на 70-80%
- Мгновенная обработка финансовых операций
- Минимизация ошибок при выставлении счетов
Главный тренд - интеграция становится проще. От знакомства с технологией до запуска первого платежа может пройти менее часа.
Технический стек:
- LangChain/CrewAI для логики
- Vercel AI SDK для инфраструктуры
- Model Context Protocol (MCP) для стандартизации
- Stripe API для платежных операций
Ожидаем развития экосистемы инструментов и появления специализированных решений для разных бизнес-моделей.
Особенно интересно наблюдать за развитием голосовых интерфейсов управления платежами.
Ранее мы писали, что Stripe запустили SDK для ИИ-агентов, и за 3 месяца появились интересные кейсы использования.
Разберем, как бизнес применяет эту технологию:
1. Голосовой контроль платежей.
- Разработчики интегрируют Stripe через голосовые команды (Cursor AI + Superwhisper)
- Возможность управлять платежами без написания кода
- Идеально для предпринимателей, которые хотят быстро настроить прием платежей
2. ИИ-ассистенты в продажах
- Автоматическое создание и отправка счетов
- Генерация платежных ссылок по запросу клиента
- Отслеживание статуса платежей и автоматические напоминания
3. Интеграция с sales-платформами
- Arrows Intelligence встраивает платежные ссылки в sales rooms
- ИИ анализирует поведение клиента и предлагает оптимальный момент для выставления счета
- Автоматическая генерация персонализированных коммерческих предложений
4. Автоматизация биллинга
- ИИ отслеживает usage-based pricing
- Автоматическая генерация и корректировка подписок
- Проактивное управление рефандами
5. Практические преимущества:
- Снижение ручной работы с платежами на 70-80%
- Мгновенная обработка финансовых операций
- Минимизация ошибок при выставлении счетов
Главный тренд - интеграция становится проще. От знакомства с технологией до запуска первого платежа может пройти менее часа.
Технический стек:
- LangChain/CrewAI для логики
- Vercel AI SDK для инфраструктуры
- Model Context Protocol (MCP) для стандартизации
- Stripe API для платежных операций
Ожидаем развития экосистемы инструментов и появления специализированных решений для разных бизнес-моделей.
Особенно интересно наблюдать за развитием голосовых интерфейсов управления платежами.
14🔥14❤2👍2🤩2
DeepSeek готовится к выходу новой модели R2 и открывает код новых технологий
#DeepSeek не отстает от гонки за выпуск новых лучших моделей, после выходов Anthropic, OpenAI и Google компания собирается выпустить свою новую модель R2 раньше изначально запланированного срока в мае.
Параллельно с этим компания делает стратегический ход, открывая доступ к двум критически важным технологиям: DeepEP и FlashMLA.
DeepEP — первая библиотека с открытым исходным кодом для эффективной коммуникации в моделях на архитектуре Mixture-of-Experts (MoE). Именно эта технология позволила DeepSeek создать свою модель R1, которая превзошла западных конкурентов при значительно меньших затратах на обучение (около $6 млн).
В дополнение к DeepEP, компания представила FlashMLA — высокоэффективный декодирующий модуль для GPU архитектуры Hopper. Этот компонент достигает впечатляющих показателей: 3000 ГБ/с при операциях с памятью и 580 TFLOPS при вычислительных операциях на GPU H800, что критически важно для быстрой работы крупных моделей.
Интересно, как в этот раз стратегия DeepSeek по открытию своих технологий повлияет на западных конкурентов? Что они сделают? Наблюдаем.
#DeepSeek не отстает от гонки за выпуск новых лучших моделей, после выходов Anthropic, OpenAI и Google компания собирается выпустить свою новую модель R2 раньше изначально запланированного срока в мае.
Параллельно с этим компания делает стратегический ход, открывая доступ к двум критически важным технологиям: DeepEP и FlashMLA.
DeepEP — первая библиотека с открытым исходным кодом для эффективной коммуникации в моделях на архитектуре Mixture-of-Experts (MoE). Именно эта технология позволила DeepSeek создать свою модель R1, которая превзошла западных конкурентов при значительно меньших затратах на обучение (около $6 млн).
В дополнение к DeepEP, компания представила FlashMLA — высокоэффективный декодирующий модуль для GPU архитектуры Hopper. Этот компонент достигает впечатляющих показателей: 3000 ГБ/с при операциях с памятью и 580 TFLOPS при вычислительных операциях на GPU H800, что критически важно для быстрой работы крупных моделей.
Интересно, как в этот раз стратегия DeepSeek по открытию своих технологий повлияет на западных конкурентов? Что они сделают? Наблюдаем.
10👍12🔥7👏6
❗️Крупнейшие ИТ-компании инвестируют в создание цифровых клеток человека - Arc Institute, принадлежащий основателям Stripe, запустил виртуальный клеточный атлас из 300 млн клеток
Arc Institute объявил о Arc Virtual Cell Atlas, который объединяет данные более 300 миллионов клеток в единую вычислительную платформу.
Это первый шаг института к созданию масштабной базы клеточных данных для стимулирования биологических открытий с помощью ИИ.
Атлас дебютирует с двумя ключевыми наборами данных, которые стали общедоступными:
1. Tahoe-100M- крупнейший в мире набор данных пертурбаций с открытым исходным кодом, созданный Vevo Therapeutics. Он включает данные о 100 млн клеток и отображает 60,000 взаимодействий лекарств с клетками в 50 линиях раковых клеток.
2. scBaseCamp - первый набор данных секвенирования РНК отдельных клеток, курированный с использованием ИИ-агентов. Ученые Arc обработали наблюдательные данные из более чем 200 миллионов клеток, представляющих 21 различный вид, из публичных репозиториев и привели их к стандартизированной форме.
Для создания scBaseCamp ученые Arc разработали автономных ИИ-агентов, которые непрерывно ищут, курируют и обрабатывают публичные репозитории данных в реальном времени.
Проект создавался в партнерстве с Parse Biosciences, чья GigaLab обеспечила возможности секвенирования РНК отдельных клеток.
Мы видим, как технологические гиганты (через такие структуры как Chan Zuckerberg Initiative) и специализированные институты (как Arc Institute) вкладывают значительные ресурсы в создание виртуальных клеточных атласов и цифровых моделей клеток.
Другие разработки Arc тут.
Arc Institute объявил о Arc Virtual Cell Atlas, который объединяет данные более 300 миллионов клеток в единую вычислительную платформу.
Это первый шаг института к созданию масштабной базы клеточных данных для стимулирования биологических открытий с помощью ИИ.
Атлас дебютирует с двумя ключевыми наборами данных, которые стали общедоступными:
1. Tahoe-100M- крупнейший в мире набор данных пертурбаций с открытым исходным кодом, созданный Vevo Therapeutics. Он включает данные о 100 млн клеток и отображает 60,000 взаимодействий лекарств с клетками в 50 линиях раковых клеток.
2. scBaseCamp - первый набор данных секвенирования РНК отдельных клеток, курированный с использованием ИИ-агентов. Ученые Arc обработали наблюдательные данные из более чем 200 миллионов клеток, представляющих 21 различный вид, из публичных репозиториев и привели их к стандартизированной форме.
Для создания scBaseCamp ученые Arc разработали автономных ИИ-агентов, которые непрерывно ищут, курируют и обрабатывают публичные репозитории данных в реальном времени.
Проект создавался в партнерстве с Parse Biosciences, чья GigaLab обеспечила возможности секвенирования РНК отдельных клеток.
Мы видим, как технологические гиганты (через такие структуры как Chan Zuckerberg Initiative) и специализированные институты (как Arc Institute) вкладывают значительные ресурсы в создание виртуальных клеточных атласов и цифровых моделей клеток.
Другие разработки Arc тут.
arcinstitute.org
Virtual Cell Atlas | Arc Institute
Arc Institute is an independent nonprofit research organization headquartered in Palo Alto, California.
2👍8❤7🔥7
США продвигаются к одобрению государственных биткоин-резервов
18 штатов рассматривают возможность принятия биткоин-резервов, а 33 штата обдумывают их создание.
На данный момент штат Юта успешно продвинул соответствующий законопроект в палату законодательного собрания.
Если он будет принят, Юта может стать 1-м штатом, официально внедрившим биткоин-резервы, с возможностью инвестировать до 5% определенных государственных фондов в цифровые активы, включая биткоин.
По данным анализа VanEck, 20 штатов могут вложить до $23 млрд в биткоин, если законопроекты будут приняты.
Другие штаты, такие как Аризона, Техас и Пенсильвания, тоже продвигаются вперед, но пока Юта ближе всех к финишной черте.
Интерес к этому вопросу усиливается на фоне глобальных дискуссий о роли биткоина как резервного актива.
18 штатов рассматривают возможность принятия биткоин-резервов, а 33 штата обдумывают их создание.
На данный момент штат Юта успешно продвинул соответствующий законопроект в палату законодательного собрания.
Если он будет принят, Юта может стать 1-м штатом, официально внедрившим биткоин-резервы, с возможностью инвестировать до 5% определенных государственных фондов в цифровые активы, включая биткоин.
По данным анализа VanEck, 20 штатов могут вложить до $23 млрд в биткоин, если законопроекты будут приняты.
Другие штаты, такие как Аризона, Техас и Пенсильвания, тоже продвигаются вперед, но пока Юта ближе всех к финишной черте.
Интерес к этому вопросу усиливается на фоне глобальных дискуссий о роли биткоина как резервного актива.
👍11🔥5🤯5😁2👏1🤔1
Основатель Huawei сказал Си Цзиньпину,что отставание от Nvidia сокращается
Huawei достигла большого прогресса в производстве передовых ИИ-чипов Ascend 910C - % выхода годной продукции увеличился до 40% по сравнению с 20% всего год назад.
Это большое достижение, которое впервые сделало производственную линию Huawei для чипов Ascend рентабельной.
Компания планирует дальнейшее улучшение показателей до 60%, что соответствует отраслевым стандартам для подобных чипов и приближается к показателям TSMC при производстве процессоров Nvidia H100.
В 2025 году Huawei планирует произвести 100 000 процессоров Ascend 910C и 300 000 чипов 910B. Это существенный рост по сравнению с 2024 годом, когда было произведено 200 000 чипов 910B, а 910C еще не находились в массовом производстве.
Но есть технические проблемы у чипов Huawei:
1. Специалисты китайских ИИ-компаний и исследователи самой Huawei признают, что Ascend 910B не подходят для обучения крупномасштабных моделей из-за проблем с межчиповым соединением и ограничений памяти.
2. Продукты Huawei пока уступают решениям Nvidia в удобстве использования.
Huawei достигла большого прогресса в производстве передовых ИИ-чипов Ascend 910C - % выхода годной продукции увеличился до 40% по сравнению с 20% всего год назад.
Это большое достижение, которое впервые сделало производственную линию Huawei для чипов Ascend рентабельной.
Компания планирует дальнейшее улучшение показателей до 60%, что соответствует отраслевым стандартам для подобных чипов и приближается к показателям TSMC при производстве процессоров Nvidia H100.
В 2025 году Huawei планирует произвести 100 000 процессоров Ascend 910C и 300 000 чипов 910B. Это существенный рост по сравнению с 2024 годом, когда было произведено 200 000 чипов 910B, а 910C еще не находились в массовом производстве.
Но есть технические проблемы у чипов Huawei:
1. Специалисты китайских ИИ-компаний и исследователи самой Huawei признают, что Ascend 910B не подходят для обучения крупномасштабных моделей из-за проблем с межчиповым соединением и ограничений памяти.
2. Продукты Huawei пока уступают решениям Nvidia в удобстве использования.
9🔥13👍10⚡5
Это будущее разработки ПО-Factory AI создали платформу, объединяющую ИИ с человеческим опытом на всех этапах разработки ПО
В то время как GitHub Copilot, JetBrains AI и другие решения часто концентрируются на автодополнении кода и генерации отдельных функций, Factory позиционирует себя как полноценную платформу для управления разработкой с помощью AI на всех этапах.
Вот её ключевые особенности:
1. Droid Mode - ИИ-агенты обрабатывают тикеты, анализируют ошибки и выполняют сложные задачи.
2. Threads - автоматическое объединение контекста из GitHub, Slack, Jira без переключения между сервисами
3. Workflows - автоматизация рутинных процессов от создания интеграций до формирования релизных заметок
Результаты внедрения впечатляют: удвоение скорости итерации, сокращение времени от открытия до слияния PR на 20%, уменьшение изменений в коде в 3 раза.
В основе платформы — передовые языковые модели (включая Claude 3.7 Sonnet), собственная система индексации и партнерства с OpenAI, Anthropic и MongoDB.
В то время как GitHub Copilot, JetBrains AI и другие решения часто концентрируются на автодополнении кода и генерации отдельных функций, Factory позиционирует себя как полноценную платформу для управления разработкой с помощью AI на всех этапах.
Вот её ключевые особенности:
1. Droid Mode - ИИ-агенты обрабатывают тикеты, анализируют ошибки и выполняют сложные задачи.
2. Threads - автоматическое объединение контекста из GitHub, Slack, Jira без переключения между сервисами
3. Workflows - автоматизация рутинных процессов от создания интеграций до формирования релизных заметок
Результаты внедрения впечатляют: удвоение скорости итерации, сокращение времени от открытия до слияния PR на 20%, уменьшение изменений в коде в 3 раза.
В основе платформы — передовые языковые модели (включая Claude 3.7 Sonnet), собственная система индексации и партнерства с OpenAI, Anthropic и MongoDB.
Factory.ai
Contact Factory
Get in touch with Factory. Schedule a demo, explore enterprise AI solutions, or talk with our team.
👍8❤4🔥4😱2
Вот это конкуренция! #DeepSeek обваливает цены на экономику ИИ, а OpenAI делает Deep research массовым - это демократизация ИИ
Свежие анонсы лидеров ИИ подтверждают прогноз нашего канала @blockchainrf о том, что базовые ИИ-модели станут товаром, а реальная ценность будет в агентах и специализированных решениях.
DeepSeek сегодня объявил сразу 2 важных анонса:
1. Ценовая война. С сегодняшнего дня компания вводит агрессивные скидки в непиковые часы (16:30-00:30 UTC):
- DeepSeek-V3: -50%
- DeepSeek-R1: -75% (!)
Вдумайтесь: стоимость вывода для R1 падает с $2.19 до $0.550 за миллион токенов. Это прямое подтверждение тезиса о том, что базовые ИИ-модели становятся товаром.
2. Технологическая демократизация. DeepSeek выпускает DeepGEMM — высокоэффективную библиотеку с выдающимися характеристиками. Подробности тут.
А OpenAI движется к модели "интеллект как сервис"
Одновременно OpenAI делает серию анонсов, показывающих переход от продажи доступа к моделям к продаже уровней интеллекта:
1. Deep research для всех платных пользователей.
- Plus, Team, Edu и Enterprise получают 10 запросов/месяц
- Pro пользователи — 120 запросов/месяц
2. Advanced Voice на базе GPT-4o mini для бесплатных пользователей:
- Бесплатный доступ к технологии, но с ограничениями
- Plus и Pro получают расширенные возможности
В то же время Alibaba бросает вызов в сфере ИИ-видео и выпускает Wan2.1 — набор продвинутых моделей для видео:
- Генерация в 2,5 раза быстрее SOTA моделей
- Превосходная работа со сложными движениями и физикой
- Работает на китайском и английском языках.
Что это значит для рынка ИИ?
1. Базовые модели становятся товаром. Как мы писали ранее, базовые ИИ-модели станут как ОС — широкодоступными и дешевыми. Мы наблюдаем это в реальном времени с ценовой политикой DeepSeek.
2. Смещение ценности к специализированным решениям.
OpenAI фокусируется на создании функций вроде Deep research — это уже не просто API, а готовое решение конкретной проблемы.
3. Многоуровневая стратегия монетизации.
Компании четко сегментируют функциональность по уровням подписки:
- Бесплатный уровень: базовые возможности
- Plus/Team: доступ к продвинутым функциям с ограничениями
- Pro/Enterprise: максимальные возможности
4. Эффективность вместо сырой мощности. DeepSeek с их компактным, но мощным DeepGEMM подтверждает, что "алгоритмы становятся эффективнее" и "маленькие дистиллированные модели показывают хорошие результаты".
Свежие анонсы лидеров ИИ подтверждают прогноз нашего канала @blockchainrf о том, что базовые ИИ-модели станут товаром, а реальная ценность будет в агентах и специализированных решениях.
DeepSeek сегодня объявил сразу 2 важных анонса:
1. Ценовая война. С сегодняшнего дня компания вводит агрессивные скидки в непиковые часы (16:30-00:30 UTC):
- DeepSeek-V3: -50%
- DeepSeek-R1: -75% (!)
Вдумайтесь: стоимость вывода для R1 падает с $2.19 до $0.550 за миллион токенов. Это прямое подтверждение тезиса о том, что базовые ИИ-модели становятся товаром.
2. Технологическая демократизация. DeepSeek выпускает DeepGEMM — высокоэффективную библиотеку с выдающимися характеристиками. Подробности тут.
А OpenAI движется к модели "интеллект как сервис"
Одновременно OpenAI делает серию анонсов, показывающих переход от продажи доступа к моделям к продаже уровней интеллекта:
1. Deep research для всех платных пользователей.
- Plus, Team, Edu и Enterprise получают 10 запросов/месяц
- Pro пользователи — 120 запросов/месяц
2. Advanced Voice на базе GPT-4o mini для бесплатных пользователей:
- Бесплатный доступ к технологии, но с ограничениями
- Plus и Pro получают расширенные возможности
В то же время Alibaba бросает вызов в сфере ИИ-видео и выпускает Wan2.1 — набор продвинутых моделей для видео:
- Генерация в 2,5 раза быстрее SOTA моделей
- Превосходная работа со сложными движениями и физикой
- Работает на китайском и английском языках.
Что это значит для рынка ИИ?
1. Базовые модели становятся товаром. Как мы писали ранее, базовые ИИ-модели станут как ОС — широкодоступными и дешевыми. Мы наблюдаем это в реальном времени с ценовой политикой DeepSeek.
2. Смещение ценности к специализированным решениям.
OpenAI фокусируется на создании функций вроде Deep research — это уже не просто API, а готовое решение конкретной проблемы.
3. Многоуровневая стратегия монетизации.
Компании четко сегментируют функциональность по уровням подписки:
- Бесплатный уровень: базовые возможности
- Plus/Team: доступ к продвинутым функциям с ограничениями
- Pro/Enterprise: максимальные возможности
4. Эффективность вместо сырой мощности. DeepSeek с их компактным, но мощным DeepGEMM подтверждает, что "алгоритмы становятся эффективнее" и "маленькие дистиллированные модели показывают хорошие результаты".
Telegram
Все о блокчейн/мозге/space/WEB 3.0 в России и мире
❗️Смена экономики:не ИТ-железо и не базовые ИИ-модели будут иметь долгосрочную ценность
Почему гонка за строительством ЦОДов может оказаться ошибкой, и как ИИ- агенты изменят расстановку сил в технологическом секторе?
В то время как участники WEF в Давосе…
Почему гонка за строительством ЦОДов может оказаться ошибкой, и как ИИ- агенты изменят расстановку сил в технологическом секторе?
В то время как участники WEF в Давосе…
👍11🔥8💯3
⚡️2-й по величине банк США BoFA готовится выпустить свой стейблкоин
Скоро Bank of America предложит собственные стейблкоины, которые будут привязаны к депозитным счетам в $, об этом заявил СЕО банка.
Ранее советник Трампа, Сакс, представил план развития криптовалют в стране, где стейблкоины - приоритет #1.
О том, что стейблкоины сыграют большую роль в финансовой сфере, мы писали здесь. А также тут про принятие Дубаем решения о стейблкоинах.
А здесь про ОАЭ.
Скоро Bank of America предложит собственные стейблкоины, которые будут привязаны к депозитным счетам в $, об этом заявил СЕО банка.
Ранее советник Трампа, Сакс, представил план развития криптовалют в стране, где стейблкоины - приоритет #1.
О том, что стейблкоины сыграют большую роль в финансовой сфере, мы писали здесь. А также тут про принятие Дубаем решения о стейблкоинах.
А здесь про ОАЭ.
Fortune
Bank of America's CEO says stablecoins are coming very soon | Fortune
Digital currency was among the topics discussed at the Economic Club of Washington, D.C.'s event.
👍8❤5👏3🤔1😱1
Инвесторы оценивают Perplexity уже в $15млрд, 2 месяца назад оценка была $9млрд
Это уже 4-й раунд за год, что даже для горячего рынка ИИ — бешеный темп. Пока все на ранней стадии, и стартап, похоже, не спешит её принимать.
Интересно то, что в январе этого года Perplexity преодолел отметку в $80 млн годовой выручки от подписок (ARR), что на 60% больше, чем $50 млн в октябре 2024 года. Это примерно $7 млн в месяц.
Оценка в $15 млрд даёт мультипликатор 188x от будущей выручки — третий среди топовых ИИ-стартапов.
Венчурные инвесторы верят, что ИИ-приложения вроде Perplexity оправдают высокие оценки, потому что они растут быстрее, чем софтверные компании прошлого поколения. Сейчас стартап зарабатывает на подписках, но уже смотрит на рекламу, API для разработчиков и даже анонсировал браузер.
Вы спросите зачем столько денег стартапу, который собрал уже почти $1 млрд, хотя не создаёт свои собственные ИИ-модели?
Деньги нужны на расширение продуктов (например, Deep Research — их новый ИИ-агент для исследований и на конкуренцию с OpenAI, Meta(запрещенная в РФ) и Google.
Но есть и второй мотив — стать известным потребительским брендом. Они активно наращивают аудиторию (с 26,3 млн посещений сайта год назад до почти 100 млн сейчас) через бесплатные подписки для студентов и госслужащих, а также маркетинговые акции.
Perplexity - это история про то, как ИИ-стартап с работающей бизнес-моделью (выручка есть!) может привлекать огромные инвестиции, даже не будучи разработчиком моделей. Их стратегия — не только заработать, но и захватить умы пользователей, пока рынок ИИ-поиска ещё формируется.
Вопрос в том, хватит ли им капитала и скорости, чтобы обойти гигантов, которые тоже не стоят на месте.
А также доказать, что их продукт — это не просто модная игрушка, а долгосрочная альтернатива традиционному поиску. Пока они на волне хайпа, но если выручка дойдёт до $200–300 млн ARR в ближайшие пару лет, $15 млрд будут выглядеть вполне разумно. А вот $50 млрд с TikTok — это уже больше про геополитику и амбиции, чем про реальную стоимость на сегодня.
Это уже 4-й раунд за год, что даже для горячего рынка ИИ — бешеный темп. Пока все на ранней стадии, и стартап, похоже, не спешит её принимать.
Интересно то, что в январе этого года Perplexity преодолел отметку в $80 млн годовой выручки от подписок (ARR), что на 60% больше, чем $50 млн в октябре 2024 года. Это примерно $7 млн в месяц.
Оценка в $15 млрд даёт мультипликатор 188x от будущей выручки — третий среди топовых ИИ-стартапов.
Венчурные инвесторы верят, что ИИ-приложения вроде Perplexity оправдают высокие оценки, потому что они растут быстрее, чем софтверные компании прошлого поколения. Сейчас стартап зарабатывает на подписках, но уже смотрит на рекламу, API для разработчиков и даже анонсировал браузер.
Вы спросите зачем столько денег стартапу, который собрал уже почти $1 млрд, хотя не создаёт свои собственные ИИ-модели?
Деньги нужны на расширение продуктов (например, Deep Research — их новый ИИ-агент для исследований и на конкуренцию с OpenAI, Meta(запрещенная в РФ) и Google.
Но есть и второй мотив — стать известным потребительским брендом. Они активно наращивают аудиторию (с 26,3 млн посещений сайта год назад до почти 100 млн сейчас) через бесплатные подписки для студентов и госслужащих, а также маркетинговые акции.
Perplexity - это история про то, как ИИ-стартап с работающей бизнес-моделью (выручка есть!) может привлекать огромные инвестиции, даже не будучи разработчиком моделей. Их стратегия — не только заработать, но и захватить умы пользователей, пока рынок ИИ-поиска ещё формируется.
Вопрос в том, хватит ли им капитала и скорости, чтобы обойти гигантов, которые тоже не стоят на месте.
А также доказать, что их продукт — это не просто модная игрушка, а долгосрочная альтернатива традиционному поиску. Пока они на волне хайпа, но если выручка дойдёт до $200–300 млн ARR в ближайшие пару лет, $15 млрд будут выглядеть вполне разумно. А вот $50 млрд с TikTok — это уже больше про геополитику и амбиции, чем про реальную стоимость на сегодня.
The Information
Is Perplexity Worth $15 Billion?
Before we get into today’s column, leaders at OpenAI have told some employees that GPT-4.5—the model known internally as Orion—will be released this week, according to a person with knowledge of the conversations.Don’t get too excited though. A person who’s…
🔥13👀7👍5❤1
Голосовой помощник Alexa от Amazon сегодня стал ИИ-агентом с «мозгами» Claude
Сегодня представили обновленную Alexa+ и это не просто голосовой помощник в привычном понимании.
«Мозг» у Alexa от Claude и теперь система способна к более сложным взаимодействиям:
1. может вести диалог с учетом контекста. Те кто пользуются Claude, те понимают качество.
2. адаптироваться к предпочтениям пользователя, благодаря Claude Alexa может стать очень эмпатичной.
3. самостоятельно принимать решения для выполнения задач, таких как заказ продуктов или управление умным домом.
Сегодня представили обновленную Alexa+ и это не просто голосовой помощник в привычном понимании.
«Мозг» у Alexa от Claude и теперь система способна к более сложным взаимодействиям:
1. может вести диалог с учетом контекста. Те кто пользуются Claude, те понимают качество.
2. адаптироваться к предпочтениям пользователя, благодаря Claude Alexa может стать очень эмпатичной.
3. самостоятельно принимать решения для выполнения задач, таких как заказ продуктов или управление умным домом.
Fortune
Amazon's new AI-powered Alexa is finally here—for $20 a month | Fortune
Ten years after Amazon debuted its virtual assistant, Alexa is finally being upgraded for the generative-AI age. Meet Alexa+.
1🔥11👍5❤4🤔2👎1
Набиуллина: к цифровому ₽ много замечаний, массовое внедрение откладывается на более поздний срок, чем планировалось
Глава ЦБ Э. Набиуллина заявила, что регулятор получает от отрасли вопросы об объемах необходимых доработок и запросы о сдвиге сроков широкого внедрения цифрового рубля. Ранее ЦБ заявлял, что с 1 июля 2025 года начнется массовое внедрение.
Бизнес, банки и правительство выразили заинтересованность в проведении смарт-контрактов, для которых цифровой рубль предоставляет больше возможностей.
В ЦБ хотят сделать это направление одним из приоритетных в развитии проекта.
Ранее мы писали о проблемах, с которыми столкнулся проект ЦБ.
А здесь был наш анализ о том, почему цифровой рубль не рабочая тема для сегодняшнего и завтрашнего дня.
Глава ЦБ Э. Набиуллина заявила, что регулятор получает от отрасли вопросы об объемах необходимых доработок и запросы о сдвиге сроков широкого внедрения цифрового рубля. Ранее ЦБ заявлял, что с 1 июля 2025 года начнется массовое внедрение.
Бизнес, банки и правительство выразили заинтересованность в проведении смарт-контрактов, для которых цифровой рубль предоставляет больше возможностей.
В ЦБ хотят сделать это направление одним из приоритетных в развитии проекта.
Ранее мы писали о проблемах, с которыми столкнулся проект ЦБ.
А здесь был наш анализ о том, почему цифровой рубль не рабочая тема для сегодняшнего и завтрашнего дня.
РБК
ЦБ отложил массовое внедрение цифрового рубля
В ЦБ учли просьбы перенести широкое внедрение цифрового рубля. Новые сроки назовут после того, как все детали проекта будут отработаны в рамках пилота
😁6❤3👍2🔥2
Сейчас будет просто топовый пост! Это очень крутая разработка!
👀13🔥7❤5👍2
Все о блокчейн/мозге/space/WEB 3.0 в России и мире
💸Экс-сотрудники Google создали компанию Physical Intelligence (π.com!). Они будут создавать AGI для роботов Им уже на старте венчурные инвесторы отдали $70 млн, в частности такие фонды, как Thrive, Khosla, Lux и Sequoia. Physical Intelligence состоит из…
Ex сотрудники Google дали роботам «внутренний голос», который есть у людей
Новая разработка Hi Robot от Physical Intelligence превосходит GPT-4o на 40% по точности выполнения инструкций.
Ключевое - у технологии целостностный подход, объединяющий зрительное восприятие, языковое понимание, осознанное рассуждение "внутренним голосом" и действие в единой архитектуре, которая обучается и адаптируется как единое целое.
Представьте, что вы готовите новое блюдо по рецепту. Вы мысленно проговариваете каждый шаг: «сначала нарезать лук, теперь добавить соль...» Этот «внутренний голос» — не интуиция, а осознанное, вербализованное мышление, ключевая часть человеческого разума при решении сложных задач.
Теперь такой же механизм получили роботы от стартапа Physical Intelligence, чья команда состоит из экс- сотрудников Google, основавших в марте 2024 года компанию Physical Intelligence.
Hi Robot (Hierarchical Interactive Robot) — технология, которая позволяет роботам справляться со сложными задачами, разбивая их на простые шаги и адаптируясь к указаниям человека в реальном времени.
Эта технология состоит из:
1. Двухуровневого мышления по модели Канемана.
Система напрямую воплощает знаменитую теорию нобелевского лауреата Даниэля Канемана о двух системах мышления, описанную в его работе «Думай медленно... решай быстро»:
«Система 1» (быстрая, автоматическая, интуитивная) — реализована низкоуровневой моделью π0, которая выполняет конкретные действия без видимых усилий.
«Система 2» (медленная, рассудительная, требующая внимания) — представлена высокоуровневой политикой, которая анализирует задачу, разбивает её на шаги и адаптируется к обратной связи.
Именно эта "Система 2" создаёт тот самый "внутренний голос", который проговаривает сложные задачи, делая их понятными и выполнимыми.
2. Единого фундамента для обоих уровней мышления.
В отличие от конкурентов, Hi Robot использует одну и ту же базовую модель PaliGemma-3B VLM для обоих уровней иерархии, что обеспечивает согласованность и более естественную коммуникацию между уровнями "мышления" робота.
3. Реального понимания контекста.
Система не просто выполняет команды — она понимает их в контексте ситуации. Когда вы говорите роботу «это не мусор» во время уборки стола, Hi Robot понимает, что вы указываете на конкретный объект, который робот в данный момент держит, и корректирует своё поведение.
4. Интеграции знаний из интернета.
Благодаря предварительному обучению на данных из интернета, Hi Robot обладает "здравым смыслом" и общими знаниями о мире. Это позволяет ей лучше реагировать на неожиданные ситуации и интерпретировать расплывчатые команды.
Hi Robot уже протестирован на реальных задачах, например:
Приготовление бутербродов: «Сделай мне бутерброд с сыром и ростбифом, но без помидоров»
Уборка стола: «Убери только мусор, но не посуду» или «Собери только желтоватые предметы»
Покупки в магазине: «Мне нужны чипсы, Oreo и напитки для киновечера»
При этом вы можете вмешиваться в процесс: «Оставь это», «Я хочу также KitKat», «Это не мусор!», и робот адаптируется к вашим указаниям без перепрограммирования.
Технические инновации:
В основе Hi Robot лежат передовые технологии, разработанные Physical Intelligence:
π0 — 1-я универсальная модель управления роботами, аналог GPT для физического мира.
FAST — метод токенизации действий, повышающий точность и скорость обучения в 5 раз.
Сравнение с конкурентами
Hi Robot сильно выделяется среди аналогичных проектов в этой области:
RT-2 (Google DeepMind) — модель vision-language-action, но без явного разделения на высокий и низкий уровни мышления. Hi Robot превосходит её в обработке обратной связи в реальном времени.
SayCan (Google) — использует языковые модели для планирования, но опирается на предопределённые навыки. Hi Robot предлагает более тесную интеграцию зрения и языка.
PaLM-E (Google) — единая сквозная модель без иерархии, что ограничивает её способности к адаптации и рассуждению.
YAY Robot (Stanford) — фокусируется на коррекции ошибок, но имеет более узкие возможности для сложного планирования.
Новая разработка Hi Robot от Physical Intelligence превосходит GPT-4o на 40% по точности выполнения инструкций.
Ключевое - у технологии целостностный подход, объединяющий зрительное восприятие, языковое понимание, осознанное рассуждение "внутренним голосом" и действие в единой архитектуре, которая обучается и адаптируется как единое целое.
Представьте, что вы готовите новое блюдо по рецепту. Вы мысленно проговариваете каждый шаг: «сначала нарезать лук, теперь добавить соль...» Этот «внутренний голос» — не интуиция, а осознанное, вербализованное мышление, ключевая часть человеческого разума при решении сложных задач.
Теперь такой же механизм получили роботы от стартапа Physical Intelligence, чья команда состоит из экс- сотрудников Google, основавших в марте 2024 года компанию Physical Intelligence.
Hi Robot (Hierarchical Interactive Robot) — технология, которая позволяет роботам справляться со сложными задачами, разбивая их на простые шаги и адаптируясь к указаниям человека в реальном времени.
Эта технология состоит из:
1. Двухуровневого мышления по модели Канемана.
Система напрямую воплощает знаменитую теорию нобелевского лауреата Даниэля Канемана о двух системах мышления, описанную в его работе «Думай медленно... решай быстро»:
«Система 1» (быстрая, автоматическая, интуитивная) — реализована низкоуровневой моделью π0, которая выполняет конкретные действия без видимых усилий.
«Система 2» (медленная, рассудительная, требующая внимания) — представлена высокоуровневой политикой, которая анализирует задачу, разбивает её на шаги и адаптируется к обратной связи.
Именно эта "Система 2" создаёт тот самый "внутренний голос", который проговаривает сложные задачи, делая их понятными и выполнимыми.
2. Единого фундамента для обоих уровней мышления.
В отличие от конкурентов, Hi Robot использует одну и ту же базовую модель PaliGemma-3B VLM для обоих уровней иерархии, что обеспечивает согласованность и более естественную коммуникацию между уровнями "мышления" робота.
3. Реального понимания контекста.
Система не просто выполняет команды — она понимает их в контексте ситуации. Когда вы говорите роботу «это не мусор» во время уборки стола, Hi Robot понимает, что вы указываете на конкретный объект, который робот в данный момент держит, и корректирует своё поведение.
4. Интеграции знаний из интернета.
Благодаря предварительному обучению на данных из интернета, Hi Robot обладает "здравым смыслом" и общими знаниями о мире. Это позволяет ей лучше реагировать на неожиданные ситуации и интерпретировать расплывчатые команды.
Hi Robot уже протестирован на реальных задачах, например:
Приготовление бутербродов: «Сделай мне бутерброд с сыром и ростбифом, но без помидоров»
Уборка стола: «Убери только мусор, но не посуду» или «Собери только желтоватые предметы»
Покупки в магазине: «Мне нужны чипсы, Oreo и напитки для киновечера»
При этом вы можете вмешиваться в процесс: «Оставь это», «Я хочу также KitKat», «Это не мусор!», и робот адаптируется к вашим указаниям без перепрограммирования.
Технические инновации:
В основе Hi Robot лежат передовые технологии, разработанные Physical Intelligence:
π0 — 1-я универсальная модель управления роботами, аналог GPT для физического мира.
FAST — метод токенизации действий, повышающий точность и скорость обучения в 5 раз.
Сравнение с конкурентами
Hi Robot сильно выделяется среди аналогичных проектов в этой области:
RT-2 (Google DeepMind) — модель vision-language-action, но без явного разделения на высокий и низкий уровни мышления. Hi Robot превосходит её в обработке обратной связи в реальном времени.
SayCan (Google) — использует языковые модели для планирования, но опирается на предопределённые навыки. Hi Robot предлагает более тесную интеграцию зрения и языка.
PaLM-E (Google) — единая сквозная модель без иерархии, что ограничивает её способности к адаптации и рассуждению.
YAY Robot (Stanford) — фокусируется на коррекции ошибок, но имеет более узкие возможности для сложного планирования.
www.pi.website
Teaching Robots to Listen and Think Harder
A method for robots to think through complex tasks step by step, incorporating human-in-the-loop feedback.
17🔥16👍9❤🔥4🤯4