red_mad_robot
10.8K subscribers
2.59K photos
169 videos
90 files
3.66K links
Запускаем цифровые бизнесы и помогаем компаниям внедрять AI. Делимся аналитикой по рынку и кейсами и рассказываем, что нас держит в топе уже 17 лет.

redmadrobot.ru

Для связи: @redmadmadbot

Номер заявки в РКН: №7417651423
Download Telegram
Меньше чем через час встречаемся на эфире AM Live ⚡️

Поговорим о том, как компаниям выстраивать ИТ-инфраструктуру в 2026 году и внедрять ИИ без бесконечного роста затрат. Участие в дискуссии примет Илья Самофеев, исполнительный директор red_mad_robot.

В эфире обсудим:
📍 Почему разрозненные цифровые решения со временем начинают мешать развитию бизнеса
📍 Какие задачи сейчас разумно передавать ИИ, а где автоматизация пока не окупается
📍 Как внедрять ИИ-инструменты так, чтобы они работали как единая система

28 мая, 11:00–13:00

Ссылки на трансляцию: VK, YouTube, RuTube, сайт

↗️ red_mad_robot
Please open Telegram to view this post
VIEW IN TELEGRAM
1097
ЦИПР закончился, партнёрства — нет

Подписали соглашение о сотрудничестве с «Ростелекомом». Вместе будем создавать и выводить на рынок линейку ИИ-решений для разных отраслей экономики.

Мы планируем создавать ИИ-инструменты, которые смогут работать в промышленном контуре крупных компаний, соответствовать требованиям безопасности и при этом давать измеримый бизнес-эффект.

Алексей Макин, основатель и акционер red_mad_robot


Особенно нам сейчас интересно уделить внимание развитию безопасной среды разработки, тестированию и мониторингу нейросетей и обеспечению этики и защиты данных при работе с ИИ. Скоро поделимся всеми новостями ↗️

↗️ red_mad_robot
Please open Telegram to view this post
VIEW IN TELEGRAM
16109
Быстрее, дешевле, без людей: новый этап в проектировании ИИ-систем

Аналитический центр red_mad_robot рассказывает и комментирует главные новости индустрии за неделю с 25 по 29 мая

🟥Nous Research предлагает Lighthouse Attention: метод, который решает проблему обработки длинных последовательностей в стандартном механизме внимания. Классический FlashAttention сравнивает каждый токен друг с другом — из-за этого вычисления и потребление памяти резко растут с увеличением длины текста.

Lighthouse Attention строит многоуровневую пирамиду из текста: данные группируются и кратко обобщаются. Система оценивает эти обобщения, выбирает самые важные части и подаёт во FlashAttention только их. После обработки результаты распространяются обратно на весь исходный контекст, чтобы сохранить связи в тексте. Кастомные вычисления и изменения аппаратной части при этом не нужны.

Почему это важно: при контексте около 512 тысяч символов метод работает до 17 раз быстрее стандартных подходов. Обучение на длинных последовательностях ускоряется в 1,4–1,7 раза при длине около 98 тысяч символов. Если результат удастся масштабировать, это существенно снизит стоимость и время обучения моделей.

🟥Meta (запрещена в РФ) показала AIRA: система автоматически ищет и создаёт новые архитектуры нейросетей. В основе — два агента с разными задачами:

• AIRA-Compose формирует общую схему и структуру модели
• AIRA-Design отвечает за реализацию внутренних механизмов и технических деталей

Такое разделение обязанностей оказалось эффективнее, чем единый агент, который выполнял бы весь процесс самостоятельно. AIRA не ограничивается улучшением существующих моделей, а полностью проектирует новые архитектуры через последовательный процесс поиска на основе координации двух агентов.

Почему это важно: за 24 часа AIRA нашла архитектуры, которые превзошли Llama 3.2 на 350 млн, 1 млрд и 3 млрд параметров. Это показывает, что агентные системы уже могут автоматически создавать конкурентоспособные архитектуры. Это означает, что в будущем поиск нейросетевых архитектур (NAS) и многие этапы исследований могут быть автоматизированы.
Также на неделе:
• NVIDIA выпустила Polar — инфраструктуру для RL-обучения ИИ-агентов без необходимости переписывать их под отдельный фреймворк
• Anthropic представил Claude Opus 4.8 с фокусом на честность модели и параллельную координацию сотен агентов
• Microsoft рассказал о SkillOpt — первом систематическом текстовом оптимизаторе для навыков ИИ-агентов, который позволяет улучшать их работу без изменения весов модели
• Sakana предлагает DiffusionBlocks — метод обучения моделей по одному блоку, снижающий потребление памяти во время обучения
• Harvard University показал AutoScientists — систему децентрализованных команд ИИ-агентов для длительных научных исследований без участия человека
• Google представил ScientistOne — автономную систему для научных исследований с акцентом на проблему галлюцинаций и верификации в работах ИИ-агентов

↗️ red_mad_robot
Please open Telegram to view this post
VIEW IN TELEGRAM
86
заголовок_новая_версия_итог_финал_v7

red_mad_robot и Билайн получили награду Data Award за создание тиражируемых подходов. Победили с DCD Design — архитектурой, которая помогает ИИ-агентам находить нужную информацию в корпоративных знаниях.

DCD Design: что это такое

В больших компаниях знания обычно живут в десятках файлов, систем и баз знаний. Для агентов это проблема: если они обращаются не к тому источнику, ответ становится неточным.

DCD Design работает иначе: агент не ищет ответ сразу во всём массиве документов, а движется по карте знаний. Сначала система определяет нужную область, затем уточняет тему и только после этого подбирает документы по логике Domain–Collection–Document.

Сейчас подход используется для разработки корпоративных ИИ-агентов Билайна, и по первым результатам точность ответов в типовых сценариях уже выросла с 78% до 94%.

В общем, награда за то, что мы сделали корпоративные знания чуть менее похожими на лабиринт, а агентов — точнее в поиске нужной информации.

↗️ red_mad_robot
Please open Telegram to view this post
VIEW IN TELEGRAM
16108
Кто заплатит за экономику ИИ?

OpenAI описала, как может измениться экономика, если ИИ станет базовой инфраструктурой — на уровне электричества, интернета или массового образования.

Главный тезис простой: технология развивается быстрее, чем институты, которые должны с ней работать. Поэтому компания говорит о новой промышленной политике, сопоставимой по масштабу с прогрессивными реформами начала XX века или «Новым курсом» Рузвельта.

В центре этой политики — распределение эффекта. Если выгоды останутся у ограниченного числа компаний, владельцев капитала и стран с доступом к вычислительной инфраструктуре, ИИ усилит концентрацию власти и неравенство. Чтобы этого избежать, правила доступа, распределения доходов и контроля рисков нужно обновлять уже сейчас.

Подход OpenAI строится вокруг трёх принципов: широкого распределения благ, снижения рисков и демократизации доступа к возможностям ИИ.

↗️ Открытая экономика
Первый фокус — открытая экономика. Если ИИ становится базовой инфраструктурой, доступ к нему должен быть широким: через понятные инструменты, обучение, финансирование и инфраструктуру.

Один из ключевых пунктов — формальное право работников участвовать в решениях о внедрении ИИ на рабочих местах. Это нужно, чтобы технология улучшала качество труда и безопасность, а не просто меняла процессы сверху. Люди внутри команд лучше понимают, где ИИ помогает снять рутину, где снижает риски, а где — создаёт новую нагрузку или размывает ответственность.

↗️ Налоги и фонд благосостояния
Если структура занятости меняется, а часть экономической ценности смещается к капиталу и доходам от ИИ, налоговой системе тоже придётся учитывать этот сдвиг. Иначе финансирование общественных программ останется привязано к старой модели экономики.

Поэтому OpenAI говорит о смещении акцента в сторону капитала и AI-driven returns — доходов, связанных с ИИ.

Один из возможных инструментов — национальный фонд благосостояния. Через него граждане могли бы получать долю от экономического роста, который создаёт ИИ. Это попытка ответить на главный вопрос новой производительности: кто получает её эффект — только владельцы капитала и инфраструктуры или более широкий круг людей.

↗️ Энергетика и производительность
ИИ требует другой инфраструктуры. Развитие моделей связано с дата-центрами, вычислениями и энергетикой, поэтому OpenAI говорит о государственно-частных партнёрствах для ускорения энергетических проектов.

Рост производительности от ИИ при этом должен возвращаться людям: через повышение зарплат, улучшение социальных гарантий или сокращение рабочего времени.

↗️ Гибкая социальная защита
Социальная защита должна стать адаптивной. При масштабных экономических потрясениях ей нужен быстрый механизм усиления: денежная помощь, программы переобучения и страхование доходов.

Ещё одна идея — «портативные» социальные льготы. Медицинское страхование, пенсии и образовательные возможности лучше отвязать от конкретного работодателя, чтобы человек сохранял их при смене работы.

↗️ Где человек остаётся ключевым
Отдельное направление — занятость в сферах, ориентированных на человека: уход, образование, общественные услуги. ИИ может помогать с рутиной, но ценность такой работы строится на внимании, доверии и контакте с человеком. Поэтому труд по уходу важно признавать экономически значимым, а такие сферы — развивать как часть новой экономики.

↗️ Наука и инфраструктура открытий
Финальный слой — научные открытия. ИИ может ускорить их через распределённые лаборатории и исследовательские процессы. Но для реального эффекта нужны инвестиции в инфраструктуру, которая быстрее превращает научные достижения в общественную и экономическую пользу.

↗️ red_mad_robot
Please open Telegram to view this post
VIEW IN TELEGRAM
1276
Опыт в копилку и сон по расписанию: ИИ учится работать эффективнее

Аналитический центр red_mad_robot рассказывает и комментирует главные новости индустрии за неделю с 1 по 5 июня

🟥ByteDance предлагает MUSE-Autoskill: фреймворк, в котором агент выполняет задачи и накапливает собственную библиотеку навыков. Принцип работы напоминает то, как развивается профессиональная экспертиза у человека. Столкнувшись с незнакомой задачей, агент формирует новый навык и сразу фиксирует опыт его применения: что сработало, где возникли сбои, в каких контекстах решение оказалось наиболее эффективным. 

При повторном появлении похожей задачи система находит релевантный навык и переиспользует его — то есть решение не строится с нуля. Если навык показывает слабые результаты, агент дорабатывает его автоматически на основе тестов и реального опыта. Перед тем, как навык попадает в общую библиотеку, он проходит верификацию: только успешно протестированные решения становятся доступны для дальнейшего использования.

На SkillsBench MUSE-Autoskill достигла точности 68,4% с готовыми навыками, превзойдя другие агентные решения. При использовании приёмов, созданных на основе собственного опыта, точность выросла до 87,94%. Такие навыки оказались полезны и для других агентов: при передаче они улучшили результаты на 10 п.п.

Почему это важно: агент способен самостоятельно создавать, улучшать и накапливать навыки, выходя за рамки заранее заданных. Если подход окажется масштабируемым, это позволит строить системы, которые становятся эффективнее благодаря собственному опыту и могут передавать накопленные знания другим агентам.

🟥CMU и University of Maryland предложили необычное решение для оптимизации работы моделей — периодический сон. Концепция решает проблему трансформеров с масштабированием механизма внимания. При обработке больших объёмов данных — например, длинного кода или агентных задач — вычислительные затраты растут квадратично, а объём памяти под KV-кэш увеличивается линейно. Это бьёт по скорости и перегружает оборудование.

Авторы добавили в архитектуру блоки state‑space (SSM) с быстрыми весами (fast weights). В обычном режиме модель генерирует токены стандартным способом. Через определённые интервалы система уходит на перерыв: во время сна модель совершает несколько офлайновых проходов по накопленному тексту, записывает ключевую информацию в долговременную память и полностью сбрасывает KV-кэш.

Эксперименты показывают: чем дольше сон, тем лучше результаты. Наибольший выигрыш — в задачах, требующих сложных рассуждений на основе длинной истории взаимодействий.

Почему это важно: метод особенно актуален для агентов, работающих на длинных горизонтах. Он предлагает биологически вдохновлённую альтернативу бесконечному росту контекстного окна и органично вписывается в современные энергоэффективные архитектуры.
Также на неделе:
• Google, Meta (запрещена в РФ), CMU и другие компании представили AutoResearchClaw — самообучающуюся систему для автономных исследований, которая использует взаимодействие ИИ-агентов, исправляет ошибки, создаёт проверяемые отчёты и накапливает знания между запусками
• Google рассказал о фреймворке LEAP, который позволяет универсальным языковым моделям достигать передовых результатов в автоматическом доказательстве теорем без специального дообучения
• Tencent запустил плагин памяти для ИИ-агентов
• Microsoft анонсировал семейство из семи моделей MAI и новый класс агентов Autopilots
• Nous Research представил Hermes Desktop — официальное приложение для ИИ-агента Hermes 
• OpenAI добавил в ChatGPT динамическую систему памяти Dreaming

↗️ red_mad_robot
Please open Telegram to view this post
VIEW IN TELEGRAM
875
Внутренняя перестройка и рыночные решения

На следующей неделе, 17 июня, встретимся на @russiantechweek. В одном потоке поговорим про ИИ для бизнеса сразу с двух сторон: почему компаниям всё сложнее ограничиваться точечными внедрениями и какие решения на российском рынке уже помогают экономить, зарабатывать и запускать новые продукты.

1️⃣ Организационный поворот
Илья Самофеев, CEO red_mad_robot

Разберём, как бизнес выбирает стратегию GenAI-трансформации: повышает внутреннюю эффективность, ищет новые точки роста или запускает AI-Native продукты. И почему для внедрения важны не только технологии, но и процессы, культура, управленческие решения и готовность команд работать по-новому.


2️⃣ Источник новой экономики
Илья Филиппов, CEO red_mad_robot AI

Российский ИИ-рынок быстро взрослеет, и бизнесу важно понимать, какие решения дают экономический результат и где вложения окупаются. Для этого посмотрим на три категории: SaaS-платформы для быстрого старта, нишевые отечественные модели для высокомаржинальных задач и инфраструктуру, которая снижает стоимость владения.


Зарегистрироваться и послушать выступления 🔗

↗️red_mad_robot
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
976
red_mad_robot
Кто заплатит за экономику ИИ? OpenAI описала, как может измениться экономика, если ИИ станет базовой инфраструктурой — на уровне электричества, интернета или массового образования. Главный тезис простой: технология развивается быстрее, чем институты, которые…
Вторая часть повестки OpenAI — про устойчивое общество: безопасность, управление и международную координацию в условиях развития ИИ.

Если первый блок был про экономику и распределение выгоды, здесь фокус смещается к контролю рисков. Чем мощнее становятся ИИ-системы, тем выше цена ошибок, злоупотреблений и слабого управления.

↗️ Раннее выявление рисков
OpenAI говорит о системах раннего выявления и предотвращения злоупотреблений ИИ — особенно в чувствительных областях вроде кибербезопасности и биотехнологий. Логика простая: риски нужно видеть до того, как они превращаются в масштабный инцидент.

Важная часть этой инфраструктуры — «стек доверия к ИИ»: технологии верификации и подтверждения происхождения контента. Они нужны, чтобы проверять результаты работы ИИ, его действия и ответственность за них, сохраняя приватность пользователей.

↗️ Аудит мощных моделей
Для передовых ИИ-систем нужны стандарты аудита и сеть независимых проверяющих. Такие модели важно оценивать до и после внедрения: с учётом качества работы, рисков для национальной безопасности, устойчивости инфраструктуры и управляемости.

Отдельная задача — сценарии для опасных или вышедших из-под контроля систем. Если ИИ начинает создавать ущерб или распространять опасные возможности, нужны заранее понятные протоколы: как ограничить вред, остановить действия системы и минимизировать последствия.

↗️ Общественное участие и инциденты
OpenAI отдельно выделяет механизмы общественного участия в разработке и настройке ИИ-систем, а также системы обязательного сообщения о сбоях, злоупотреблениях и «почти инцидентах», связанных с технологией.

ИИ-риски не ограничиваются одной компанией или страной. Поэтому нужна международная сеть координации: обмен информацией о рисках, согласование оценок и совместная реакция на кризисные ситуации.

Что вообще означает этот документ

OpenAI фактически пытается закрепить новую рамку обсуждения. Если ИИ становится базовой инфраструктурой экономики, его уже сложно рассматривать только как продуктовый рынок или исследовательскую гонку.

Масштаб последствий шире: занятость, налоги, энергетика, социальная защита, безопасность, международная координация и распределение экономического эффекта.

Для самого OpenAI это способ показать себя ответственным участником рынка — не только разработчиком моделей, но и игроком, который участвует в формировании правил вокруг них.

При этом это не готовая реформа, а набор предварительных идей для дискуссии. В центре — вопрос о том, какие институты, политические механизмы и формы контроля понадобятся, если ИИ действительно станет инфраструктурой следующего экономического цикла.

↗️ red_mad_robot
Please open Telegram to view this post
VIEW IN TELEGRAM
733
red_mad_robot
Внутренняя перестройка и рыночные решения На следующей неделе, 17 июня, встретимся на @russiantechweek. В одном потоке поговорим про ИИ для бизнеса сразу с двух сторон: почему компаниям всё сложнее ограничиваться точечными внедрениями и какие решения на российском…
мы не договорили.

Добавляем к расписанию TECH WEEK ещё одно выступление red_mad_robot. Максим Максимов, NLP-инженер расскажет, как мы работаем с данными для обучения LLM: собираем, размечаем, версионируем и контролируем качество на разных этапах.

Также отдельно обсудим инструменты, которые помогают управлять полным жизненным циклом данных и автоматизировать их улучшение.

Всё также зарегистрироваться и послушать выступление

↗️ red_mad_robot
Please open Telegram to view this post
VIEW IN TELEGRAM
863
Рекурсивное улучшение: ИИ начинает работать над собой

Аналитический центр red_mad_robot рассказывает и комментирует главные новости индустрии за неделю с 8 по 12 июня

🟥Anthropic выпустил статью When AI builds itself: отрасль приближается к рекурсивному самоулучшению — состоянию, где модели могут частично дорабатывать своих преемников быстрее, чем это успевают регулировать институты. При этом до полной автономии ещё далеко, и человек остаётся ключевым элементом постановки целей и контроля.

Внутренние данные показывают резкий рост роли ИИ: к маю 2026 года Claude генерировал 80% кода в Anthropic, а продуктивность инженеров выросла в восемь раз за два года. Публичные бенчмарки также фиксируют быстрый прогресс: время автономного решения задач моделями удваивается каждые ~четыре месяца.

Почему это важно: цель публикации — заранее обозначить траекторию развития для регуляторов и общества. Anthropic говорит о необходимости механизмов контроля, верификации и замедления прогресса через международную координацию, так как влияние ИИ на экономику может быть значительным.

🟥NVIDIA, MIT и Google показали AutoLab: бенчмарк для оценки ИИ-агентов, который включает 36 задач. Агентам дают уже рабочий, но слабый код и ограниченное время на улучшение. Задачи включают оптимизацию систем, CUDA-ядра, разработку моделей и логические головоломки.

Главный вывод: успех определяется не качеством первого решения, а способностью последовательно тестировать гипотезы и улучшать результат. Модели, которые продолжают итеративно дорабатывать решение, значительно превосходят те, что быстро прекращают работу. Лучшие результаты среди протестированных показал Claude Opus 4.6 — многие другие LLM часто завершали работу слишком рано или неэффективно расходовали время. 

Почему это важно: стандартные бенчмарки оценивают удачные первые попытки, тогда как в реальной инженерии важнее устойчивость и способность долго и итеративно улучшать решение. AutoLab как раз измеряет эту «выносливость» агентов в многочасовых задачах.

🟥Hexo Labs и Оксфорд представили систему SIA: она объединяет два направления самоулучшения ИИ — изменение внешней обвязки и обновление внутренних весов модели — в единый цикл. Состоит из трёх компонентов: 

• мета-агент формирует структуру решения
• рабочий агент выполняет задачи
• агент обратной связи анализирует процесс и решает, что улучшать: инструменты, логику или сами веса через обучение с подкреплением 

Обвязка отвечает за внешнюю организацию работы, а веса — за накопление знаний и паттернов, которые нельзя задать через промпты. На экспериментах SIA показала 70,1% точности в LawBench и ускорение GPU-кода на 12,4%.

Почему это важно: в будущем агент обратной связи сможет сам обучаться через метаобучение с подкреплением и улучшать стратегию выбора между типами обновлений. Развитие ИИ происходит через системы, которые одновременно эволюционируют архитектуру и накапливают знания, а не только через масштаб моделей.
Также на неделе:
• Ant Group показала метод OPRD (On-Policy Representation Distillation) — он передаёт знания от мощной модели к компактной через согласование внутренних представлений, а не только итоговые ответы
• Meituan предложила подход к созданию саморазвивающихся агентов: обобщение опыта на уровне принципов, пошаговое внедрение новых знаний и контекстная дистилляция
• University of California, UC Berkeley и другие организации выпустили бенчмарк Agents’ Last Exam: он оценивает ИИ-агентов на реалистичных профессиональных задачах с высокой экономической ценностью
• Alibaba предлагает AdaCoM: внешний модуль, который управляет контекстом, обучается с подкреплением и решает, какую информацию сохранять, сжимать или удалять, не меняя саму модель
• UC Berkeley, Chroma и University of Illinois at Urbana-Champaign разработали Harness-1 — поискового ИИ-агента на 20 млрд параметров, обученного с подкреплением в специальной среде для управления рабочим контекстом
• Anthropic выпустила Claude Fable 5 — первую модель семейства Mythos, разработанную с акцентом на безопасность

↗️ red_mad_robot
Please open Telegram to view this post
VIEW IN TELEGRAM
83