Anthropic пропатчила уязвимость в песочнице Claude Code. Баг позволял извлекать токены и исходный код разработчиков через инъекцию нулевого байта в SOCKS5.
Внутренний фильтр считал строку с нулевым символом безопасной, после чего операционная система обрезала текст по байту и подключалась к заблокированному хосту. В связке с промпт-инъекцией через анализируемые моделью файлы механизм давал возможность выполнять код и отправлять данные на сторонние серверы.
Уязвимость присутствовала в релизах до версии 2.1.89. Патч вышел в сборке 2.1.90 без упоминания в чейнджлоге и регистрации CVE. По заявлению Anthropic, разработчики обнаружили и закрыли баг внутренними силами до публикации отчета исследователей.
https://www.theregister.com/security/2026/05/20/even-claude-agrees-hole-in-its-sandbox-was-real-and-dangerous/5243662
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11👍8🔥1
Это тот редкий случай, когда сложную архитектурную идею можно открыть не в виде сухой формулы из статьи, а в виде понятного кода, где видно, как именно модель выбирает, на какие токены смотреть.
Проблема обычного attention хорошо знакома всем, кто работал с длинным контекстом: чем больше последовательность, тем дороже становится вычисление. Каждый токен сравнивается со всеми предыдущими, и цена быстро улетает в квадрат. Sparse attention пытается убрать лишнюю работу без полного отказа от качества.
В реализации показан базовый механизм DSA: лёгкий индексатор оценивает важность прошлых токенов, затем выбираются top-K позиций, остальные маскируются, и attention считается только по релевантным участкам контекста. По сути, модель получает не весь контекст подряд, а отфильтрованное поле внимания.
В примере есть GPT-style модель, слой attention с DSA, optional KV cache, отдельный runnable-скрипт и тесты. Это не production-код уровня DeepSeek V3.2 с fused kernels, MLA и серверными оптимизациями. Зато это хороший учебный разбор, где архитектурная идея превращается в читаемую реализацию.
Sparse attention здесь разобрать пройти руками: от scoring до маскирования и выбора токенов.
https://github.com/rasbt/LLMs-from-scratch/tree/main/ch04/09_dsa
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11❤8👍7❤🔥3
Anthropic, кажется, снова спалилась раньше времени.
В интерфейсе Claude на короткое время засветилась модель claude-mythos-1-preview, а в коде нашли новые строки с упоминанием Mythos и фразой про «Access to the Claude Mythos».
По данным TestingCatalog, модель готовят к выпуску в Claude Code и Claude Security, то есть профиль явно кодерско-безопасностный.
Параллельно OpenAI выкатывает GPT-5.5-Cyber, но делает это тихо, через Trusted Access для верифицированных специалистов по защите.
То есть две компании идут в одну и ту же нишу (кибербез и автономный код), но с разной стилистикой: одни через закрытую программу для red/blue team, другие через утечку в проде и закончившиеся мощности сразу после показа.
Если Mythos действительно метит в Claude Code и Security, ждём заметного скачка по агентным сценариям: длинные цепочки рассуждений на кодовой базе, аудит, поиск уязвимостей, работа в репозиториях без постоянного присмотра человека. Под это же стыкуется и осторожность с релизом, у моделей такого уровня офенсивный потенциал растёт быстрее, чем хочется показывать в публичном API.
https://x.com/Machinelearrn/status/2058446877813510325
В интерфейсе Claude на короткое время засветилась модель claude-mythos-1-preview, а в коде нашли новые строки с упоминанием Mythos и фразой про «Access to the Claude Mythos».
По данным TestingCatalog, модель готовят к выпуску в Claude Code и Claude Security, то есть профиль явно кодерско-безопасностный.
Параллельно OpenAI выкатывает GPT-5.5-Cyber, но делает это тихо, через Trusted Access для верифицированных специалистов по защите.
То есть две компании идут в одну и ту же нишу (кибербез и автономный код), но с разной стилистикой: одни через закрытую программу для red/blue team, другие через утечку в проде и закончившиеся мощности сразу после показа.
Если Mythos действительно метит в Claude Code и Security, ждём заметного скачка по агентным сценариям: длинные цепочки рассуждений на кодовой базе, аудит, поиск уязвимостей, работа в репозиториях без постоянного присмотра человека. Под это же стыкуется и осторожность с релизом, у моделей такого уровня офенсивный потенциал растёт быстрее, чем хочется показывать в публичном API.
https://x.com/Machinelearrn/status/2058446877813510325
🔥16❤7🥱4👍2
🔥 Полное внимание возвращается: 9× ускорение префилла на 1M токенов
Alibaba и Нанкинский университет показали метод RTPurbo. На контексте в миллион токенов префилл ускоряется до 9,36× относительно FlashAttention-2, декодинг - примерно вдвое. Качество на длинных бенчмарках остаётся близким к full attention, а адаптация лёгкая: переобучать модель с нуля не нужно.
Идея в том, что внутри уже обученной модели с full attention есть скрытая разреженность. Не все attention heads реально ходят за дальними токенами. Большинство работает локально, а за retrieval из далёкого контекста отвечает только небольшая часть голов.
RTPurbo считает полное внимание только для этих retrieval-голов. Остальным хватает соседнего окна.
Для поиска нужных токенов используется дешёвый 16-мерный индексатор. Он не заменяет настоящее внимание, а работает как разведчик: быстро отбирает кандидатов из прошлого контекста, после чего честное внимание считается уже на маленьком наборе токенов в полной размерности.
Длинный контекст стоит дорого не потому, что вся история одинаково важна, а потому что мы часто считаем внимание там, где оно почти ничего не меняет.
RTPurbo показывает, что значительную часть вычислений можно срезать инженерно, без полного переобучения модели и без заметной потери качества.
В full attention много лишней работы, и её можно убирать гораздо аккуратнее, чем просто резать контекст или надеяться на магию sparse attention.
arxiv.org/abs/2605.16928v1
Alibaba и Нанкинский университет показали метод RTPurbo. На контексте в миллион токенов префилл ускоряется до 9,36× относительно FlashAttention-2, декодинг - примерно вдвое. Качество на длинных бенчмарках остаётся близким к full attention, а адаптация лёгкая: переобучать модель с нуля не нужно.
Идея в том, что внутри уже обученной модели с full attention есть скрытая разреженность. Не все attention heads реально ходят за дальними токенами. Большинство работает локально, а за retrieval из далёкого контекста отвечает только небольшая часть голов.
RTPurbo считает полное внимание только для этих retrieval-голов. Остальным хватает соседнего окна.
Для поиска нужных токенов используется дешёвый 16-мерный индексатор. Он не заменяет настоящее внимание, а работает как разведчик: быстро отбирает кандидатов из прошлого контекста, после чего честное внимание считается уже на маленьком наборе токенов в полной размерности.
Длинный контекст стоит дорого не потому, что вся история одинаково важна, а потому что мы часто считаем внимание там, где оно почти ничего не меняет.
RTPurbo показывает, что значительную часть вычислений можно срезать инженерно, без полного переобучения модели и без заметной потери качества.
В full attention много лишней работы, и её можно убирать гораздо аккуратнее, чем просто резать контекст или надеяться на магию sparse attention.
arxiv.org/abs/2605.16928v1
❤12🔥7👍6🥴1
Системный аналитик помогает бизнесу и разработке говорить на одном языке: разбирает задачи компании, описывает требования, проектирует IT-решения и следит, чтобы система работала на реальные цели бизнеса.
Онлайн-магистратура СПбГУ и Нетологии «Системный анализ и интеллектуальные системы управления бизнес-процессами» готовит специалистов на стыке IT и управления.
В программе сочетаются академическая база СПбГУ и прикладные инструменты Нетологии. Студенты изучают математическое моделирование, алгоритмы, системный анализ, Python, BI-системы, no-code-инструменты, управление проектами и подходы к внедрению искусственного интеллекта.
Такой набор навыков помогает работать со сложными бизнес-процессами: находить узкие места, снижать риски при разработке, формулировать требования к системам и сопровождать внедрение IT-решений.
Обучение проходит полностью онлайн. После выпуска вы получаете диплом магистра СПбГУ очного образца по направлению «Прикладная информатика».
Подробнее о программе
Реклама. ООО “Нетология” ОГРН 1207700135884 Erid: 2VSb5xczaJE
Онлайн-магистратура СПбГУ и Нетологии «Системный анализ и интеллектуальные системы управления бизнес-процессами» готовит специалистов на стыке IT и управления.
В программе сочетаются академическая база СПбГУ и прикладные инструменты Нетологии. Студенты изучают математическое моделирование, алгоритмы, системный анализ, Python, BI-системы, no-code-инструменты, управление проектами и подходы к внедрению искусственного интеллекта.
Такой набор навыков помогает работать со сложными бизнес-процессами: находить узкие места, снижать риски при разработке, формулировать требования к системам и сопровождать внедрение IT-решений.
Обучение проходит полностью онлайн. После выпуска вы получаете диплом магистра СПбГУ очного образца по направлению «Прикладная информатика».
Подробнее о программе
Реклама. ООО “Нетология” ОГРН 1207700135884 Erid: 2VSb5xczaJE
❤2🔥2👍1
Huawei планирует создать эквивалент 1,4-нм чипов к 2031 году, несмотря на американские санкции
Концепцию развития технологии под названием «закон масштабирования Tau» представил президент полупроводникового подразделения компании Хэ Тинбо.
Её суть заключается в сокращении времени, за которое данные проходят через систему, поскольку, как считают в Huawei, больше нельзя полагаться только на уменьшение размеров транзисторов.
Технология позволит достигнуть желаемой мощности в обход американцев, которые ограничили для китайцев доступ к технологиям, необходимым для создания полупроводников.
Чипы Kirin, в которых будет использоваться родственная архитектура LogicFolding, выйдут уже осенью. В компании заявили, что на основе этой концепции уже выпустили 381 микросхему.
Концепцию развития технологии под названием «закон масштабирования Tau» представил президент полупроводникового подразделения компании Хэ Тинбо.
Её суть заключается в сокращении времени, за которое данные проходят через систему, поскольку, как считают в Huawei, больше нельзя полагаться только на уменьшение размеров транзисторов.
Технология позволит достигнуть желаемой мощности в обход американцев, которые ограничили для китайцев доступ к технологиям, необходимым для создания полупроводников.
Чипы Kirin, в которых будет использоваться родственная архитектура LogicFolding, выйдут уже осенью. В компании заявили, что на основе этой концепции уже выпустили 381 микросхему.
👍17🔥6❤2🌚2🥴1
Офер в Яндекс за выходные: 6–7 июня
Если вы продуктовый, дата-аналитик или датасаентист с опытом на Python от 3 лет, участвуйте в Weekend Offer Analytics*.
Как всё устроено:
🔵 до 27 мая — регистрация;
🔵 6 июня — две технические секции, вместо трёх в обычном найме;
🔵 7 июня — знакомство с командами и офер.
В мероприятии участвуют команды: R&D, Автономный транспорт, Алиса и Умные устройства, Поиск и Суперапп, Независимый Ecom и другие. Вы сможете пообщаться с нанимающими менеджерами и выбрать проект, который покажется самым интересным.
Все подробности и полезные ссылки — на сайте. После регистрации с вами свяжется рекрутер и договорится об удобном времени для интервью.
Если вы продуктовый, дата-аналитик или датасаентист с опытом на Python от 3 лет, участвуйте в Weekend Offer Analytics*.
Как всё устроено:
В мероприятии участвуют команды: R&D, Автономный транспорт, Алиса и Умные устройства, Поиск и Суперапп, Независимый Ecom и другие. Вы сможете пообщаться с нанимающими менеджерами и выбрать проект, который покажется самым интересным.
Все подробности и полезные ссылки — на сайте. После регистрации с вами свяжется рекрутер и договорится об удобном времени для интервью.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣5🐳3❤2
🔥 Huawei хочет обойти санкции не нанометрами, а задержками в чипе
Huawei представила Tau Scaling Law - подход, который должен ускорять чипы не только за счёт уменьшения транзисторов, а за счёт сокращения времени прохождения сигнала внутри схемы.
Идея простая: если нельзя быстро догнать TSMC и Intel по литографии, нужно выжимать больше из архитектуры, трассировки, памяти, interconnect и софта. Меньше лишнего пути для сигнала - меньше задержка, выше плотность и эффективность.
Ключевая техника называется LogicFolding. Связанные логические блоки размещают ближе друг к другу, укорачивают критические провода, снижают сопротивление и паразитную ёмкость. Это даёт прирост без полноценного скачка на новый техпроцесс.
Huawei утверждает, что за последние шесть лет уже спроектировала и массово выпустила 381 чип с этим подходом, а будущие Kirin осенью 2026 года станут первым крупным тестом LogicFolding.
Самая громкая заявка - к 2031 году выйти на плотность уровня 14Å, то есть примерно 1,4 нм, без прямой зависимости от классического shrink.
Звучит амбициозно, но контекст важен: после санкций Huawei фактически вынуждена искать обходные инженерные пути. Если доступ к лучшей литографии ограничен, приходится оптимизировать всё остальное - от транзистора и схемы до системной шины и планировщика.
Это не отменяет физику и не делает Huawei новым TSMC завтра. Но показывает, куда может сдвинуться гонка чипов: не только «у кого меньше нанометры», а «кто лучше сокращает задержки по всему стеку».
huawei.com/en/news/2026/5/ieee-iscas-tau-scaling
Huawei представила Tau Scaling Law - подход, который должен ускорять чипы не только за счёт уменьшения транзисторов, а за счёт сокращения времени прохождения сигнала внутри схемы.
Идея простая: если нельзя быстро догнать TSMC и Intel по литографии, нужно выжимать больше из архитектуры, трассировки, памяти, interconnect и софта. Меньше лишнего пути для сигнала - меньше задержка, выше плотность и эффективность.
Ключевая техника называется LogicFolding. Связанные логические блоки размещают ближе друг к другу, укорачивают критические провода, снижают сопротивление и паразитную ёмкость. Это даёт прирост без полноценного скачка на новый техпроцесс.
Huawei утверждает, что за последние шесть лет уже спроектировала и массово выпустила 381 чип с этим подходом, а будущие Kirin осенью 2026 года станут первым крупным тестом LogicFolding.
Самая громкая заявка - к 2031 году выйти на плотность уровня 14Å, то есть примерно 1,4 нм, без прямой зависимости от классического shrink.
Звучит амбициозно, но контекст важен: после санкций Huawei фактически вынуждена искать обходные инженерные пути. Если доступ к лучшей литографии ограничен, приходится оптимизировать всё остальное - от транзистора и схемы до системной шины и планировщика.
Это не отменяет физику и не делает Huawei новым TSMC завтра. Но показывает, куда может сдвинуться гонка чипов: не только «у кого меньше нанометры», а «кто лучше сокращает задержки по всему стеку».
huawei.com/en/news/2026/5/ieee-iscas-tau-scaling
👍16🥱3🤔2🥴2❤1😁1
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍1
🌟 Интуитивные голосовые интерфейсы с Moonshine Voice
Moonshine Voice — это открытый инструмент для разработчиков, позволяющий создавать голосовые приложения в реальном времени. Все работает на устройстве, обеспечивая высокую скорость и конфиденциальность без необходимости в учетных записях или API-ключах. Поддерживает множество языков и предлагает высокую точность распознавания речи.
🚀 Основные моменты:
- Оптимизирован для приложений с низкой задержкой.
- Поддержка множества платформ: от Python до IoT-устройств.
- Простые в использовании API для транскрипции и синтеза речи.
- Высокая точность моделей, превосходящая Whisper Large V3.
- Многоязычная поддержка для STT и TTS.
📌 GitHub: https://github.com/moonshine-ai/moonshine
#python
Moonshine Voice — это открытый инструмент для разработчиков, позволяющий создавать голосовые приложения в реальном времени. Все работает на устройстве, обеспечивая высокую скорость и конфиденциальность без необходимости в учетных записях или API-ключах. Поддерживает множество языков и предлагает высокую точность распознавания речи.
🚀 Основные моменты:
- Оптимизирован для приложений с низкой задержкой.
- Поддержка множества платформ: от Python до IoT-устройств.
- Простые в использовании API для транскрипции и синтеза речи.
- Высокая точность моделей, превосходящая Whisper Large V3.
- Многоязычная поддержка для STT и TTS.
📌 GitHub: https://github.com/moonshine-ai/moonshine
#python
❤6👍3🔥2
Anthropic впервые обошла OpenAI по внедрению в бизнесе: 34,4% против 32,3%, согласно последнему AI Index от Ramp.
Но забавно, что тот же отчёт, который объявляет об этом лидерстве, большую часть текста объясняет, почему оно, вероятно, долго не продержится. Uber уже полностью израсходовал свой AI-бюджет на 2026 год. А недавнее обновление модели утроило стоимость любого промпта, где есть изображение.
Тем временем самые быстрорастущие AI-вендоры на платформе Ramp сейчас - это inference-платформы, которые продают доступ к дешёвым open-source моделям.
Anthropic выигрывает гонку внедрения ровно в тот момент, когда её продукт становится дороже в использовании. И вот это, честно говоря, самая интересная часть всей истории.
Но забавно, что тот же отчёт, который объявляет об этом лидерстве, большую часть текста объясняет, почему оно, вероятно, долго не продержится. Uber уже полностью израсходовал свой AI-бюджет на 2026 год. А недавнее обновление модели утроило стоимость любого промпта, где есть изображение.
Тем временем самые быстрорастущие AI-вендоры на платформе Ramp сейчас - это inference-платформы, которые продают доступ к дешёвым open-source моделям.
Anthropic выигрывает гонку внедрения ровно в тот момент, когда её продукт становится дороже в использовании. И вот это, честно говоря, самая интересная часть всей истории.
😁15❤4👍4🔥3
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
Белый дом одобрил выделение $9 млрд АНБ и ЦРУ на закупку ускорителей Nvidia Grace Blackwell. Цель - создание изолированной ИИ-инфраструктуры.
Спецслужбы закупят в обход Пентагона невыпущенную модель Mythos от Anthropic. Технические требования Mythos позволяют развернуть ее на серверах предыдущего поколения, пока строятся новые дата-центры.
Ранее Минобороны США настаивало на праве использовать алгоритмы для любых законных целей, против чего выступала Anthropic. В итоговом контракте этот пункт убрали. Вместо него прописан прямой запрет применять Mythos для анализа данных и слежки за гражданами США.
Ожидается, что документ станет юридическим шаблоном для будущих контрактов со всеми ИИ-разработчиками.
nytimes.com
Команда Preparedness в OpenAI открыла вакансию исследователя рисков автономного развития ИИ с зарплатой $445 000.
В задачи специалиста войдет разработка инструментов интерпретируемости, защита от отравления данных и внедрение метрик для оценки скорости автоматизации труда инженеров.
По планам Сэма Альтмана, к сентябрю 2026 года компания запустит автоматизированного ИИ-стажера для исследований. Появление полностью автономных R&D-систем прогнозируется к 2028 году.
businessinsider.com
Apple добавила поддомен genai.apple.com на свои DNS-серверы. Страница пока недоступна, назначение этого портала неизвестно.
Ожидается, что 8 июня на WWDC 2026 компания представит iOS 27, iPadOS 27 и macOS 27. В новых версиях Siri получит интерфейс чат-бота и функцию распознавания экранного контекста.
Apple Intelligence расширит функциональность базовых сервисов. Voice Control начнет распознавать команды на естественном языке без жестких шаблонов. Алгоритмы Visual Intelligence смогут напрямую парсить данные с визиток или сканировать состав продуктов, а Safari получит автогенерацию названий для групп вкладок.
Также заявлена поддержка создания быстрых команд с помощью ИИ и генерация автоматических субтитров для видео.
macrumors.com
xAI завершила претрейн модели Grok V9-Medium на 1.5T параметров. Публичный релиз ожидается через две-три недели.
Сейчас команда проводит файн-тюнинг, после чего перейдёт к этапу RL. По словам Илона Маска, первые внутренние тесты показали положительные результаты.
На этапе дополнительного обучения разработчики задействовали массив данных от редактора Cursor. xAI рассчитывает, что это улучшит показатели модели в кодинге по сравнению с предыдущей версией v8-small.
Elon Musk в сети Х
LeRobot (подразделение Hugging Face) выпустила open-source проект двуногого робота. Детали корпуса печатаются на 3D-принтере, стоимость сборки со стандартными приводами составляет около $2500.
В релиз вошли инструменты симуляции, алгоритмы калибровки, sim-to-real пайплайны и базовые модели обучения ходьбе. Пока для сборки доступна только нижняя часть платформы. Интеграция плечевого пояса и обучение моторике всего тела заявлены в дорожной карте.
Использование 3D-печати позволяет самостоятельно перепечатывать сломанные детали и не прерывать исследования локомоции на время ожидания запчастей.
huggingface.co
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍1
10 GitHub-репозиториев, чтобы собрать AI-агентов, которые будут отправлять pull request, пока вы спите.
Сохраняйте список, пока менеджер не узнал.
1. OpenHands
74K stars. Раньше проект назывался OpenDevin. Автономный coding agent, который читает GitHub issues, пишет фикс, открывает PR и ждёт ревью. Заявляют 77% на SWE-bench Verified.
Repo: https://github.com/All-Hands-AI/OpenHands
2. SWE-agent
Проект от Princeton и Stanford для автономного решения реальных GitHub issues. Подключаете к репозиторию - просыпаетесь с исправленными багами.
Repo: https://github.com/princeton-nlp/SWE-agent
3. Aider
Git-aware CLI-агент, который работает прямо с вашим репозиторием: делает чистые коммиты, стейджит diff, пишет commit messages и помогает мержить изменения.
Repo: https://github.com/paul-gauthier/aider
4. Cline
VS Code-агент для автономной разработки фич. Читает кодовую базу, редактирует файлы, запускает тесты и может работать через ваш API key.
Repo: https://github.com/cline/cline
5. claude-task-master
Оркестрация задач для multi-agent workflow. Один промпт превращается в набор задач для нескольких специализированных агентов, которые вместе тащат фичу.
Repo: https://github.com/eyaltoledano/claude-task-master
6. LangGraph
Оркестрационный слой для production AI-систем: состояние, устойчивое выполнение, наблюдаемость и контроль сложных agentic workflows.
Repo: https://github.com/langchain-ai/langgraph
7. CrewAI
Фреймворк для multi-agent workflows, где агенты делят роли, задачи и вместе выполняют работу по пайплайну.
Repo: https://github.com/crewAIInc/crewAI
8. awesome-mcp-servers
Каталог MCP-серверов, через которые агент может подключаться к инструментам: GitHub, Slack, Linear, Stripe, Postgres, Notion и другим сервисам.
Repo: https://github.com/punkpeye/awesome-mcp-servers
9. Browser Use
92K stars. Браузерная автоматизация через vision + DOM. Агент может ходить по сайтам, заполнять формы, собирать данные и возвращать результат.
Repo: https://github.com/browser-use/browser-use
10. n8n
Слой триггеров и автоматизации. Можно связать агента с GitHub webhooks, Slack-сообщениями, календарём, cron-задачами и внешними API. Можно self-host на дешёвом сервере.
Repo: https://github.com/n8n-io/n8n
Все эти инструменты бесплатные и open source. Они не спят, не выгорают и не ждут, пока кто-то вручную разложит задачу по полочкам.
Сохраняйте список, пока менеджер не узнал.
1. OpenHands
74K stars. Раньше проект назывался OpenDevin. Автономный coding agent, который читает GitHub issues, пишет фикс, открывает PR и ждёт ревью. Заявляют 77% на SWE-bench Verified.
Repo: https://github.com/All-Hands-AI/OpenHands
2. SWE-agent
Проект от Princeton и Stanford для автономного решения реальных GitHub issues. Подключаете к репозиторию - просыпаетесь с исправленными багами.
Repo: https://github.com/princeton-nlp/SWE-agent
3. Aider
Git-aware CLI-агент, который работает прямо с вашим репозиторием: делает чистые коммиты, стейджит diff, пишет commit messages и помогает мержить изменения.
Repo: https://github.com/paul-gauthier/aider
4. Cline
VS Code-агент для автономной разработки фич. Читает кодовую базу, редактирует файлы, запускает тесты и может работать через ваш API key.
Repo: https://github.com/cline/cline
5. claude-task-master
Оркестрация задач для multi-agent workflow. Один промпт превращается в набор задач для нескольких специализированных агентов, которые вместе тащат фичу.
Repo: https://github.com/eyaltoledano/claude-task-master
6. LangGraph
Оркестрационный слой для production AI-систем: состояние, устойчивое выполнение, наблюдаемость и контроль сложных agentic workflows.
Repo: https://github.com/langchain-ai/langgraph
7. CrewAI
Фреймворк для multi-agent workflows, где агенты делят роли, задачи и вместе выполняют работу по пайплайну.
Repo: https://github.com/crewAIInc/crewAI
8. awesome-mcp-servers
Каталог MCP-серверов, через которые агент может подключаться к инструментам: GitHub, Slack, Linear, Stripe, Postgres, Notion и другим сервисам.
Repo: https://github.com/punkpeye/awesome-mcp-servers
9. Browser Use
92K stars. Браузерная автоматизация через vision + DOM. Агент может ходить по сайтам, заполнять формы, собирать данные и возвращать результат.
Repo: https://github.com/browser-use/browser-use
10. n8n
Слой триггеров и автоматизации. Можно связать агента с GitHub webhooks, Slack-сообщениями, календарём, cron-задачами и внешними API. Можно self-host на дешёвом сервере.
Repo: https://github.com/n8n-io/n8n
Все эти инструменты бесплатные и open source. Они не спят, не выгорают и не ждут, пока кто-то вручную разложит задачу по полочкам.
😁8🔥3❤2👍2
🚀 ForgeTrain: фреймворк для pre-training, который написали ИИ-агенты
OpenBMB представили ForgeTrain - production-level фреймворк для pre-training, код которого был сгенерирован ИИ без ручного написания человеком.
Заявка интересная не из-за красивой фразы «AI пишет AI», а из-за масштаба. Это не демка на toy-проекте, а инфраструктурный код для обучения моделей, который проверяли на реальном железе.
Что заявляют авторы:
- на NVIDIA H100 ForgeTrain обгоняет Megatron примерно на 10%
- достигнут показатель 44.13% MFU
- пайплайн pre-training проверен не только на H100, но и на Huawei Ascend 910
- на ForgeTrain обучили MiniCPM5-1B, который занял первое место среди моделей до 2B параметров в Artificial Analysis Index
- код фреймворка и Agent Harness обещают открыть для воспроизведения
💻 GitHub: https://github.com/OpenBMB/ForgeTrain
OpenBMB представили ForgeTrain - production-level фреймворк для pre-training, код которого был сгенерирован ИИ без ручного написания человеком.
Заявка интересная не из-за красивой фразы «AI пишет AI», а из-за масштаба. Это не демка на toy-проекте, а инфраструктурный код для обучения моделей, который проверяли на реальном железе.
Что заявляют авторы:
- на NVIDIA H100 ForgeTrain обгоняет Megatron примерно на 10%
- достигнут показатель 44.13% MFU
- пайплайн pre-training проверен не только на H100, но и на Huawei Ascend 910
- на ForgeTrain обучили MiniCPM5-1B, который занял первое место среди моделей до 2B параметров в Artificial Analysis Index
- код фреймворка и Agent Harness обещают открыть для воспроизведения
💻 GitHub: https://github.com/OpenBMB/ForgeTrain
❤6👍4🔥2