Intuit превратили GenOS в конвейер ИИ-агентов для 100М пользователей
Один из интересных кейсов на AWS Summit - как Intuit разработали и прокачали свою собственную операционную систему GenOS для работы с бухгалтерией.
Представьте если бы, например, 1С выпустила свою операционную систему с ИИ агентами.
GenOS эволюционировала от экспериментов до промышленной платформы агентной автоматизации за 2 года.
Теперь это полноценная ОС для создания ИИ-приложений: собственные финансовые LLM плюс интеграция с GPT, Claude, Amazon Nova.
Agent Starter Kit за 5 недель привлёк 900+ разработчиков и 100+ команд. Агенты уже работают в QuickBooks (автообработка дебиторки), TurboTax (автоконвертация налоговых изменений в код).
Техническая начинка из 4 компонентов:
- GenWorkbench (IDE для агентов),
- GenRuntime (интеллектуальный слой планирования),
- GenSRF (защита от prompt injection),
- GenUX (150+ UI-компонентов).
Система обрабатывает 60 млрд ML-транзакций в день.
#Intuit #GenOS #agents
———
@tsingular
Один из интересных кейсов на AWS Summit - как Intuit разработали и прокачали свою собственную операционную систему GenOS для работы с бухгалтерией.
Представьте если бы, например, 1С выпустила свою операционную систему с ИИ агентами.
GenOS эволюционировала от экспериментов до промышленной платформы агентной автоматизации за 2 года.
Теперь это полноценная ОС для создания ИИ-приложений: собственные финансовые LLM плюс интеграция с GPT, Claude, Amazon Nova.
Agent Starter Kit за 5 недель привлёк 900+ разработчиков и 100+ команд. Агенты уже работают в QuickBooks (автообработка дебиторки), TurboTax (автоконвертация налоговых изменений в код).
Техническая начинка из 4 компонентов:
- GenWorkbench (IDE для агентов),
- GenRuntime (интеллектуальный слой планирования),
- GenSRF (защита от prompt injection),
- GenUX (150+ UI-компонентов).
Система обрабатывает 60 млрд ML-транзакций в день.
#Intuit #GenOS #agents
———
@tsingular
✍3🔥3👍2
Коллекция из 300+ кейсов ML-систем от 80+ компаний
Репозиторий собрал практические примеры дизайна машинного обучения от Netflix, Uber, Google и десятков других компаний.
Каждый кейс показывает реальные решения: как справились с масштабированием, какие архитектурные хаки применили, где споткнулись.
Особенно ценны примеры борьбы с bias'ами в моделях и методы оценки эффективности в разных индустриях.
Материалы структурированы по отраслям и типам ML-задач. Можно быстро найти релевантный опыт для своего проекта.
Теперь не нужно изобретать велосипед - кто-то уже наступил на все грабли за вас.
#ML #кейсы
------
@tsingular
Репозиторий собрал практические примеры дизайна машинного обучения от Netflix, Uber, Google и десятков других компаний.
Каждый кейс показывает реальные решения: как справились с масштабированием, какие архитектурные хаки применили, где споткнулись.
Особенно ценны примеры борьбы с bias'ами в моделях и методы оценки эффективности в разных индустриях.
Материалы структурированы по отраслям и типам ML-задач. Можно быстро найти релевантный опыт для своего проекта.
Теперь не нужно изобретать велосипед - кто-то уже наступил на все грабли за вас.
#ML #кейсы
------
@tsingular
🔥4⚡3✍3
Меньше чем через час начинаем эфир на тему новинок с AWS Summit 2025.
https://xn--r1a.website/tsingular/4646
Стрим будет тут
#AWS #эфиры
———
@tsingular
https://xn--r1a.website/tsingular/4646
Стрим будет тут
#AWS #эфиры
———
@tsingular
👍6⚡2❤2
Anthropic релизнули Opus 4.1
SWE-bench 74.5% против 72.5% у Opus 4
в API: claude-opus-4-1-20250805
С его ценой, - кто-нибудь вообще использует его?
Хотя, конечно, по метрикам хорош.
#Claude #Opus
———
@tsingular
SWE-bench 74.5% против 72.5% у Opus 4
в API: claude-opus-4-1-20250805
С его ценой, - кто-нибудь вообще использует его?
Хотя, конечно, по метрикам хорош.
#Claude #Opus
———
@tsingular
👍2🔥2❤1
OpenAI выпустили открытки
HF: gpt-oss-120b - 64Гига (2х 5090)
HF: gpt-oss-20b - 16гигов
128K токенов контекста
q4 нарезка
Apache 2.0
Demo
#OpenAI #OSS
———
@tsingular
HF: gpt-oss-120b - 64Гига (2х 5090)
HF: gpt-oss-20b - 16гигов
128K токенов контекста
q4 нарезка
Apache 2.0
Demo
#OpenAI #OSS
———
@tsingular
👍7🔥4💯2
Forwarded from Denis Sexy IT 🤖
Го смотреть стрим игры в шахматы между Opus 4 и Gemini 2.5 Pro:
https://youtu.be/Kd2SszjZwr0?si=fde-RnB48xaxICD9
https://youtu.be/Kd2SszjZwr0?si=fde-RnB48xaxICD9
YouTube
Game Arena: Gemini 2.5 Pro vs Claude Opus 4 (Round 1) | Kaggle
Get ready for an epic AI chess showdown in the Kaggle Game Arena! This match is part of our inaugural 3-day exhibition tournament, where eight of the world’s most advanced language models compete to see which one reigns supreme.
Each model brings its own…
Each model brings its own…
❤1👍1
Media is too big
VIEW IN TELEGRAM
🎙 Запись эфира: AWS Summit, AI-агенты и будущее ИИ
Сегодня обсудили с Владимиром Проворовым ( @itismyjob ) главные тренды в развитии AI, как на AWS Summit так и за его пределами.
Ключевые темы:
- Amazon Bedrock AgentCore - 7 новых сервисов для создания агентов с разделяемой памятью и маркетплейсом инструментов для ИИ агентов
- S3 Vectors - масштабные векторный базы данных для агентов работающих с миллионами документов
- Kiro IDE - новый конкурент Cursor, Trae & ClaudeCode - ИИ агент, который создает код с учетом архитектурных требований
- Intuit - стартап обрабатывающий 60 млрд налоговых транзакций с помощью МЛ, создавший свою операционку для ИИ агентов.
Так же обсудили последние новости и модели
- OpenAI выпустила две открытые модели GPT-OSS (20B и 120B параметров) - уровня O3, но весом всего 64 ГБ
- Anthropic обновил Opus до версии 4.1
Коснулись инфраструктуры будущего:
- Гонка за создание дата-центров на миллион GPU (8 в мире, включая Китай)
- Маск строит кластер Colossus в палатках чтобы в этой гонке не отставать
- Энергетический вопрос становится критическим - компании ищут регионы с дешевым электричеством
Главный инсайт: Мы входим в технологический резонанс - AI помогает создавать более мощные модели и железо, которые позволят создать еще более мощный AI.
Отставание на год может означать отставание навсегда.
Youtube
Rutube
#эфиры #AWS
------
@tsingular
Сегодня обсудили с Владимиром Проворовым ( @itismyjob ) главные тренды в развитии AI, как на AWS Summit так и за его пределами.
Ключевые темы:
- Amazon Bedrock AgentCore - 7 новых сервисов для создания агентов с разделяемой памятью и маркетплейсом инструментов для ИИ агентов
- S3 Vectors - масштабные векторный базы данных для агентов работающих с миллионами документов
- Kiro IDE - новый конкурент Cursor, Trae & ClaudeCode - ИИ агент, который создает код с учетом архитектурных требований
- Intuit - стартап обрабатывающий 60 млрд налоговых транзакций с помощью МЛ, создавший свою операционку для ИИ агентов.
Так же обсудили последние новости и модели
- OpenAI выпустила две открытые модели GPT-OSS (20B и 120B параметров) - уровня O3, но весом всего 64 ГБ
- Anthropic обновил Opus до версии 4.1
Коснулись инфраструктуры будущего:
- Гонка за создание дата-центров на миллион GPU (8 в мире, включая Китай)
- Маск строит кластер Colossus в палатках чтобы в этой гонке не отставать
- Энергетический вопрос становится критическим - компании ищут регионы с дешевым электричеством
Главный инсайт: Мы входим в технологический резонанс - AI помогает создавать более мощные модели и железо, которые позволят создать еще более мощный AI.
Отставание на год может означать отставание навсегда.
Youtube
Rutube
#эфиры #AWS
------
@tsingular
3👍14❤🔥7🔥6⚡2✍1
Media is too big
VIEW IN TELEGRAM
ElevenLabs запустили генератор музыки
Компания ElevenLabs, известная своими генераторами голоса и переводчиками, представила ИИ-генератор музыки.
Инструмент создаёт оригинальные композиции с использованием нейронок и вариационных автоэнкодеров.
Русский поддерживает.
Отменяем подписку на Suno, тут оркестры уровня Ханса Циммера завезли!
UPD: качество такое в плане голоса и акцентов, - идеально генерить пародии.
Угадаете песнь в комментарии?
Подписку на Suno не отменяем :)
#ElevenLabs #music
———
@tsingular
Компания ElevenLabs, известная своими генераторами голоса и переводчиками, представила ИИ-генератор музыки.
Инструмент создаёт оригинальные композиции с использованием нейронок и вариационных автоэнкодеров.
Русский поддерживает.
Отменяем подписку на Suno, тут оркестры уровня Ханса Циммера завезли!
UPD: качество такое в плане голоса и акцентов, - идеально генерить пародии.
Угадаете песнь в комментарии?
Подписку на Suno не отменяем :)
#ElevenLabs #music
———
@tsingular
👍5🔥2❤1⚡1
Amazon заменяет сотрудников на ИИ и объявляет о сокращениях
Глава Amazon Энди Джасси заявил — генеративный ИИ сократит корпоративный штат через повышение эффективности.
В логистической сети компании ИИ уже оптимизирует размещение товаров, прогнозирует спрос и управляет роботами. По данным МВФ, около 60% рабочих мест в развитых экономиках попадут под влияние ИИ.
Параллельно создаются новые высококвалифицированные позиции — аналитики данных, специалисты по машинному обучению. Но скорость замещения превышает скорость адаптации рынка труда.
Логично. Роботы не берут больничные и не требуют повышения зарплаты. Но кто будет покупать товары, если все без работы? 🤔
#Amazon #workforce #automation
------
@tsingular
Глава Amazon Энди Джасси заявил — генеративный ИИ сократит корпоративный штат через повышение эффективности.
В логистической сети компании ИИ уже оптимизирует размещение товаров, прогнозирует спрос и управляет роботами. По данным МВФ, около 60% рабочих мест в развитых экономиках попадут под влияние ИИ.
Параллельно создаются новые высококвалифицированные позиции — аналитики данных, специалисты по машинному обучению. Но скорость замещения превышает скорость адаптации рынка труда.
Логично. Роботы не берут больничные и не требуют повышения зарплаты. Но кто будет покупать товары, если все без работы? 🤔
#Amazon #workforce #automation
------
@tsingular
💯8👻3
GitHub Models решает проблему инференса для open source AI проектов
GitHub запустил бесплатный API для инференса популярных моделей - GPT-4o, DeepSeek-R1, Llama 3.
Проблема была в том, что open source проекты постоянно спотыкались о настройку инференса - нужны были ключи API, локальные модели жрали ресурсы, конфигурация отнимала время.
Теперь достаточно GitHub токена и REST эндпоинта, совместимого с OpenAI спецификацией. Никакой дополнительной настройки.
Интеграция с GitHub Actions позволяет автоматизировать AI фичи прямо в CI/CD пайплайнах. Есть бесплатый тир с опцией масштабирования.
Поддерживаются multiple SDK без изменений кода - просто меняешь endpoint.
Удобно. Теперь любой студент может прикрутить ИИ к своему поектику не покидая платформу.
Вообще Гитхаб превращается в пространство самообновляющегося оупенсорса с ИИ мультиагентами разрабами.
#GitHub #inference #opensource
------
@tsingular
GitHub запустил бесплатный API для инференса популярных моделей - GPT-4o, DeepSeek-R1, Llama 3.
Проблема была в том, что open source проекты постоянно спотыкались о настройку инференса - нужны были ключи API, локальные модели жрали ресурсы, конфигурация отнимала время.
Теперь достаточно GitHub токена и REST эндпоинта, совместимого с OpenAI спецификацией. Никакой дополнительной настройки.
Интеграция с GitHub Actions позволяет автоматизировать AI фичи прямо в CI/CD пайплайнах. Есть бесплатый тир с опцией масштабирования.
Поддерживаются multiple SDK без изменений кода - просто меняешь endpoint.
Удобно. Теперь любой студент может прикрутить ИИ к своему поектику не покидая платформу.
Вообще Гитхаб превращается в пространство самообновляющегося оупенсорса с ИИ мультиагентами разрабами.
#GitHub #inference #opensource
------
@tsingular
❤3⚡2👍2🔥2
Добавил в табличку скорости инференса цифры по новой модели OpenAI 20B
летает шустро надо сказать.
В целом напоминает gemma 3n, только метрики получается получше.
Если кто хочет дополнить, - в самой таблице запрашивайте доступ.
#benchmarks #hardware #бенчмарки
———
@tsingular
летает шустро надо сказать.
В целом напоминает gemma 3n, только метрики получается получше.
Если кто хочет дополнить, - в самой таблице запрашивайте доступ.
#benchmarks #hardware #бенчмарки
———
@tsingular
❤5👍3
Google запустил AI First Colab Notebooks в BigQuery и Vertex AI
Google интегрировал ИИ-агентов прямо в Colab блокноты для работы с данными.
Теперь можно просто сказать "проанализируй эти данные" и Data Science Agent сам напишет код, построит графики и найдёт закономерности.
Агенты работают с BigQuery и генерируют код на Python автоматически. Доступны бесплатные GPU и TPU для ускорения вычислений.
Основная фишка — никакой настройки инфраструктуры. Открыл браузер, написал задачу на обычном языке, получил анализ.
Интеграция с Gemini AI позволяет генерировать код и объяснения прямо в процессе работы с данными.
Аналитики данных скоро будут просто болтать с компьютером вместо написания кода. Прогресс! 🤖📊
#Google #Colab #BigQuery
------
@tsingular
Google интегрировал ИИ-агентов прямо в Colab блокноты для работы с данными.
Теперь можно просто сказать "проанализируй эти данные" и Data Science Agent сам напишет код, построит графики и найдёт закономерности.
Агенты работают с BigQuery и генерируют код на Python автоматически. Доступны бесплатные GPU и TPU для ускорения вычислений.
Основная фишка — никакой настройки инфраструктуры. Открыл браузер, написал задачу на обычном языке, получил анализ.
Интеграция с Gemini AI позволяет генерировать код и объяснения прямо в процессе работы с данными.
Аналитики данных скоро будут просто болтать с компьютером вместо написания кода. Прогресс! 🤖📊
#Google #Colab #BigQuery
------
@tsingular
✍5⚡3❤2🔥2
Media is too big
VIEW IN TELEGRAM
Начинают нравиться эти ваши ИИ дипфейки.
Промо Конгресса Подмосковные вечера 2025 прям огонь :)
На конгрессе тоже будет круто, присоединяйтесь (21-23 сентября, ПСБ Патриот)
https://pv2025.4cio.ru/
#pv2025
———
@tsingular
Промо Конгресса Подмосковные вечера 2025 прям огонь :)
На конгрессе тоже будет круто, присоединяйтесь (21-23 сентября, ПСБ Патриот)
https://pv2025.4cio.ru/
#pv2025
———
@tsingular
1🤣14🔥9😁2❤1🍾1
Forwarded from Борис опять
Инсайдерская история на стыке мира AI рисерча и ML в индустрии для вас.
AI Safety организация тестировала гиппотезу можно ли привлечь консалтинговые компании к исследованиям. Конкретнее можно ли нанимать консультантов имплементировать статьи, делать бенчмарки и новые методы.
Начали интервьюировать консультантов больших и маленьких, чтобы оценить, какой вообще пул ML инженеров у них есть.
Одна из компаний-кандидатов это топ-5 менеджмент консалтинг в мире.
И там оказалась такая воронка.
Штат компании: X тысяч человек.
Сколько компания заявила у неё ML специалистов: 500.
Сколько по факту насчитали людей способных делать ML инжиниринг: 20.
Далее этим консультантам предложили сделать тестовое задание и те назвали ценник в несколько тысяч долларов в час. Нормальный такой рейт.
Что не удивительно: им буквально всех нормальных MLE в компании придется задействовать!
В общем можно сделать много разных выводов. Например, что инженеров способных делать инжиниринг около ML рисерча очень мало. Или что бизнесу их много не нужно. Предлагайте свои
AI Safety организация тестировала гиппотезу можно ли привлечь консалтинговые компании к исследованиям. Конкретнее можно ли нанимать консультантов имплементировать статьи, делать бенчмарки и новые методы.
Начали интервьюировать консультантов больших и маленьких, чтобы оценить, какой вообще пул ML инженеров у них есть.
Одна из компаний-кандидатов это топ-5 менеджмент консалтинг в мире.
И там оказалась такая воронка.
Штат компании: X тысяч человек.
Сколько компания заявила у неё ML специалистов: 500.
Сколько по факту насчитали людей способных делать ML инжиниринг: 20.
Далее этим консультантам предложили сделать тестовое задание и те назвали ценник в несколько тысяч долларов в час. Нормальный такой рейт.
В общем можно сделать много разных выводов. Например, что инженеров способных делать инжиниринг около ML рисерча очень мало. Или что бизнесу их много не нужно. Предлагайте свои
🔥2⚡1
Forwarded from Data Secrets
Свежее красивейшее исследование от Anthropic: Persona Vectors в LLM
Помните, как GPT-4o после безобидного дотюнивания вдруг стал страшным подхалимом? Или как Grok начал объявлять себя Гитлером? Естественно, их не учили так себя вести напрямую, но по какой-то причине такая "личность" в них все равно проснулась.
Anthropic в своей новой работе обнаружили, что это далеко не случайность. Оказывается, в нейросетях есть так называемые persona vectors – векторы в пространстве активаций, отвечающие заданным чертам характера.
Более того, исследователи научились такие векторы находить просто по текстовому описанию черты. Пайплайн довольно простой:
Ну а после получения таких персо-векторов делать с ними вообще-то можно очень много всего. Например:
В общем, в этот раз у Anthropic получилась исключительно интересная и многообещая работа, давненько такого не было. Будем следить, и, конечно, советуем почитать полностью👇
Блогпост | Статья
Помните, как GPT-4o после безобидного дотюнивания вдруг стал страшным подхалимом? Или как Grok начал объявлять себя Гитлером? Естественно, их не учили так себя вести напрямую, но по какой-то причине такая "личность" в них все равно проснулась.
Anthropic в своей новой работе обнаружили, что это далеко не случайность. Оказывается, в нейросетях есть так называемые persona vectors – векторы в пространстве активаций, отвечающие заданным чертам характера.
Более того, исследователи научились такие векторы находить просто по текстовому описанию черты. Пайплайн довольно простой:
1. Берем определенную характеристику (скажем, жестокость) и генерируем два системных промпта. Один «за» черту, другой — против (то есть "будь жестоким" и "не будь", только более развернуто).
2. Скармливаем разным экземплярам модели разные системные промпты и начинаем задавать специальные вопросы, провоцирующие проявление нужной характеристики.
3. Для каждого вопроса трекаем активации на каждом слое сети, усредняем по токенам. Разность таких средних активаций первого экземпляра модели со вторым даёт нужный нам вектор для каждого слоя. Также можно затрекать самый яркий слой, на котором вектор персоны дает максимальное влияние на результат.
Ну а после получения таких персо-векторов делать с ними вообще-то можно очень много всего. Например:
– Определять, какие данные активируют тот или иной persona vector. Например, если научить модель на числах 666 или 1488, она в целом станет безжалостной. И таких неочевидных корреляций, как оказалось, куча, а без таких аналитических инструментов обнаруживать их почти нереально.
– Управлять характером LLM на инференсе. Чтобы вызвать или подавить какую-то черту при генерации, нужно просто к активации h_ℓ на слое ℓ добавить α⋅v_ℓ, где v_ℓ – это persona vector. Например, если мы рассматриваем черту "злость", то при положительных α модель генерирует более агрессивные тексты, а при отрицательных – становится зайкой (доказано на Qwen2.5-7B и Llama-3.1-8B).
– Управлять самим обучением. Тут немного конринтуитивно, но это работает как вакцина. Чтобы избавиться от нежелательных черт модели, нам нужно, наоборот, проактивно инъецировать их в нее на каждом шаге обучения.
Конкретнее: на каждом шаге прямого прохода при обучении мы добавляем к активациям все то же α⋅v_ℓ, и получается, что градиенты по задаче next-token prediction накапливаются уже с учётом этого смещения; благодаря этому модель не должна самостоятельно перестраивать себя вдоль данного вектора персоны v_ℓ. Такой подход называется Preventative Steering, и это работает (и при этом надежнее, чем просто единоразовое подавление на инференсе).
В общем, в этот раз у Anthropic получилась исключительно интересная и многообещая работа, давненько такого не было. Будем следить, и, конечно, советуем почитать полностью
Блогпост | Статья
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡9👍6✍4