This media is not supported in your browser
VIEW IN TELEGRAM
Google Translate решил бросить вызов Duolingo и Open AI
Внезапно Google Translate перестал быть просто переводчиком. Теперь это языковой тренажёр с амбициями выйти на поле онлайн-обучения и явно померяться силами с Duolingo.
В сервис добавили модуль для практики языка с ИИ: упражнения на аудирование и произношение, персональные сценарии, возможность выбрать уровень и цели, плюс ежедневный трекинг прогресса. А ещё появились новые режимы перевода - быстрый и продвинутый, где второй строится на базе модели Gemini для более точных формулировок.
• персонализированные упражнения и сценарии
• ежедневное отслеживание прогресса
• живые AI-разговоры для более естественного перевода в реальном времени
• обновлённый интерфейс приложения
• два режима перевода: быстрый и продвинутый (Gemini)
• первые пары продвинутого перевода: английский-испанский и английский-французский
• новая языковая поддержка расширяется, уже есть, например, украинский
• запуск пилота в США, Индии и Мексике на Android и iOS
Google официально называет это конкурентом Duolingo.
Миллионы пользователей уже давно используют его "как попало", а теперь им предлагают полноценные уроки прямо внутри привычного сервиса.
Сергей Булаев AI 🤖 - об AI и не только
Внезапно Google Translate перестал быть просто переводчиком. Теперь это языковой тренажёр с амбициями выйти на поле онлайн-обучения и явно померяться силами с Duolingo.
В сервис добавили модуль для практики языка с ИИ: упражнения на аудирование и произношение, персональные сценарии, возможность выбрать уровень и цели, плюс ежедневный трекинг прогресса. А ещё появились новые режимы перевода - быстрый и продвинутый, где второй строится на базе модели Gemini для более точных формулировок.
• персонализированные упражнения и сценарии
• ежедневное отслеживание прогресса
• живые AI-разговоры для более естественного перевода в реальном времени
• обновлённый интерфейс приложения
• два режима перевода: быстрый и продвинутый (Gemini)
• первые пары продвинутого перевода: английский-испанский и английский-французский
• новая языковая поддержка расширяется, уже есть, например, украинский
• запуск пилота в США, Индии и Мексике на Android и iOS
Google официально называет это конкурентом Duolingo.
Миллионы пользователей уже давно используют его "как попало", а теперь им предлагают полноценные уроки прямо внутри привычного сервиса.
Сергей Булаев AI 🤖 - об AI и не только
2 65 5
Уже неделю тестирую Omnara, про которую мне рассказал Игорь. Он, кстати, позже писал про это в своём клёвом канале
YC бэкед сервис устанавливается вам на компьютер (или сервер) и далее устанавливает туннель до их сервера и даёт вам общаться с Claude Code, через web или приложение на мобильных.
Не сразу получилось настроить (а режим сервера - когда omnara может сама запучкать новые инстансы агента - и вообще пока не получилось). В итоге устанавливать помогал сам же Claude Code.
Есть глюки в интерфейсе в вебе, в приложении - ок (но нет голосового ввода), но главное - полезно. Ты реально получаешь доступ к своему агенту откуда угодно.
Из бонусов полностью открытые исходники, включающие, даже, приложение. Отличная база для собственных экспериментов и исследований.
10 каналов бесплатно - советую всем пробовать. Будут проблемы с установкой - используйте мой лайфхак.
Сергей Булаев AI 🤖 - об AI и не только
YC бэкед сервис устанавливается вам на компьютер (или сервер) и далее устанавливает туннель до их сервера и даёт вам общаться с Claude Code, через web или приложение на мобильных.
Не сразу получилось настроить (а режим сервера - когда omnara может сама запучкать новые инстансы агента - и вообще пока не получилось). В итоге устанавливать помогал сам же Claude Code.
Есть глюки в интерфейсе в вебе, в приложении - ок (но нет голосового ввода), но главное - полезно. Ты реально получаешь доступ к своему агенту откуда угодно.
Из бонусов полностью открытые исходники, включающие, даже, приложение. Отличная база для собственных экспериментов и исследований.
10 каналов бесплатно - советую всем пробовать. Будут проблемы с установкой - используйте мой лайфхак.
Сергей Булаев AI 🤖 - об AI и не только
Читал тут отчет Google Cloud AI Trends 2025 - чуть чуть инсайтов, типа ап ту дейт:
- Использование AI в инфраструктуре компаний вырастет на 30% к 2026 году. Спрос на “AI-ready” дата-центры будет расти на 33% ежегодно до 2030-го, а расходы на них удвоятся за ближайшие 5 лет.
- AI-ассистенты повышают производительность сотрудников в среднем на 15%. У разработчиков с AI-инструментами количество выполненных задач за неделю возрастает на 26%, обновлений кода - на 13.5%, а время компиляции кода сокращается на 38%. В компании Turing отмечают рост продуктивности девелоперов на 33% благодаря Gemini Code Assist.
- Warner Bros Discovery с помощью AI сократили расходы на субтитры на 50% и сэкономили 80% времени. Best Buy решает клиентские вопросы на 90 секунд быстрее благодаря виртуальным ассистентам, а Apex Fintech перевел обработку сложных угроз из “часов в секунды”.
- В исследовании отмечается уже известный парадокс: AI больше помогает менее опытным сотрудникам, у “топов” же почти не наблюдается роста скорости работы и иногда даже падает качество.
- Всего 28% взрослых в США доверяют информации от AI, но при этом 71% ждут от компаний персонализированного опыта.
- Компании с высокой лояльностью клиентов приносят акционерам 282% доходности за 10 лет против 81% у остальных.
- Рынок корпоративного поиска прогнозируют на уровне $12.9 млрд к 2031 году.
- Gartner предсказывает, что к 2028 году половина компаний начнет использовать AI-продукты для защиты от дезинформации. В 2024 таких решений меньше 5%.
- Средняя стоимость утечки данных в 2024 выросла на 10% и достигла $4.88 млн.
- Внедрение ИИ в кибербезопасность снижает ущерб от утечек на 30%. Но треть специалистов признает, что нехватка кадров и навыков мешает эффективному применению. И уже 66% компаний готовят команду с нужным опытом.
ИИ раскачивает инфраструктуру: дата-центры буквально превращаются в новую валюту.
Сергей Булаев AI 🤖 - об AI и не только
- Использование AI в инфраструктуре компаний вырастет на 30% к 2026 году. Спрос на “AI-ready” дата-центры будет расти на 33% ежегодно до 2030-го, а расходы на них удвоятся за ближайшие 5 лет.
- AI-ассистенты повышают производительность сотрудников в среднем на 15%. У разработчиков с AI-инструментами количество выполненных задач за неделю возрастает на 26%, обновлений кода - на 13.5%, а время компиляции кода сокращается на 38%. В компании Turing отмечают рост продуктивности девелоперов на 33% благодаря Gemini Code Assist.
- Warner Bros Discovery с помощью AI сократили расходы на субтитры на 50% и сэкономили 80% времени. Best Buy решает клиентские вопросы на 90 секунд быстрее благодаря виртуальным ассистентам, а Apex Fintech перевел обработку сложных угроз из “часов в секунды”.
- В исследовании отмечается уже известный парадокс: AI больше помогает менее опытным сотрудникам, у “топов” же почти не наблюдается роста скорости работы и иногда даже падает качество.
- Всего 28% взрослых в США доверяют информации от AI, но при этом 71% ждут от компаний персонализированного опыта.
- Компании с высокой лояльностью клиентов приносят акционерам 282% доходности за 10 лет против 81% у остальных.
- Рынок корпоративного поиска прогнозируют на уровне $12.9 млрд к 2031 году.
- Gartner предсказывает, что к 2028 году половина компаний начнет использовать AI-продукты для защиты от дезинформации. В 2024 таких решений меньше 5%.
- Средняя стоимость утечки данных в 2024 выросла на 10% и достигла $4.88 млн.
- Внедрение ИИ в кибербезопасность снижает ущерб от утечек на 30%. Но треть специалистов признает, что нехватка кадров и навыков мешает эффективному применению. И уже 66% компаний готовят команду с нужным опытом.
ИИ раскачивает инфраструктуру: дата-центры буквально превращаются в новую валюту.
Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
#КриповаяСуббота
RL-фитнес для роботов... немного страшненько.. Не верится..
Ссылка на полное видео
Сергей Булаев AI 🤖 - об AI и не только
RL-фитнес для роботов... немного страшненько.. Не верится..
Ссылка на полное видео
Сергей Булаев AI 🤖 - об AI и не только
Assort Health - американский стартап, который строит голосовых AI-агентов для медицины. Вы берёте всё, что висит на плечах колл-центров и администраторов клиник, и передаёте им это. Звонки пациентов, запись на приём, проверка страховок, продление рецептов, направление к правильным врачам, напоминания о пропущенных визитах - всё это обрабатывается их системой Assort OS, интегрированной прямо в электронные медкарты (EHR).
На днях они закрыли новый раунд Series B на 50 млн долларов при оценке в 750 млн. Лид-инвестор - Lightspeed. Рынок автоматизации здравоохранения вызревает, и деньги теперь идут туда, где уже есть реальные результаты.
• AI-агенты Assort Health уже обработали больше 14 млн взаимодействий с пациентами
• Средняя оценка удовлетворенности - 4.3 из 5 по десяткам тысяч отзывов
• После внедрения в клиниках доля брошенных звонков упала с 41% до 8%
• Время ожидания на линии сократилось с 11 минут до чуть больше 1 минуты
• 88% медзаписей в США всё еще проходят по телефону - и именно здесь AI реально помогает
• Новая функция Sibling Scheduling дает родителям возможность записывать нескольких детей подряд за один звонок - простая деталь, которая сразу снимает лишний стресс
• Каждый год в США около 20 млн пациентов записывают не к тому врачу - такие ошибки автоматизация сводит на нет
50 млн на этом этапе выглядят логичным шагом. Спрос на скорость и точность коммуникаций растет. И в отличие от модных приложений, здесь результат измерим в минутах, миллионах звонков и тысячах довольных пациентов.
Сергей Булаев AI 🤖 - об AI и не только
На днях они закрыли новый раунд Series B на 50 млн долларов при оценке в 750 млн. Лид-инвестор - Lightspeed. Рынок автоматизации здравоохранения вызревает, и деньги теперь идут туда, где уже есть реальные результаты.
• AI-агенты Assort Health уже обработали больше 14 млн взаимодействий с пациентами
• Средняя оценка удовлетворенности - 4.3 из 5 по десяткам тысяч отзывов
• После внедрения в клиниках доля брошенных звонков упала с 41% до 8%
• Время ожидания на линии сократилось с 11 минут до чуть больше 1 минуты
• 88% медзаписей в США всё еще проходят по телефону - и именно здесь AI реально помогает
• Новая функция Sibling Scheduling дает родителям возможность записывать нескольких детей подряд за один звонок - простая деталь, которая сразу снимает лишний стресс
• Каждый год в США около 20 млн пациентов записывают не к тому врачу - такие ошибки автоматизация сводит на нет
50 млн на этом этапе выглядят логичным шагом. Спрос на скорость и точность коммуникаций растет. И в отличие от модных приложений, здесь результат измерим в минутах, миллионах звонков и тысячах довольных пациентов.
Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Расскажу вам про SSRL (Self‑Search Reinforcement Learning) - новый метод обучения моделей.
Суть простая: вместо того чтобы подключать интернет и гонять модель в поисковик, ей предлагают искать ответы прямо внутри себя, используя то, что уже «прошито» в памяти. Получается внутренняя имитация поиска - модель играет роль собственного поисковика.
Факты, которые стоит знать:
• SSRL - это метод обучения больших языковых моделей (LLM).
• Работает примерно в 5,5 раза быстрее по сравнению с подходом ZeroSearch.
• Модели с таким обучением меньше галлюцинируют, выдавая более надежные ответы.
• Особенно заметно улучшение у инструкционных моделей.
• Формат ответа совпадает с Search‑R1, так что при необходимости можно легко подключить реальный поиск.
• Чем больше модель делает проходов внутри себя (итераций самопоиска), тем выше точность и полезность при подключении наружного поиска.
• Обучение обходится дешевле и стабильнее, потому что не нужно дергать настоящие API поисковиков.
Если переводить это в человеческий язык - SSRL учит модель «копаться в себе». Как будто студент готовится к экзамену без шпаргалок: сначала вынужден вспоминать своими силами, а потом уже проверяет ответы с книгами. Эффективнее, быстрее, и в голове остается больше прочного знания.
Видимо SSRL открывает дорогу к более автономным и экономичным ИИ, которые способны решать задачи без постоянной зависимости от внешних сервисов. А если понадобится доступ к реальному поиску - модель уже готова встроиться в этот процесс органично.
Это напоминает тренировку: сперва делаешь упражнения на собственном весе, а потом переходишь к настоящему железу. SSRL - это как раз та база, которая делает ИИ более выносливым и самостоятельным.
Ссылка на GitHub здесь.
Сергей Булаев AI 🤖 - об AI и не только
Суть простая: вместо того чтобы подключать интернет и гонять модель в поисковик, ей предлагают искать ответы прямо внутри себя, используя то, что уже «прошито» в памяти. Получается внутренняя имитация поиска - модель играет роль собственного поисковика.
Факты, которые стоит знать:
• SSRL - это метод обучения больших языковых моделей (LLM).
• Работает примерно в 5,5 раза быстрее по сравнению с подходом ZeroSearch.
• Модели с таким обучением меньше галлюцинируют, выдавая более надежные ответы.
• Особенно заметно улучшение у инструкционных моделей.
• Формат ответа совпадает с Search‑R1, так что при необходимости можно легко подключить реальный поиск.
• Чем больше модель делает проходов внутри себя (итераций самопоиска), тем выше точность и полезность при подключении наружного поиска.
• Обучение обходится дешевле и стабильнее, потому что не нужно дергать настоящие API поисковиков.
Если переводить это в человеческий язык - SSRL учит модель «копаться в себе». Как будто студент готовится к экзамену без шпаргалок: сначала вынужден вспоминать своими силами, а потом уже проверяет ответы с книгами. Эффективнее, быстрее, и в голове остается больше прочного знания.
Видимо SSRL открывает дорогу к более автономным и экономичным ИИ, которые способны решать задачи без постоянной зависимости от внешних сервисов. А если понадобится доступ к реальному поиску - модель уже готова встроиться в этот процесс органично.
Это напоминает тренировку: сперва делаешь упражнения на собственном весе, а потом переходишь к настоящему железу. SSRL - это как раз та база, которая делает ИИ более выносливым и самостоятельным.
Ссылка на GitHub здесь.
Сергей Булаев AI 🤖 - об AI и не только
Недавно перечитывал статью Генри Бейкера 1992 года про Lively Linear Lisp и задумался о том, что казалось «академической экзотикой» тридцать лет назад, сегодня напрямую резонирует с проблемами инженеров, работающих с LLM. И в частности контекст инженеров.
В чём фишка Lively Linear Lisp? Всё просто и гениально: если у объекта есть только одна ссылка, его можно переписать прямо на месте. Без копирования, без долгих танцев со «сборкой мусора».
Такая линейная логика запрещает скрытое совместное использование данных и даёт более прозрачное управление памятью.
Зачем это современному инженеру контекста, который строит системы вокруг больших языковых моделей?
• управление контекстом - вместо бесконечного дублирования истории можно отслеживать уникальные блоки и обновлять их прямо в памяти
• снижение расходов - чем меньше копируем гигабайтные структуры, тем дешевле хранение и быстрее доступ
• безопасность - уникальность ссылок гарантирует, что данные одного пользователя или задачи случайно не пересекутся с другими
• предсказуемость - упрощается логика «кто и когда владеет памятью», что критично для продакшн‑систем и приватных чатов
Совет, который можно взять в работу уже сейчас: смотрите на свои пайплайны обработки контекста глазами Лиспа из 92‑го. Где вы зря копируете данные? Где допускаете неявное разделение доступа? Попробуйте ввести для себя правила линейного владения ресурсами.
По идее сама ментальная модель помогает проектировать архитектуру чище и надёжнее.
И да, занятно, что жизнь всё время возвращает нас к базовым вопросам: «кто владеет памятью и кто её освобождает?» Для LLM этот вопрос уже давно стал не философией, а суровой практикой.
Сергей Булаев AI 🤖 - об AI и не только
В чём фишка Lively Linear Lisp? Всё просто и гениально: если у объекта есть только одна ссылка, его можно переписать прямо на месте. Без копирования, без долгих танцев со «сборкой мусора».
Такая линейная логика запрещает скрытое совместное использование данных и даёт более прозрачное управление памятью.
Зачем это современному инженеру контекста, который строит системы вокруг больших языковых моделей?
• управление контекстом - вместо бесконечного дублирования истории можно отслеживать уникальные блоки и обновлять их прямо в памяти
• снижение расходов - чем меньше копируем гигабайтные структуры, тем дешевле хранение и быстрее доступ
• безопасность - уникальность ссылок гарантирует, что данные одного пользователя или задачи случайно не пересекутся с другими
• предсказуемость - упрощается логика «кто и когда владеет памятью», что критично для продакшн‑систем и приватных чатов
Совет, который можно взять в работу уже сейчас: смотрите на свои пайплайны обработки контекста глазами Лиспа из 92‑го. Где вы зря копируете данные? Где допускаете неявное разделение доступа? Попробуйте ввести для себя правила линейного владения ресурсами.
По идее сама ментальная модель помогает проектировать архитектуру чище и надёжнее.
И да, занятно, что жизнь всё время возвращает нас к базовым вопросам: «кто владеет памятью и кто её освобождает?» Для LLM этот вопрос уже давно стал не философией, а суровой практикой.
Сергей Булаев AI 🤖 - об AI и не только
1 23 5
This media is not supported in your browser
VIEW IN TELEGRAM
Tesla показала новое поколение Optimus. В глаза бросается не только золотой окрас, но и главное новшество: интеграция с искусственным интеллектом Grok от xAI.
Оптимус в свежем видео отвечает на вопросы, фактически используя Grok для голоса и размышлений.
Мы идем к тому, чтобы робот мог понимать контекст и общаться естественным языком, а не быть просто набором датчиков и двигателей. 🤖
• Цвет корпуса впервые стал золотым - броский выбор для прототипа
• Кисти выглядят детализированными, но пока не функциональны (скорее муляж)
• Основной акцент сделан на раннюю интеграцию Grok
• Grok обеспечивает диалог и "понимание" среды
• Tesla планирует сделать рабочие руки с приводами и кабельной системой
• Обучение Optimus строится на видеонаблюдении за действиями человека
С одной стороны, это не конечный продукт - и да, пока он двигается медленно и не всегда справляется даже с простыми задачами. С другой - интеграция Grok наконец-то показывает, куда смещается главный фокус: от железа к мозгу.
В будущем именно слияние ИИ и механики превратит робота из демонстрационной болванки в полезный инструмент.
Компания открыто говорит о вызовах - сроки массового производства смещаются, цена обсуждается на уровне 200-500 тысяч долларов, а конкуренты вроде Figure AI и китайских команд поджимают. То есть пока это больше "витрина силы", чем готовый к рынку продукт.
Сергей Булаев AI 🤖 - об AI и не только
Оптимус в свежем видео отвечает на вопросы, фактически используя Grok для голоса и размышлений.
Мы идем к тому, чтобы робот мог понимать контекст и общаться естественным языком, а не быть просто набором датчиков и двигателей. 🤖
• Цвет корпуса впервые стал золотым - броский выбор для прототипа
• Кисти выглядят детализированными, но пока не функциональны (скорее муляж)
• Основной акцент сделан на раннюю интеграцию Grok
• Grok обеспечивает диалог и "понимание" среды
• Tesla планирует сделать рабочие руки с приводами и кабельной системой
• Обучение Optimus строится на видеонаблюдении за действиями человека
С одной стороны, это не конечный продукт - и да, пока он двигается медленно и не всегда справляется даже с простыми задачами. С другой - интеграция Grok наконец-то показывает, куда смещается главный фокус: от железа к мозгу.
В будущем именно слияние ИИ и механики превратит робота из демонстрационной болванки в полезный инструмент.
Компания открыто говорит о вызовах - сроки массового производства смещаются, цена обсуждается на уровне 200-500 тысяч долларов, а конкуренты вроде Figure AI и китайских команд поджимают. То есть пока это больше "витрина силы", чем готовый к рынку продукт.
Сергей Булаев AI 🤖 - об AI и не только
А ещё Grok‑4 - лидер в прогнозировании будущего по данным крупнейшего живого бенчмарка FutureX.
• Grok‑4 занял 1 место в общем зачёте среди 25 моделей, обойдя Gemini Deep Research и GPT‑4o‑mini (Think&Search).
• На 4 уровне сложности (Super Agent Tier, задачи с высокой волатильностью) Grok‑4 единственный стабильно показывал результат, в то время как большинство моделей ушли в нули.
• Среднее время ответа: менее 5 минут на задачу. Для сравнения, у некоторых глубоких research‑моделей до 30 минут.
• Количество поисковых запросов - до 40 на задачу. Именно эта агрессивная стратегия поиска и дала ему преимущество.
• В финансовых прогнозах по S&P 500 (Q2 2025) лучшие модели выиграли у аналитиков Уолл‑стрит в 33‑37% случаев. Grok‑4 вошел в топ‑результаты, показав высокую точность и скорость.
• В простых задачах (уровень 1‑2) Grok‑4 догоняет или перегоняет людей. В задачах 3‑4 уровня эксперты пока впереди на 10‑25% по точности, но разрыв сокращается.
• Конкретный кейс: вопрос "Сколько будет смертей во время беспорядков в Калифорнии до конца июля 2025?". Grok‑4 правильно спрогнозировал ноль, опираясь на BBC, LA Times и NPR. Другие модели ошибались, выдавая вымышленные события.
Сергей Булаев AI 🤖 - об AI и не только
• Grok‑4 занял 1 место в общем зачёте среди 25 моделей, обойдя Gemini Deep Research и GPT‑4o‑mini (Think&Search).
• На 4 уровне сложности (Super Agent Tier, задачи с высокой волатильностью) Grok‑4 единственный стабильно показывал результат, в то время как большинство моделей ушли в нули.
• Среднее время ответа: менее 5 минут на задачу. Для сравнения, у некоторых глубоких research‑моделей до 30 минут.
• Количество поисковых запросов - до 40 на задачу. Именно эта агрессивная стратегия поиска и дала ему преимущество.
• В финансовых прогнозах по S&P 500 (Q2 2025) лучшие модели выиграли у аналитиков Уолл‑стрит в 33‑37% случаев. Grok‑4 вошел в топ‑результаты, показав высокую точность и скорость.
• В простых задачах (уровень 1‑2) Grok‑4 догоняет или перегоняет людей. В задачах 3‑4 уровня эксперты пока впереди на 10‑25% по точности, но разрыв сокращается.
• Конкретный кейс: вопрос "Сколько будет смертей во время беспорядков в Калифорнии до конца июля 2025?". Grok‑4 правильно спрогнозировал ноль, опираясь на BBC, LA Times и NPR. Другие модели ошибались, выдавая вымышленные события.
Сергей Булаев AI 🤖 - об AI и не только
Иногда при отладке логи разрастаются до сотен и даже тысяч строк… и ты уносишь к LLM всю эту кашу вместо сути.
Теперь есть инструмент, который оптимизирует эту проблему: apparatus.exec (aex). Это CLI, запускающий bash-команды по шорткатам и фильтрует вывод с помощью regex, оставляя ошибки, ворнинги и критическую инфу. В среднем экономия - от ~200 токенов.
Ключевые возможности:
• LLM-оптимизированный вывод
• Шорткаты для командных последовательностей
• Regex-фильтрация
• Поддержка рабочих директорий
• Эффективность для диалогов с ИИ
Сообщество уже обсуждает интеграцию с раннерами и парсерами, чтобы ещё сильнее автоматизировать AI-воркфлоу.
Меньше шума, больше сути. А ваша сборка вдруг перестаёт выглядеть как бесконечный SQL дамп 🤷♂️
Сергей Булаев AI 🤖 - об AI и не только
Теперь есть инструмент, который оптимизирует эту проблему: apparatus.exec (aex). Это CLI, запускающий bash-команды по шорткатам и фильтрует вывод с помощью regex, оставляя ошибки, ворнинги и критическую инфу. В среднем экономия - от ~200 токенов.
Ключевые возможности:
• LLM-оптимизированный вывод
• Шорткаты для командных последовательностей
• Regex-фильтрация
• Поддержка рабочих директорий
• Эффективность для диалогов с ИИ
Сообщество уже обсуждает интеграцию с раннерами и парсерами, чтобы ещё сильнее автоматизировать AI-воркфлоу.
Меньше шума, больше сути. А ваша сборка вдруг перестаёт выглядеть как бесконечный SQL дамп 🤷♂️
Сергей Булаев AI 🤖 - об AI и не только
И снова про Claude Code. За последние пару недель опять достиг с ним какого-то совершенно нового уровня отношений.
Начал пытаться использовать систему управлениями задачи Linear через MCP и столкнулся с отсуствием поддержки работы с проектами. Я не сразу понял в чем проблемы и продолжал требовать от Claude назначить проект у созданных заданий. И, очень скоро, моя настойчивость привела к тому, что Claude сдался и сам дописал необходимый инструмент исользуя Conext7 и предоставленный мной API ключ для MCP от Linear (уже некоторое время заставляю клода исследовать и подключать новые MCP).
И тут до меня дошло - агент только что самостоятельно себя доработал. Я сразу же попросил его добавить в правила:
Действует как магия. Теперь у меня есть каталог tools в каждом проекте. Чего он там только не вытворяет. Особенно полезными инструменты оказались для тестирования и проверок результатов исполнения и отладки проектов.
Есть мысли об обмене тулами между проектами, но пока я этого не делаю. Боюсь запутать.
Я очень много пропогандирую использование Claude Code у своих клиентов. Теперь у меня появился ещё один аргумент - в отличии от конкурентов, это агент который сам может себя развивать. Главное дать ему правильные правила.
Уже совсем близок день, когда у меня появятся мои собственные специализированные агенты работающие постоянно c claude code под капотом.
И пусть вас не пугает название Claude Code - код, в наше время, когда самым популярным языком разработки стал английский, имеет уже совсем другое значение и доступен не только ботаникам с мех мата. Это инструмент не только для разработчиков. (Ну или признайте наконец, все мы теперь - разработчики).
Сергей Булаев AI 🤖 - об AI и не только
📱 sbulaev | 📷 insta | ✖️ twitter
Начал пытаться использовать систему управлениями задачи Linear через MCP и столкнулся с отсуствием поддержки работы с проектами. Я не сразу понял в чем проблемы и продолжал требовать от Claude назначить проект у созданных заданий. И, очень скоро, моя настойчивость привела к тому, что Claude сдался и сам дописал необходимый инструмент исользуя Conext7 и предоставленный мной API ключ для MCP от Linear (уже некоторое время заставляю клода исследовать и подключать новые MCP).
И тут до меня дошло - агент только что самостоятельно себя доработал. Я сразу же попросил его добавить в правила:
Внури проекта у нас есть каталог tools, в нём у тебя отдельное виртуальное окружение. Когда тебе нужен какой то инструмент, и его у тебя нет, используй context7 для создания этого инструмента и если нужны какие то API ключи - просто спроси у меня.
Действует как магия. Теперь у меня есть каталог tools в каждом проекте. Чего он там только не вытворяет. Особенно полезными инструменты оказались для тестирования и проверок результатов исполнения и отладки проектов.
Есть мысли об обмене тулами между проектами, но пока я этого не делаю. Боюсь запутать.
Я очень много пропогандирую использование Claude Code у своих клиентов. Теперь у меня появился ещё один аргумент - в отличии от конкурентов, это агент который сам может себя развивать. Главное дать ему правильные правила.
Уже совсем близок день, когда у меня появятся мои собственные специализированные агенты работающие постоянно c claude code под капотом.
И пусть вас не пугает название Claude Code - код, в наше время, когда самым популярным языком разработки стал английский, имеет уже совсем другое значение и доступен не только ботаникам с мех мата. Это инструмент не только для разработчиков. (Ну или признайте наконец, все мы теперь - разработчики).
Сергей Булаев AI 🤖 - об AI и не только
Please open Telegram to view this post
VIEW IN TELEGRAM
3 48 13 7
Кстати Антропик тоже на днях выпустили замечательную статью про тулы и оптимизацию MCP чуть чуть с другого угла. Тем кто используем моего любимого агента постоянно - читать обязательно.
Для остальных ChatGPT сделал маленький конспект:
Вот короткое, простыми словами: ниже — список практичных советов, как сделать MCP‑инструменты понятными для агентов и быстрыми в работе. Берём лучшее из статьи: прототипируем, оцениваем, улучшаем и используем агента (например, Claude Code) для автооптимизации.
Прототип
Начните с мини‑прототипа одного инструмента.
Сразу тестируйте локально через MCP‑сервер/DEXT.
Дайте модели краткую доку и SDK/API.
Проверьте руками типичные реальные сценарии.
Подключите к Claude Code/Claude Desktop.
Оценка (eval)
Сгенерируйте набор реалистичных задач, не «песочницу».
На каждую задачу — чёткий проверяемый результат.
Запускайте простые агентные циклы (LLM ↔ tool).
Собирайте метрики: точность, время, вызовы, токены, ошибки.
Выбор инструментов
Меньше инструментов, больше пользы.
Не оборачивайте API «как есть» без смысла.
Консолидируйте частые цепочки в один вызов.
Делайте инструменты под высокоимпактные флоу.
Неймспейсы и имена
Группируйте по сервису и ресурсу (asana_, jira_).
Делайте говорящие параметры: user_id, а не user.
Тестируйте префиксы vs суффиксы на своём eval.
Возврат контекста
Возвращайте только «высокосигнальные» поля.
Предпочитайте человекочитаемые ID и названия.
Добавьте режимы ответа: concise / detailed.
Тех. идентификаторы — только в detailed, когда нужны цепочки.
Экономия токенов
Введите пагинацию, фильтры, выбор диапазона.
Транкируйте длинные ответы с подсказкой «что дальше».
Поощряйте точечные запросы вместо «широких».
Ограничьте максимальный размер ответа по умолчанию.
Ошибки и валидация
Валидируйте входы рано и строго.
Ошибки пишите полезно: «что исправить» + пример.
Не отдавайте «сырой» трейс без пользы.
Промпт‑инжиниринг описаний
Пишите описания как для нового коллеги.
Явно объясняйте форматы, термины, допущения.
Давайте короткие примеры входов/выходов.
Регулярно обновляйте описания по результатам eval.
Сотрудничество с агентом
Давайте агенту логи/транскрипты для анализа.
Просите предложить правки схем и описаний.
Фиксируйте изменения и переоценивайте на hold‑out наборе.
Сильные задачи для eval
Многошаговые, с несколькими вызовами и проверкой.
Основаны на реальных данных/сервисах.
Избегайте одноходовых задач без контекста.
Формат ответов
Подбирайте JSON/Markdown/XML под задачу.
Смотрите, с чем модель справляется лучше у вас.
Аналитика вызовов
Ищите лишние вызовы — оптимизируйте пагинацию/фильтры.
Снижайте частоту ошибок неверных параметров.
Отслеживайте типовые цепочки — объединяйте их в один инструмент.
Практические замены
Вместо list_* — search_* с релевантным контекстом.
Вместо россыпи get_* — один *_context с агрегированием.
Вместо list_users + list_events + create_event — schedule_event.
Процесс
Цикл: прототип → eval → правки → повтор.
Держите тест‑сеты отдельно (чтобы не переобучиться).
Версионируйте схемы и описания инструментов.
Золотое правило
Если инструмент понятен человеку — он «эргономичен» и для агента.
Сергей Булаев AI 🤖 - об AI и не только
📱 sbulaev | 📷 insta | ✖️ twitter
Для остальных ChatGPT сделал маленький конспект:
Вот короткое, простыми словами: ниже — список практичных советов, как сделать MCP‑инструменты понятными для агентов и быстрыми в работе. Берём лучшее из статьи: прототипируем, оцениваем, улучшаем и используем агента (например, Claude Code) для автооптимизации.
Прототип
Начните с мини‑прототипа одного инструмента.
Сразу тестируйте локально через MCP‑сервер/DEXT.
Дайте модели краткую доку и SDK/API.
Проверьте руками типичные реальные сценарии.
Подключите к Claude Code/Claude Desktop.
Оценка (eval)
Сгенерируйте набор реалистичных задач, не «песочницу».
На каждую задачу — чёткий проверяемый результат.
Запускайте простые агентные циклы (LLM ↔ tool).
Собирайте метрики: точность, время, вызовы, токены, ошибки.
Выбор инструментов
Меньше инструментов, больше пользы.
Не оборачивайте API «как есть» без смысла.
Консолидируйте частые цепочки в один вызов.
Делайте инструменты под высокоимпактные флоу.
Неймспейсы и имена
Группируйте по сервису и ресурсу (asana_, jira_).
Делайте говорящие параметры: user_id, а не user.
Тестируйте префиксы vs суффиксы на своём eval.
Возврат контекста
Возвращайте только «высокосигнальные» поля.
Предпочитайте человекочитаемые ID и названия.
Добавьте режимы ответа: concise / detailed.
Тех. идентификаторы — только в detailed, когда нужны цепочки.
Экономия токенов
Введите пагинацию, фильтры, выбор диапазона.
Транкируйте длинные ответы с подсказкой «что дальше».
Поощряйте точечные запросы вместо «широких».
Ограничьте максимальный размер ответа по умолчанию.
Ошибки и валидация
Валидируйте входы рано и строго.
Ошибки пишите полезно: «что исправить» + пример.
Не отдавайте «сырой» трейс без пользы.
Промпт‑инжиниринг описаний
Пишите описания как для нового коллеги.
Явно объясняйте форматы, термины, допущения.
Давайте короткие примеры входов/выходов.
Регулярно обновляйте описания по результатам eval.
Сотрудничество с агентом
Давайте агенту логи/транскрипты для анализа.
Просите предложить правки схем и описаний.
Фиксируйте изменения и переоценивайте на hold‑out наборе.
Сильные задачи для eval
Многошаговые, с несколькими вызовами и проверкой.
Основаны на реальных данных/сервисах.
Избегайте одноходовых задач без контекста.
Формат ответов
Подбирайте JSON/Markdown/XML под задачу.
Смотрите, с чем модель справляется лучше у вас.
Аналитика вызовов
Ищите лишние вызовы — оптимизируйте пагинацию/фильтры.
Снижайте частоту ошибок неверных параметров.
Отслеживайте типовые цепочки — объединяйте их в один инструмент.
Практические замены
Вместо list_* — search_* с релевантным контекстом.
Вместо россыпи get_* — один *_context с агрегированием.
Вместо list_users + list_events + create_event — schedule_event.
Процесс
Цикл: прототип → eval → правки → повтор.
Держите тест‑сеты отдельно (чтобы не переобучиться).
Версионируйте схемы и описания инструментов.
Золотое правило
Если инструмент понятен человеку — он «эргономичен» и для агента.
Сергей Булаев AI 🤖 - об AI и не только
Please open Telegram to view this post
VIEW IN TELEGRAM
1 28 5
Настроил сегодня через Zapier автоматический импорт всех новых транскриптов Circleback и Plaud в приватный репозиторий knowledge на github, который синкается с локальным компом и в этом каталоге сидит отдельный клод код и отвечает мне на вопросы через omnara (ну и конечно дал ему тулы индексировать все эти транскрипты и поддерживать актуальность для более удобного поиска информации).
Сергей Булаев AI 🤖 - об AI и не только
📱 sbulaev | 📷 insta | ✖️ twitter
Сергей Булаев AI 🤖 - об AI и не только
Please open Telegram to view this post
VIEW IN TELEGRAM
1 18 8 2