RepoSwarm - Giving AI Agents Architecture Context Across All Your Repos (Рубрика #Architecture)
Интересный доклад про восстановление архитектурного контекста при помощи AI агентов от Roy Osherove, Chief AI Architect в Verbit AI (компания с ~90 разработчиками, 12 командами и 400+ репозиториями). Интересно, что Roy написал три книги: The Art of Unit Testing, Elastic Leadership, Pipeline Driven (пока в разработке, но про его доклад с таким названием я уже рассказывал). У Роя есть и интересный блог robotpaper.ai, где он документирует AI-паттерны для разработчиков. Из интересного - его книги попали в обучающие датасеты LLM, поэтому промпт "review my tests in Roy Osherove style" работает из коробки в Cursor:)
Если же говорить про основные тезисы доклада изложены ниже
Документация в enterprise - проигрышная битва
В компаниях с 400+ репозиториями реальность такова
- 90% README-файлов устаревшие или неполные
- Архитектурные диаграммы существуют как кот Шредингера (пока не посмотришь не знаешь они еще живы или уже нет)
- Критические вопросы требуют недель ручного анализа: "что за инструменты мониторинга используются", "где хранятся определенные данные", "кто пользуется устаревшими API "
Не только люди страдают от такого качества документации - AI-агенты страдают тоже, так как им нужен контекст для правильных решений (какой UI-компонент использовать, как вызывать внутренний сервис).
Автор доклада в качестве решения создал RepoSwarm, живой архитектурный репозиторий, который доступен в виде open source. Он работает примерно следующим образом
1. Ежедневно сканирует GitHub-репозитории (приватные/публичные) с коммитами за последние 12 месяцев (это настраивается)
2. Генерирует markdown-документацию (один repo.md на репозиторий) через Claude Code SDK
3. Сохраняет в централизованный Architecture Hub — Git-репозиторий с полной историей изменений
4. Никогда не устаревает: при новом прогоне файлы полностью перезатираются (нет никакой backward compatibility)
Ключевое отличие от статической документации в том, что документы сделаны AI-readable (markdown) и у нас есть git-история
Если говорить про то, что автор решил добавить в repo.md, то это такой список инфомрации
- Базовая информация - High-level overview, Dependencies (package.json/requirements.txt), Security checks (top 10 OWASP), Monitoring tools
- Данные и API - Database schemas, API versioning, Events/messaging (pub/sub), Data mapping (GDPR/HIPAA flows)
- Инфраструктура - CI/CD deployment, Authentication/Authorization, Feature flags, ML/LLM usage (Gemini/Claude endpoints)
- Специализированные - Prompt security (injection checks), Mobile UI patterns (для repo_type: mobile), IaC analysis (для Terraform/K8s)
В каких реальных кейсах этот инструмент использовался автором
1. Cross-repo анализ - ответы на вопрос вида "какие monitoring tools используются?"
2. Large-scale migrations - обновление Python, консолидация API gateways (переход на Kong), deprecation внутреннего сервиса (поиск всех зависимостей)
3. Архитектурная история - генерация ретроспективно ADR с ответом на вопросы вида "why we moved to serverless in Q2 2024"
4. AI-агентам как контекст - использование Architecture Hub в Cursor → автоконтекст для features/bugs
Что использование значит для разработки
1. Смещение роли архитектора - от ручной работы к построению и использованию таких инструментов
2. Новый workflow для compliance - проще выстроить соответствие внешним требованиям
3. Эволюция AI-агентов - улучшениие AI-assisted разработки за счет интеграции архитектурной информации в контекст агентов
4. Следование философии "живой документации" - генерация ее из кода и гарантированный freshness
#DevOps #AI #Architecture #Culture #Engineering #ML #Future #Software #SystemDesign
Интересный доклад про восстановление архитектурного контекста при помощи AI агентов от Roy Osherove, Chief AI Architect в Verbit AI (компания с ~90 разработчиками, 12 командами и 400+ репозиториями). Интересно, что Roy написал три книги: The Art of Unit Testing, Elastic Leadership, Pipeline Driven (пока в разработке, но про его доклад с таким названием я уже рассказывал). У Роя есть и интересный блог robotpaper.ai, где он документирует AI-паттерны для разработчиков. Из интересного - его книги попали в обучающие датасеты LLM, поэтому промпт "review my tests in Roy Osherove style" работает из коробки в Cursor:)
Если же говорить про основные тезисы доклада изложены ниже
Документация в enterprise - проигрышная битва
В компаниях с 400+ репозиториями реальность такова
- 90% README-файлов устаревшие или неполные
- Архитектурные диаграммы существуют как кот Шредингера (пока не посмотришь не знаешь они еще живы или уже нет)
- Критические вопросы требуют недель ручного анализа: "что за инструменты мониторинга используются", "где хранятся определенные данные", "кто пользуется устаревшими API "
Не только люди страдают от такого качества документации - AI-агенты страдают тоже, так как им нужен контекст для правильных решений (какой UI-компонент использовать, как вызывать внутренний сервис).
Автор доклада в качестве решения создал RepoSwarm, живой архитектурный репозиторий, который доступен в виде open source. Он работает примерно следующим образом
1. Ежедневно сканирует GitHub-репозитории (приватные/публичные) с коммитами за последние 12 месяцев (это настраивается)
2. Генерирует markdown-документацию (один repo.md на репозиторий) через Claude Code SDK
3. Сохраняет в централизованный Architecture Hub — Git-репозиторий с полной историей изменений
4. Никогда не устаревает: при новом прогоне файлы полностью перезатираются (нет никакой backward compatibility)
Ключевое отличие от статической документации в том, что документы сделаны AI-readable (markdown) и у нас есть git-история
Если говорить про то, что автор решил добавить в repo.md, то это такой список инфомрации
- Базовая информация - High-level overview, Dependencies (package.json/requirements.txt), Security checks (top 10 OWASP), Monitoring tools
- Данные и API - Database schemas, API versioning, Events/messaging (pub/sub), Data mapping (GDPR/HIPAA flows)
- Инфраструктура - CI/CD deployment, Authentication/Authorization, Feature flags, ML/LLM usage (Gemini/Claude endpoints)
- Специализированные - Prompt security (injection checks), Mobile UI patterns (для repo_type: mobile), IaC analysis (для Terraform/K8s)
В каких реальных кейсах этот инструмент использовался автором
1. Cross-repo анализ - ответы на вопрос вида "какие monitoring tools используются?"
2. Large-scale migrations - обновление Python, консолидация API gateways (переход на Kong), deprecation внутреннего сервиса (поиск всех зависимостей)
3. Архитектурная история - генерация ретроспективно ADR с ответом на вопросы вида "why we moved to serverless in Q2 2024"
4. AI-агентам как контекст - использование Architecture Hub в Cursor → автоконтекст для features/bugs
Что использование значит для разработки
1. Смещение роли архитектора - от ручной работы к построению и использованию таких инструментов
2. Новый workflow для compliance - проще выстроить соответствие внешним требованиям
3. Эволюция AI-агентов - улучшениие AI-assisted разработки за счет интеграции архитектурной информации в контекст агентов
4. Следование философии "живой документации" - генерация ее из кода и гарантированный freshness
#DevOps #AI #Architecture #Culture #Engineering #ML #Future #Software #SystemDesign
YouTube
RepoSwarm - Giving AI Agents Architecture Context Across All Your Repos - Roy Osherove
more info at https://robotpaper.ai by Roy Osherove.
This talk explores RepoSwarm, an AI-first developer tool for giving LLM-powered coding agents deep, accurate context across large multi-repository codebases. Instead of relying on stale READMEs or static…
This talk explores RepoSwarm, an AI-first developer tool for giving LLM-powered coding agents deep, accurate context across large multi-repository codebases. Instead of relying on stale READMEs or static…
🔥7❤5👍4☃1🎄1
Новогоднее шоу "Дядя Степа" (Рубрика #ForKids)
Вчера были на этом новогоднем шоу с детишками и нашими друзьями и нам очень понравилось и тому есть несколько причин
1. Перед самим шоу есть насыщенная программа для детей до него - лучше приезжать за час до представления и поучаствовать в этих активностях
2. Само представление начинается с Дяди Степы, но дальше мы наблюдаем за мистером Звездопадовым, что действует в стиле Джима Керри из фильма "Маска"
3. Само представление является скорее мюзиклом, чем простой театральной постановкой
4. В середине представления есть акробатические номера на батутах, что отдают цирком - очень динамично и красиво
5. Детям представление нравится, так как мистер Звездопадов озвучивает мысли детей насчет того, что родители своими указаниями и запретами мешают веселиться
6. Вся история заканчивается выверено с точки зрения морали и принятия последсьвий своих поступков и только Дядя Степа помогает в том, чтобы эти почледствия не стали фатальными
В общем, отличное представление. Рекомендую.
#Culture #Theater #ForParents
Вчера были на этом новогоднем шоу с детишками и нашими друзьями и нам очень понравилось и тому есть несколько причин
1. Перед самим шоу есть насыщенная программа для детей до него - лучше приезжать за час до представления и поучаствовать в этих активностях
2. Само представление начинается с Дяди Степы, но дальше мы наблюдаем за мистером Звездопадовым, что действует в стиле Джима Керри из фильма "Маска"
3. Само представление является скорее мюзиклом, чем простой театральной постановкой
4. В середине представления есть акробатические номера на батутах, что отдают цирком - очень динамично и красиво
5. Детям представление нравится, так как мистер Звездопадов озвучивает мысли детей насчет того, что родители своими указаниями и запретами мешают веселиться
6. Вся история заканчивается выверено с точки зрения морали и принятия последсьвий своих поступков и только Дядя Степа помогает в том, чтобы эти почледствия не стали фатальными
В общем, отличное представление. Рекомендую.
#Culture #Theater #ForParents
🔥7❤5👍2👎2
С новым годом!
Рад, что вы подписаны и читаете мой канал. Надеюсь, что он вам бывает полезен, хотя я пишу обычно о том, что интересно именно мне. Для меня 2025 год прошел для меня под знаком AI в разработке софта, developer productivity, чтения научно-популярных книг и возврату к кодингу в паре с AI агентами (open ai codex), vibe code инструментами (lovable) и моими идеями проектов, что я долго откладывал на потом. В следующем году поделюсь с вами результатами этих проектов.
Желаю, чтобы у вас в 2026 году все сложилось удачно и все задуманное получилось!
Рад, что вы подписаны и читаете мой канал. Надеюсь, что он вам бывает полезен, хотя я пишу обычно о том, что интересно именно мне. Для меня 2025 год прошел для меня под знаком AI в разработке софта, developer productivity, чтения научно-популярных книг и возврату к кодингу в паре с AI агентами (open ai codex), vibe code инструментами (lovable) и моими идеями проектов, что я долго откладывал на потом. В следующем году поделюсь с вами результатами этих проектов.
Желаю, чтобы у вас в 2026 году все сложилось удачно и все задуманное получилось!
1🎄27❤26🔥7☃3👍1🎉1
[1/2] Hard Won Lessons from Building Effective AI Coding Agents (Рубрика #Agents)
Интересный доклад от Nik Pash, Head of AI в Cline с основной мыслью в том, что надо перестать усложнять или почему умный scaffolding убивает AI-агентов. До Cline Ник работал инженером в Meta Reality Labs (2019-2021), Yandex (Image Search), Samsung Electronics. Основные тезисы доклада следующие
1️⃣ Горькая правда в том, что scaffolding устарел
Годами разработчики компенсировали слабость моделей clever scaffolding'ом: RAG-индексацией, search trees, хитрыми системами tool calling. Проблема в том, что сейчас frontier-модели побеждают без этих абстракций. То есть capability beats scaffolding. Ник приводит пример Gemini 3.0, что вышел недавно и сразу возглавил Terminal-Bench leaderboard с результатом 54.2% без какой-то агентской обвязки (если глянуть сейчас, то в лидер борде впереди все-таки agentic + model комбинации). Кстати, Terminal-Bench — это интересный "unopinionated generic stripped down harness". Там нет никакого graph search, RAG, индексации — только терминал и задача "разберись сам"
2️⃣ Context engineering tricks — played out
Ник откровенно говорит, что вместо отдельных трюков для контекста теперь есть стандартный playbook для поддержки каждой новой модели (Sonnet 4 → 4.5, Gemini 2.5 → 3.0, GPT-5 → 5.1). Tweaks тривиальны, выигрыши маргинальны. По мнению Ника эта тема исчерпана. Новизны в ней не осталось.
3️⃣ Настоящий bottleneck — это бенчмарки и среды для RL (reinforcement learning)
Собственно тут зарыта основная мысль доклада: можно построить cleanest agent в мире, но это не улучшит capability модели даже на 1%. Ник говорит
По его мнению модели не "вдруг стали лучше" в использовании инструментов — они стали лучше, потому что построены RL environments, которые заставили их практиковать конкретные действия: обработку моделей отказов, повторов, обработки ошибок. Каждый скачок в reasoning пришел из benchmark'а. Каждый скачок в agent reliability — из RL environment.
Дальше Ник рассказывает как превратить задачи реального мира в данные для тренировок. Cline построил систему под названием "RL Environments Factory" — pipeline для автоматического превращения реальных coding задач в RL environments для обучения моделей. Выглядит это так
Phase 1: Qualification — фильтрация задач
Sub-агенты работают параллельно, проверяя, подходит ли задача для превращения в RL environment:
- Origins: существует ли репозиторий? Доступен ли starting commit? Open source?
- Journey: что пользователь на самом деле пытался решить? Какова была суть задачи?
- Outcome: можем ли найти commits/PRs, которые решили проблему в реальности?
Откидываются задачи вида: вайбкодинговвый slop, тривиальные задачи, задачи без надежных start/end states[4]
Phase 2: Building RL Environment
- Archaeology: реконструировать оба состояния (до/после) локально
- Documentation: задокументировать все obstacles и dependencies
- Containerization: упаковать в Docker, убрать Git (чтобы агенты не могли reward hack)
- Verifier: определить, как проверять результат
Интересно, что примерно этим же подходом пользовались ребята из whitepaper "Is Vibe Coding Safe? Benchmarking Vulnerability of Agent-Generated Code in Real-World Tasks", о котором я рассказывал раньше.
4️⃣ Все делают RL environments но никто ими не делится
И тут Ник открыто говорит о том, что каждая крупная agent lab собирает эти данные, то есть все делают какую-то версию RL environment building за кулисами. Но никто не говорит об этом. Эти компании ссылаются на internal benchmarks, но вы никогда не сможете их изучить, потому что они не публикуют их открыто. Эти данные настолько ценны, что их никто не шарит. Agent labs стоят между реальными инженерами, работающими над реальными задачами, и моделями — у них уникальная роль в истории.
В продолжении я расскажу, а что предлагают ребята из Cline, чтобы улучшить ситуацию
#AI #ML #Agents #Software #Engineering #Architecture
Интересный доклад от Nik Pash, Head of AI в Cline с основной мыслью в том, что надо перестать усложнять или почему умный scaffolding убивает AI-агентов. До Cline Ник работал инженером в Meta Reality Labs (2019-2021), Yandex (Image Search), Samsung Electronics. Основные тезисы доклада следующие
1️⃣ Горькая правда в том, что scaffolding устарел
Годами разработчики компенсировали слабость моделей clever scaffolding'ом: RAG-индексацией, search trees, хитрыми системами tool calling. Проблема в том, что сейчас frontier-модели побеждают без этих абстракций. То есть capability beats scaffolding. Ник приводит пример Gemini 3.0, что вышел недавно и сразу возглавил Terminal-Bench leaderboard с результатом 54.2% без какой-то агентской обвязки (если глянуть сейчас, то в лидер борде впереди все-таки agentic + model комбинации). Кстати, Terminal-Bench — это интересный "unopinionated generic stripped down harness". Там нет никакого graph search, RAG, индексации — только терминал и задача "разберись сам"
2️⃣ Context engineering tricks — played out
Ник откровенно говорит, что вместо отдельных трюков для контекста теперь есть стандартный playbook для поддержки каждой новой модели (Sonnet 4 → 4.5, Gemini 2.5 → 3.0, GPT-5 → 5.1). Tweaks тривиальны, выигрыши маргинальны. По мнению Ника эта тема исчерпана. Новизны в ней не осталось.
3️⃣ Настоящий bottleneck — это бенчмарки и среды для RL (reinforcement learning)
Собственно тут зарыта основная мысль доклада: можно построить cleanest agent в мире, но это не улучшит capability модели даже на 1%. Ник говорит
Models only get better when labs train on something hard. And benchmarks, not agent cleverness... determine what frontier models learn to do next.
По его мнению модели не "вдруг стали лучше" в использовании инструментов — они стали лучше, потому что построены RL environments, которые заставили их практиковать конкретные действия: обработку моделей отказов, повторов, обработки ошибок. Каждый скачок в reasoning пришел из benchmark'а. Каждый скачок в agent reliability — из RL environment.
Дальше Ник рассказывает как превратить задачи реального мира в данные для тренировок. Cline построил систему под названием "RL Environments Factory" — pipeline для автоматического превращения реальных coding задач в RL environments для обучения моделей. Выглядит это так
Phase 1: Qualification — фильтрация задач
Sub-агенты работают параллельно, проверяя, подходит ли задача для превращения в RL environment:
- Origins: существует ли репозиторий? Доступен ли starting commit? Open source?
- Journey: что пользователь на самом деле пытался решить? Какова была суть задачи?
- Outcome: можем ли найти commits/PRs, которые решили проблему в реальности?
Откидываются задачи вида: вайбкодинговвый slop, тривиальные задачи, задачи без надежных start/end states[4]
Phase 2: Building RL Environment
- Archaeology: реконструировать оба состояния (до/после) локально
- Documentation: задокументировать все obstacles и dependencies
- Containerization: упаковать в Docker, убрать Git (чтобы агенты не могли reward hack)
- Verifier: определить, как проверять результат
Интересно, что примерно этим же подходом пользовались ребята из whitepaper "Is Vibe Coding Safe? Benchmarking Vulnerability of Agent-Generated Code in Real-World Tasks", о котором я рассказывал раньше.
4️⃣ Все делают RL environments но никто ими не делится
И тут Ник открыто говорит о том, что каждая крупная agent lab собирает эти данные, то есть все делают какую-то версию RL environment building за кулисами. Но никто не говорит об этом. Эти компании ссылаются на internal benchmarks, но вы никогда не сможете их изучить, потому что они не публикуют их открыто. Эти данные настолько ценны, что их никто не шарит. Agent labs стоят между реальными инженерами, работающими над реальными задачами, и моделями — у них уникальная роль в истории.
В продолжении я расскажу, а что предлагают ребята из Cline, чтобы улучшить ситуацию
#AI #ML #Agents #Software #Engineering #Architecture
❤5👍3❤🔥2
[2/2] Hard Won Lessons from Building Effective AI Coding Agents (Рубрика #Agents)
Продолжая рассказ про этот доклад, надо рассказать про Cline-Bench - open source benchmark для реальных задач, который анонсирует Cline. Каждая задача внутри бенча это:
- Starting repo snapshot (git commit hash)
- Real prompt from user
- Ground truth tests на основе кода, который реально зашипился
Этот бенч
- Полностью open source, no secret sauce, no locked datasets
- Любой может использовать для SFT, RL, eval
- Любой может поучаствовать
Как контрибьютить
1. Работайте над open source проектом с включенным Cline Provider
2. Opt into cline-bench initiative
3. Если frontier model застрял и вы вмешались, чтобы починить — это идеальный кандидат для benchmark
В общем, просто используйте Cline, наблюдайте, где модель struggles, и Cline подберет эти задачи в open-source benchmark.
P.S.
Если подбивать мысли из доклада, то можно вынести следующее
1. Для инженеров, использующих AI coding agents
- Перестаньте over-engineering scaffolding. Проще = лучше
- Фокусируйтесь на capability модели, а не на умных абстракциях
- Ваши real-world failure cases — самые ценные данные для экосистемы
- Contribution в open benchmarks помогает всем
2. Для исследователей и разработчиков моделей
- Сдвиг от scaffolding tricks к environment design
- Качество верификатора критично: надо ориентироваться на outcome, а не имплементацию
- Автоматизация создания RL environments из реальных задач
- Измеряйте модели на реальных engineering work, а не на паззлах
3. Для компаний, строящих AI products
- Доступ к real-world engineering data — ключевое конкурентное преимущество
- RL environments > clever prompting
- Benchmarks drive capability improvements
- Open source collaboration ускоряет прогресс всей индустрии
#AI #ML #Agents #Software #Engineering #Architecture
Продолжая рассказ про этот доклад, надо рассказать про Cline-Bench - open source benchmark для реальных задач, который анонсирует Cline. Каждая задача внутри бенча это:
- Starting repo snapshot (git commit hash)
- Real prompt from user
- Ground truth tests на основе кода, который реально зашипился
Этот бенч
- Полностью open source, no secret sauce, no locked datasets
- Любой может использовать для SFT, RL, eval
- Любой может поучаствовать
Как контрибьютить
1. Работайте над open source проектом с включенным Cline Provider
2. Opt into cline-bench initiative
3. Если frontier model застрял и вы вмешались, чтобы починить — это идеальный кандидат для benchmark
В общем, просто используйте Cline, наблюдайте, где модель struggles, и Cline подберет эти задачи в open-source benchmark.
P.S.
Если подбивать мысли из доклада, то можно вынести следующее
1. Для инженеров, использующих AI coding agents
- Перестаньте over-engineering scaffolding. Проще = лучше
- Фокусируйтесь на capability модели, а не на умных абстракциях
- Ваши real-world failure cases — самые ценные данные для экосистемы
- Contribution в open benchmarks помогает всем
2. Для исследователей и разработчиков моделей
- Сдвиг от scaffolding tricks к environment design
- Качество верификатора критично: надо ориентироваться на outcome, а не имплементацию
- Автоматизация создания RL environments из реальных задач
- Измеряйте модели на реальных engineering work, а не на паззлах
3. Для компаний, строящих AI products
- Доступ к real-world engineering data — ключевое конкурентное преимущество
- RL environments > clever prompting
- Benchmarks drive capability improvements
- Open source collaboration ускоряет прогресс всей индустрии
#AI #ML #Agents #Software #Engineering #Architecture
Telegram
Книжный куб
[1/2] Hard Won Lessons from Building Effective AI Coding Agents (Рубрика #Agents)
Интересный доклад от Nik Pash, Head of AI в Cline с основной мыслью в том, что надо перестать усложнять или почему умный scaffolding убивает AI-агентов. До Cline Ник работал…
Интересный доклад от Nik Pash, Head of AI в Cline с основной мыслью в том, что надо перестать усложнять или почему умный scaffolding убивает AI-агентов. До Cline Ник работал…
❤7🔥4👍3
Developer Experience in the Age of AI Coding Agents (Рубрика #Agents)
Посмотрел интересное выступление Max Kanat-Alexander, Executive Distinguished Engineer в Capital One, где он рассказывал про DevEx в эпоху AI-агентов или как не утонуть в уже существующем legacy и новосозданном legacy, генерящегося агентами в ускоренном режиме:) Макс ранее работал Tech Lead в Google (над Code Health) и Principal Staff Engineer в LinkedIn (над Developer Productivity). Также он написал книги "Code Simplicity" и "Understanding Software", которые я пока не прочел:)
Основные тезисы доклада такие
1️⃣ Не сражайтесь с Training Set
Используйте стандартные инструменты. Если вы написали свой пакетный менеджер или используете редкий язык — агент будет тупить. Он обучен на open source стандартах. Чем "скучнее" и стандартнее ваш стек, тем умнее на нём работает AI.
2️⃣ CLI > GUI
Агентам нужны API и CLI, а не браузер. Заставлять агента "кликать" через GUI — дорого и ненадежно. Если у инструмента есть текстовый интерфейс, агент справится с ним быстрее и точнее.
3️⃣ Тесты должны быть детерминированными
Агенту ничего не говорит ошибка `500 Internal Error`. Ему нужны четкие сообщения валидаторов. Инвестиция в качественные сообщения об ошибках в тестах и линтерах — это инвестиция в автономность агента. Критично что тесты должны бежать быстро (30 секунд, а не 20 минут). Агент запускает их в цикле. Медленный CI убьёт продуктивность агента.
4️⃣ Документируйте "Зачем", а не "Что"
Агент видит код и понимает, что он делает. Но он не был на ваших митингах и не умеет читать мысли.
В документации теперь нужно писать контекст: бизнес-цели, внешние ограничения, форму данных на входе. То, чего нет в коде.
5️⃣ Проблема Code Review (Порочный цикл)
Написание кода превращается в чтение. Количество PR-ов растет экспоненциально.
Но, если у вас слабый процесс ревью, вы начнете "штамповать" (LGTM) плохой код от агентов. Кодовая база деградирует, агенту становится сложнее в ней работать, он пишет еще больше чуши → получается порочный круг. Решение в том, чтобы распределять нагрузку по ревью (не слать всё в общий канал "кто-нибудь гляньте") и жестко держать планку качества.
🚀 Что это значит для разработки?
- Рефакторинг легаси обязателен. Если человек не может понять структуру проекта без "тайных знаний", агент там просто галлюцинирует. Хорошая структура кода теперь — экономическая необходимость.
- Сдвиг парадигмы. Мы переходим от написания кода к верификации. Навык быстро читать и валидировать чужой код становится важнее навыка быстро печатать.
- Золотое правило. Всё, что хорошо для AI-агента (быстрые тесты, внятные ошибки, стандартные инструменты), хорошо и для человека. Даже если AI завтра исчезнет, эти инвестиции окупятся для людей. Забавно, что это очень похоже на "золотое правило морали", универсальный этический принцип, который гласит: «Поступай с другими так, как хочешь, чтобы поступали с тобой»,
#Engineering #AI #Metrics #Software #DevEx #Productivity #DevOps #Architecture #Culture #Engineering #ML #SystemDesign
Посмотрел интересное выступление Max Kanat-Alexander, Executive Distinguished Engineer в Capital One, где он рассказывал про DevEx в эпоху AI-агентов или как не утонуть в уже существующем legacy и новосозданном legacy, генерящегося агентами в ускоренном режиме:) Макс ранее работал Tech Lead в Google (над Code Health) и Principal Staff Engineer в LinkedIn (над Developer Productivity). Также он написал книги "Code Simplicity" и "Understanding Software", которые я пока не прочел:)
Основные тезисы доклада такие
1️⃣ Не сражайтесь с Training Set
Используйте стандартные инструменты. Если вы написали свой пакетный менеджер или используете редкий язык — агент будет тупить. Он обучен на open source стандартах. Чем "скучнее" и стандартнее ваш стек, тем умнее на нём работает AI.
2️⃣ CLI > GUI
Агентам нужны API и CLI, а не браузер. Заставлять агента "кликать" через GUI — дорого и ненадежно. Если у инструмента есть текстовый интерфейс, агент справится с ним быстрее и точнее.
3️⃣ Тесты должны быть детерминированными
Агенту ничего не говорит ошибка `500 Internal Error`. Ему нужны четкие сообщения валидаторов. Инвестиция в качественные сообщения об ошибках в тестах и линтерах — это инвестиция в автономность агента. Критично что тесты должны бежать быстро (30 секунд, а не 20 минут). Агент запускает их в цикле. Медленный CI убьёт продуктивность агента.
4️⃣ Документируйте "Зачем", а не "Что"
Агент видит код и понимает, что он делает. Но он не был на ваших митингах и не умеет читать мысли.
В документации теперь нужно писать контекст: бизнес-цели, внешние ограничения, форму данных на входе. То, чего нет в коде.
5️⃣ Проблема Code Review (Порочный цикл)
Написание кода превращается в чтение. Количество PR-ов растет экспоненциально.
Но, если у вас слабый процесс ревью, вы начнете "штамповать" (LGTM) плохой код от агентов. Кодовая база деградирует, агенту становится сложнее в ней работать, он пишет еще больше чуши → получается порочный круг. Решение в том, чтобы распределять нагрузку по ревью (не слать всё в общий канал "кто-нибудь гляньте") и жестко держать планку качества.
🚀 Что это значит для разработки?
- Рефакторинг легаси обязателен. Если человек не может понять структуру проекта без "тайных знаний", агент там просто галлюцинирует. Хорошая структура кода теперь — экономическая необходимость.
- Сдвиг парадигмы. Мы переходим от написания кода к верификации. Навык быстро читать и валидировать чужой код становится важнее навыка быстро печатать.
- Золотое правило. Всё, что хорошо для AI-агента (быстрые тесты, внятные ошибки, стандартные инструменты), хорошо и для человека. Даже если AI завтра исчезнет, эти инвестиции окупятся для людей. Забавно, что это очень похоже на "золотое правило морали", универсальный этический принцип, который гласит: «Поступай с другими так, как хочешь, чтобы поступали с тобой»,
#Engineering #AI #Metrics #Software #DevEx #Productivity #DevOps #Architecture #Culture #Engineering #ML #SystemDesign
YouTube
Developer Experience in the Age of AI Coding Agents – Max Kanat-Alexander, Capital One
It feels like every two weeks, the world of software engineering is being turned on its head. Are there any principles we can rely on that will continue to hold true, and that can help us prepare for the future, no matter what happens? Max uses research,…
👍13❤6🔥3
“We Play on the Offensive.”An Interview with Revolut Founder Nikolay Storonsky (Рубрика #Leadership)
Посмотрел интересное интервью Николая Сторонского, основателя компании Revolut ($75 млрд оценка), что он дал Елизавете Осетинской, иностранному агенту. В этом интервью Николай рассказал о том, как строить компанию, где работают только топ-таланты. Но сначала стоит поговорить про масштаб компании сегодня (кстати, я про Revolut уже как-то рассказывал)
- 12,000 сотрудников (5,000 core team, 7,000 support/sales)
- 1,200 разработчиков, примерно ~30-40% всей команды — это engineering + product + data science
- 45M пользователей, 15M daily active
- $6B выручка, $2B прибыль (2025 план: $9B/$3B)
- 40 стран, экспансия в 60+ рынков
Компания фокусируется на найме hgih avievers (достигаторов). Сам Николай провел много тысяч интервью и так формулирует свои критерии
- Топ-1-5% везде — от школы до предыдущих мест работы
- STEM-бэкграунд с доказанным track record
- Problem-solving end-to-end — должны приходить с решениями, а не проблемами
- Амбициозные цели — цитата Николая из интервью, что мне понравилась "почти всё можно достичь, что подчиняется законам физики"
- Готовность увольнять слабых - большинство боятся этого делать
Отдельно Николай отметил, что они не берут
- Классических банкиров — "низкое качество талантов, они maintainers, а не builders"
- Средних исполнителей — "как только начинаешь работать со средними людьми, они приходят: 'У нас проблемы, что делать?' Мы таких не любим"
Интерес подход Николая к текучке - regrettable attrition наддо держать небольшим (1.5% в квартал), а forced attrition надо разгонять до 10-20% в год (чтобы прощаться со слабыми). По мнению Николая это работает, так как
- Постоянная фильтрация открывает лестницу для новых талантов
- Ранние сотрудники уходят мультимиллионерами (топ-менеджеры заработали $50-80M на вторичных продажах акций)
- Компенсация выше банков: зарплата + бонусы + акции для всех 5K core team
Николай поделился следующими культурными ценностями, что приняты в компании
1. Never Settle — ставь амбициозные цели и достигай их
2. Think Deep — глубокий анализ, логика, zero bullshit
3. Dream Team — маленькие команды из звёзд
4. Get Things Done — ownership без микроменеджмента
5. Deliver Wow — перфекционизм для долгосрочного качества
Отдельно много фокуса на AI и автоматизации работы (кстати, я уже разбирал подход к автоматизации процессов разработки в Revolut). Конкретно в этом интервью речь была про риск менеджмент и compliance:
- LLM обрабатывают 400,000+ страниц регуляций, автоматически экстрагируют obligations и линкуют к контролям
- ML-модели на 200+ параметрах (IP, транзакции, connections) — точность выше аналитиков-людей
- 75% customer support автоматизировано через чатботы и голосовых ассистентов
Подход Николая к управлению такой командой достигаторов выглядит так
1. Flat-структура
- Нет кабинета даже у CEO — работает с open space
- 40+ direct reports + 30 "bright young people" (ex-McKinsey/IB/фаундеры) в office of CEO для теневого аудита performance
2. KPI-driven всё
- Еженедельные 1:1 по 15 минут: Jira, метрики, проблемы
- Понедельник/вторник — department reviews
- Net performance 70%+, attrition <1.5% в квартал для сильных
3. Radical Honesty (примерно как в книге Radical Candor (Радикальная прямота), о которой я уже рассказывал)
- Нет политики, только данные
- Фидбек прямой, без эмоций
- Любой может подойти к любому
4. Продуктовый подход
- Команды 8-10 человек, bootstrap 9-18 месяцев
- Kill <25% продуктов по gross profit
- Интервьюеры обучаемы: их precision/recall трекают, худших 25% убирают
#Engineering #Leadership #Hiring #Culture #AI #Management #Startup
Посмотрел интересное интервью Николая Сторонского, основателя компании Revolut ($75 млрд оценка), что он дал Елизавете Осетинской, иностранному агенту. В этом интервью Николай рассказал о том, как строить компанию, где работают только топ-таланты. Но сначала стоит поговорить про масштаб компании сегодня (кстати, я про Revolut уже как-то рассказывал)
- 12,000 сотрудников (5,000 core team, 7,000 support/sales)
- 1,200 разработчиков, примерно ~30-40% всей команды — это engineering + product + data science
- 45M пользователей, 15M daily active
- $6B выручка, $2B прибыль (2025 план: $9B/$3B)
- 40 стран, экспансия в 60+ рынков
Компания фокусируется на найме hgih avievers (достигаторов). Сам Николай провел много тысяч интервью и так формулирует свои критерии
- Топ-1-5% везде — от школы до предыдущих мест работы
- STEM-бэкграунд с доказанным track record
- Problem-solving end-to-end — должны приходить с решениями, а не проблемами
- Амбициозные цели — цитата Николая из интервью, что мне понравилась "почти всё можно достичь, что подчиняется законам физики"
- Готовность увольнять слабых - большинство боятся этого делать
Отдельно Николай отметил, что они не берут
- Классических банкиров — "низкое качество талантов, они maintainers, а не builders"
- Средних исполнителей — "как только начинаешь работать со средними людьми, они приходят: 'У нас проблемы, что делать?' Мы таких не любим"
Интерес подход Николая к текучке - regrettable attrition наддо держать небольшим (1.5% в квартал), а forced attrition надо разгонять до 10-20% в год (чтобы прощаться со слабыми). По мнению Николая это работает, так как
- Постоянная фильтрация открывает лестницу для новых талантов
- Ранние сотрудники уходят мультимиллионерами (топ-менеджеры заработали $50-80M на вторичных продажах акций)
- Компенсация выше банков: зарплата + бонусы + акции для всех 5K core team
Николай поделился следующими культурными ценностями, что приняты в компании
1. Never Settle — ставь амбициозные цели и достигай их
2. Think Deep — глубокий анализ, логика, zero bullshit
3. Dream Team — маленькие команды из звёзд
4. Get Things Done — ownership без микроменеджмента
5. Deliver Wow — перфекционизм для долгосрочного качества
Отдельно много фокуса на AI и автоматизации работы (кстати, я уже разбирал подход к автоматизации процессов разработки в Revolut). Конкретно в этом интервью речь была про риск менеджмент и compliance:
- LLM обрабатывают 400,000+ страниц регуляций, автоматически экстрагируют obligations и линкуют к контролям
- ML-модели на 200+ параметрах (IP, транзакции, connections) — точность выше аналитиков-людей
- 75% customer support автоматизировано через чатботы и голосовых ассистентов
Подход Николая к управлению такой командой достигаторов выглядит так
1. Flat-структура
- Нет кабинета даже у CEO — работает с open space
- 40+ direct reports + 30 "bright young people" (ex-McKinsey/IB/фаундеры) в office of CEO для теневого аудита performance
2. KPI-driven всё
- Еженедельные 1:1 по 15 минут: Jira, метрики, проблемы
- Понедельник/вторник — department reviews
- Net performance 70%+, attrition <1.5% в квартал для сильных
3. Radical Honesty (примерно как в книге Radical Candor (Радикальная прямота), о которой я уже рассказывал)
- Нет политики, только данные
- Фидбек прямой, без эмоций
- Любой может подойти к любому
4. Продуктовый подход
- Команды 8-10 человек, bootstrap 9-18 месяцев
- Kill <25% продуктов по gross profit
- Интервьюеры обучаемы: их precision/recall трекают, худших 25% убирают
#Engineering #Leadership #Hiring #Culture #AI #Management #Startup
YouTube
«Мы играем в нападение». Интервью с основателем Revolut Николаем Сторонским
НАСТОЯЩИЙ МАТЕРИАЛ (ИНФОРМАЦИЯ) ПРОИЗВЕДЕН И РАСПРОСТРАНЕН ИНОСТРАННЫМ АГЕНТОМ ЕЛИЗАВЕТОЙ НИКОЛАЕВНОЙ ОСЕТИНСКОЙ ЛИБО КАСАЕТСЯ ДЕЯТЕЛЬНОСТИ ИНОСТРАННОГО АГЕНТА ЕЛИЗАВЕТЫ НИКОЛАЕВНЫ ОСЕТИНСКОЙ 18+
Выбрать премиум-апартаменты на Бали от самого креативного…
Выбрать премиум-апартаменты на Бали от самого креативного…
👍9❤6🔥3😁2
AI Trends 2026: Quantum, Agentic AI & Smarter Automation (Рубрика #AI)
Пока идут новогодние каникулы, можно глянуть предсказания на 2026 год. Так я наткнулся на видео Martin Keen и Aaron Baughman из IBM, что опубликовали такой обзор про AI на 2026 год. Кстати, Martin Keen, IBM Fellow, в прошлом году записывал такое видео в одиночку и я про него рассказывал (можете сравнить с реальностью и оценить что исполнилось).
1️⃣ Мультиагентная оркестрация (Multi-Agent Orchestration)
2025 был годом AI-агентов, но ни один агент не справляется со всем. В 2026 мы увидим команды специализированных агентов, координируемых оркестратором.
2️⃣ Цифровая рабочая сила (Digital Labor Workforce)
Автономные AI-агенты становятся "цифровыми работниками", способными парсить мультимодальный ввод, выполнять workflow и интегрироваться с корпоративными системами. Ключевой элемент — human-in-the-loop AI для oversight, коррекции и стратегического управления. Это важно, так как цифровые работники обеспечивают force-multiplying эффект, работают 24/7 и масштабируются без массового найма персонала.
3️⃣ Physical AI и гуманоидные роботы
AI покидает цифровое пространство и входит в физический мир. Physical AI — это модели, которые понимают 3D-среду, физику (гравитация, трение) и могут взаимодействовать с реальностью через роботизированные системы. Для этого нужны world foundation models (WFM), генеративные модели, создающие и понимающие 3D-окружения. Про этот подход рассказывала Fei-Fei Li, крестная мать AI, в докладе "Spatial Intelligence is the Next Frontier in AI", который я уже разбирал.
4️⃣ Social Computing — коллективный AI
Мир, где множество агентов и людей работают внутри общей AI-ткани (AI fabric). Агенты и люди соединены через единое пространство, обмениваются контекстом, намерениями и действиями, создавая empathetic emergent network — коллективный интеллект или "swarm computing".
5️⃣ Verifiable AI и EU AI Act
EU AI Act вступает в полную силу к середине 2026 года. Как GDPR для AI: системы высокого риска должны быть аудируемыми и трассируемыми. Требования:
- Документация — технические доки, тестирование, риски
- Прозрачность — пользователи должны знать, что взаимодействуют с машиной
- Data lineage — откуда данные и соблюдены ли авторские права
По мнению ребят EU AI Act установит глобальный шаблон для AI-регулирования, как GDPR для privacy.
6️⃣ Quantum Utility Everywhere
По мнению ребят именно в 2026 году квантовые вычисления начнут решать реальные задачи лучше, быстрее или эффективнее классических систем. Quantum utility scale — гибридные квант-классические системы, интегрированные в повседневные бизнес-операции для оптимизации, симуляций и принятия решений. Это обусловлено тем, что мы уже видим прорывы в коррекции ошибок, модульности и гибридных алгоритмах ускоряются, а также появляются Quantum-as-a-Service от IBM, AWS, Microsoft и Google.
7️⃣ Reasoning at the Edge — мышление на устройстве
Большие модели научились "думать" через inference-time compute (step-by-step reasoning). Теперь эти способности дистиллируются в малые модели (несколько миллиардов параметров), работающие на ноутбуках и телефонах. Модели с reasoning работают локально, данные не покидают устройство, нет задержки на облако.
8️⃣ Amorphous Hybrid Computing
Будущее там, где топологии AI-моделей и облачная инфраструктура сливаются в fluid computing backbone. Модели эволюционируют за пределы чистых трансформеров, интегрируя state space models (SSM) и другие архитектуры. Одновременно облака комбинируют CPU, GPU, TPU, QPU (quantum) и нейроморфные чипы, чтобы исполнять алгоритмсы на оптимальном для инференса устройстве, обеспечивая производительность и эффективность.
Итого, 2026 обещает стать переломным годом для AI: от изолированных моделей к оркестрированным системам, от облака к edge, от цифрового к физическому.
#AI #ML #Trends #Software #Engineering #Future
Пока идут новогодние каникулы, можно глянуть предсказания на 2026 год. Так я наткнулся на видео Martin Keen и Aaron Baughman из IBM, что опубликовали такой обзор про AI на 2026 год. Кстати, Martin Keen, IBM Fellow, в прошлом году записывал такое видео в одиночку и я про него рассказывал (можете сравнить с реальностью и оценить что исполнилось).
1️⃣ Мультиагентная оркестрация (Multi-Agent Orchestration)
2025 был годом AI-агентов, но ни один агент не справляется со всем. В 2026 мы увидим команды специализированных агентов, координируемых оркестратором.
2️⃣ Цифровая рабочая сила (Digital Labor Workforce)
Автономные AI-агенты становятся "цифровыми работниками", способными парсить мультимодальный ввод, выполнять workflow и интегрироваться с корпоративными системами. Ключевой элемент — human-in-the-loop AI для oversight, коррекции и стратегического управления. Это важно, так как цифровые работники обеспечивают force-multiplying эффект, работают 24/7 и масштабируются без массового найма персонала.
3️⃣ Physical AI и гуманоидные роботы
AI покидает цифровое пространство и входит в физический мир. Physical AI — это модели, которые понимают 3D-среду, физику (гравитация, трение) и могут взаимодействовать с реальностью через роботизированные системы. Для этого нужны world foundation models (WFM), генеративные модели, создающие и понимающие 3D-окружения. Про этот подход рассказывала Fei-Fei Li, крестная мать AI, в докладе "Spatial Intelligence is the Next Frontier in AI", который я уже разбирал.
4️⃣ Social Computing — коллективный AI
Мир, где множество агентов и людей работают внутри общей AI-ткани (AI fabric). Агенты и люди соединены через единое пространство, обмениваются контекстом, намерениями и действиями, создавая empathetic emergent network — коллективный интеллект или "swarm computing".
5️⃣ Verifiable AI и EU AI Act
EU AI Act вступает в полную силу к середине 2026 года. Как GDPR для AI: системы высокого риска должны быть аудируемыми и трассируемыми. Требования:
- Документация — технические доки, тестирование, риски
- Прозрачность — пользователи должны знать, что взаимодействуют с машиной
- Data lineage — откуда данные и соблюдены ли авторские права
По мнению ребят EU AI Act установит глобальный шаблон для AI-регулирования, как GDPR для privacy.
6️⃣ Quantum Utility Everywhere
По мнению ребят именно в 2026 году квантовые вычисления начнут решать реальные задачи лучше, быстрее или эффективнее классических систем. Quantum utility scale — гибридные квант-классические системы, интегрированные в повседневные бизнес-операции для оптимизации, симуляций и принятия решений. Это обусловлено тем, что мы уже видим прорывы в коррекции ошибок, модульности и гибридных алгоритмах ускоряются, а также появляются Quantum-as-a-Service от IBM, AWS, Microsoft и Google.
7️⃣ Reasoning at the Edge — мышление на устройстве
Большие модели научились "думать" через inference-time compute (step-by-step reasoning). Теперь эти способности дистиллируются в малые модели (несколько миллиардов параметров), работающие на ноутбуках и телефонах. Модели с reasoning работают локально, данные не покидают устройство, нет задержки на облако.
8️⃣ Amorphous Hybrid Computing
Будущее там, где топологии AI-моделей и облачная инфраструктура сливаются в fluid computing backbone. Модели эволюционируют за пределы чистых трансформеров, интегрируя state space models (SSM) и другие архитектуры. Одновременно облака комбинируют CPU, GPU, TPU, QPU (quantum) и нейроморфные чипы, чтобы исполнять алгоритмсы на оптимальном для инференса устройстве, обеспечивая производительность и эффективность.
Итого, 2026 обещает стать переломным годом для AI: от изолированных моделей к оркестрированным системам, от облака к edge, от цифрового к физическому.
#AI #ML #Trends #Software #Engineering #Future
YouTube
AI Trends 2026: Quantum, Agentic AI & Smarter Automation
Ready to become a certified watsonx AI Assistant Engineer v1 - Professional? Register now and use code IBMTechYT20 for 20% off of your exam → https://ibm.biz/BdbTDQ
Learn more about AI Trends Shaping the Next 10 Years here → https://ibm.biz/BdbTDT
What…
Learn more about AI Trends Shaping the Next 10 Years here → https://ibm.biz/BdbTDT
What…
❤9👍3🔥2
Парк Львов "Земля Прайда" (Рубрика #Kids)
2 января мы с детишками и друзьями мы были в парке львов "Земля Прайда" (1 и 2 января мы провели под Клином, поэтому ехать до парка было близко). Я уже как-то рассказывал про ребят, но с тех пор они переехали на территорию побольше + завели tg-канал (или он уже был). В этот раз мы приехали после обеда да еще и в зимний день, поэтому часть животных пряталась в своих домиках и уже спала (ведь зимой дни короткие). Но мы мы, прикупив ведерки с едой для животных, смогли пройтись по територии и потренироваться в метании мяса тиграм и львам, а также покормить с рук кроликов, верблюдов, ламу, оленя ...
В общем, парк отличный
- Многие животные были выкуплены из неволи и выхожены сотрудниками парка - видно, что они достаточно вольготно живут и хорошо питаются
- На территории парка все сделано для животных и людей - вальеры для животных большие, тигры, мишки и львы живут на большой и огороженной территории, где ты поднимаешься по лестнице наверх и дальше смотришь не через прутья клетки, а как бы с высоты на зверей
За час-полтора мы быстрым темпом обошли всех животных (медленно ходить было прохладно), потом взяли по капучино для взрослых и по коле для детей в кафешке, сели в машину и поехали обратно в Москву.
#ForParents #ForKids #Family #Stories
2 января мы с детишками и друзьями мы были в парке львов "Земля Прайда" (1 и 2 января мы провели под Клином, поэтому ехать до парка было близко). Я уже как-то рассказывал про ребят, но с тех пор они переехали на территорию побольше + завели tg-канал (или он уже был). В этот раз мы приехали после обеда да еще и в зимний день, поэтому часть животных пряталась в своих домиках и уже спала (ведь зимой дни короткие). Но мы мы, прикупив ведерки с едой для животных, смогли пройтись по територии и потренироваться в метании мяса тиграм и львам, а также покормить с рук кроликов, верблюдов, ламу, оленя ...
В общем, парк отличный
- Многие животные были выкуплены из неволи и выхожены сотрудниками парка - видно, что они достаточно вольготно живут и хорошо питаются
- На территории парка все сделано для животных и людей - вальеры для животных большие, тигры, мишки и львы живут на большой и огороженной территории, где ты поднимаешься по лестнице наверх и дальше смотришь не через прутья клетки, а как бы с высоты на зверей
За час-полтора мы быстрым темпом обошли всех животных (медленно ходить было прохладно), потом взяли по капучино для взрослых и по коле для детей в кафешке, сели в машину и поехали обратно в Москву.
#ForParents #ForKids #Family #Stories
🔥11❤8👍3