Книжный куб

Gemini 3.5: Google делает ставку на агентные workflow (Рубрика #AI)

Посмотрел вчерашний анонс Gemini 3.5 с Google I/O. Формально Google опубликовала его 19 мая 2026 года, и мне кажется, важная часть здесь не в очередной гонке benchmark'ов, а в том, как компания формулирует следующий слой применения моделей. Если коротко, то Google представила семейство Gemini 3.5 и начала с 3.5 Flash. А модель 3.5 Pro, по словам Google, уже используется внутри компании и должен пойти в rollout в следующем месяце. Интересно, что Flash больше не выглядит как “быстрый младший брат” большой модели. Его прямо позиционируют как модель для frontier-level agents and coding.

Это сильный сигнал того, куда сдвигается рынок. Еще недавно основной разговор был вокруг “насколько хорошо модель отвечает на сложные вопросы”. Теперь все больше разговоров про другое: может ли модель выполнить длинную задачу автономно, разложить ее на шаги, пользоваться инструментами, запускать субагентов, поддерживать контекст и доводить работу до конца.

По утверждению Google, 3.5 Flash обходит Gemini 3.1 Pro на ряде кодинговых и агентных бенчей: Terminal-Bench 2.1, GDPval-AA, MCP Atlas, CharXiv Reasoning. Google также говорит про скорость вывода до 4x относительно других frontier-моделей. Интересно проверить эти заявления на в собственных сценариях, но по бенчам ожидания от модели большие.

Если смотреть на саму модель, то видно, что сделана ставка на long-horizon tasks. В посте Google много примеров не про “ответь на вопрос”, а про “сделай работу”: поддержка codebase, подготовка финансовых документов, анализ неструктурированных ассетов, миграция legacy codebase, генерация интерактивных UI, параллельные подходы к UX-задачам. Это уже не чат как интерфейс к модели, а модель как исполнитель внутри workflow.

Отдельно интересно, как они описывают Antigravity (это их IDE, что круто умеет в фронтовые задачи). В связке с обновленным harness 3.5 Flash должен запускать коллаборативных субагентов и выполнять многошаговые кодинговые задачи под наблюдением. По сути, Google двигает идею supervised execution: модель не просто предлагает фрагмент решения, а становится оркестратором набора действий, которые человек или система контролируют.

Enterprise-примеры тоже показательные. Shopify использует субагентов для долгого анализа данных, Macquarie Bank пилотирует онбординг по документам на 100+ страниц, Salesforce интегрирует Flash в Agentforce, Ramp применяет мультимодальное понимание к распознаванию инвойсов , Xero автоматизирует многошаговые налоговые workflows, Databricks смотрит в сторону диагностики проблем в сложных data environments. Это, конечно, кейсы из материала Google, но они хорошо показывают направление: модели тащат в рутину компаний, где много документов, данных, проверок и tool calling.

Еще одна важная деталь: Google несет agentic слой не только в инструменты для разработчиков. 3.5 Flash становится дефолтной моделью в Gemini app и AI Mode in Search, а новый Gemini Spark описан как персональный AI агент, который работает 24/7 и действует по указанию пользователя. То есть одна и та же логика идет сразу в три стороны: разработчики, enterprise и массовые пользовательские продукты.

Про safety тоже стоит сказать осторожно. Google пишет про Frontier Safety Framework, усиленные кибер и CBRN (Chemical, Biological, Radiological, and Nuclear) safeguards, более продвинутое safety training и interpretability tools. Это правильные слова, но реальную безопасность мы увидем, когда модель попадет в руки миллионов пользователей, разработчиков и остальных желающих.

В общем, Gemini 3.5 показывает, что гонка топовых лаб смещается к агентной модели, где фронтир модели используются для выполнения автономных задач, через декомпозицию их на части, использование инструментов, запуск субагентов, поддержку контекст и все остальное ... для того, чтобы доводить работу до конца:)

#AI #Google #ML #Engineering #Software #Management #Agents

Google

Gemini 3.5: frontier intelligence with action

At Google I/O we released Gemini 3.5, our latest series of models combining frontier intelligence with action.

❤16👍12🔥1🥱1

2.77K viewsAlexander Polomodov, edited 05:08

Книжный куб

Билеты на AI Dev Conf (Рубрика #Conference)

Я вхожу в программный комитет конференции AI Dev Conf, а заодно и выступаю на этой конференции с keynote докладом про "State of AI4SDLC". Сама конференция пройдет уже завтра, а у меня есть пара билетиков, что я готов раздать подписчикам канала. Для того, чтобы претендовать на билетик вам надо порекомендовать мне в комментариях интересные whitepapers про внедрение AI в разработку, метрики и результаты. Но важно не просто накидать whitepapers, но и объяснить почему они вам понравились и какие интересные инсайты вы из них почерпнули. В конце этого дня я определю двух победителей и отправлю им билетик в личку.

#AI #Engineering #Architecture #ML #Software #Economics #Software

aidevconf.org

AI Dev Conf 2026

Конференция о применении AI в SDLC

❤7🔥4👍3

2.72K viewsAlexander Polomodov, 08:22

Книжный куб

Spec-driven development (SDD): почему AI вернул спецификации в разработку (Рубрика #Engineering)

Горячая тема spec-driven development мне кажется реинкарнацией старых подходов типа бородатых V-Model или RUP, что в районе двухтысячных использовались для описания инженерных процессов. Мне стало интересно поразмышлять, а почему так происходит и так появилась этот пост:)

Старый spec-driven подход был про то, что сначала нужно описать требования, потом дизайн, потом реализацию, потом проверку. V-Model хорошо показывала эту симметрию: каждому уровню проектирования соответствует свой уровень validation/verification. Плюсы были в трассировке от требований к коду и проверяемости ожиданий, а минусы были в бюрократии и разрыве между документами и кодом.

С AI ситуация поменялась. Спецификация стала рабочим интерфейсом между человеком и агентом. Если код пишет или сильно помогает писать агент, то главный вопрос уже не “как быстро я напишу реализацию руками”. Главный вопрос: насколько точно я могу сформулировать intent, ограничения, критерии приемки и способ проверки результата. Агенту мало сказать “сделай фичу”. Ему нужен контекст: что должно измениться, что не должно сломаться, какие сценарии считаются успехом, какие тесты запустить, где границы задачи.

Поэтому современный spec-driven development выглядит примерно так:
intent -> acceptance criteria -> plan -> tasks -> implementation -> verification.

Теперь документы становятся исполняемым контекстом для агента. Спека используется для составления плана, план раскладывается на задачи, задачи делегируются, тесты и логи становятся доказательством работоспособности, а review проверяет не только diff, но и соответствие исходному намерению.

Есть разные подходы к этому снаряду

1️⃣ GitHub Spec Kit прямо формулирует SDD как процесс “сначала определить, что строить, потом дать AI coding agent реализовать”. Там есть цепочка spec -> plan -> tasks -> implement, checklists, clarify/analyze шаги и интеграции с разными агентами. Тут соль в agent-agnostic идее: спецификация становится переносимым контрактом, а не промптом для одного IDE.

2️⃣ Kiro от AWS идет похожим путем, но более продуктово. У них spec обычно раскладывается на requirements.md, design.md, tasks.md; отдельно есть steering-файлы для постоянного знания о проекте: архитектура, стек, conventions, структура. Это уже очень похоже на попытку сделать из AI coding управляемый процесс разработки feature или bugfix.

3️⃣ Codex и подход harness engineering показывают третий вариант. Там важны AGENTS.md, знание репозитория, configured dev environment, тесты, логи, PR review и возможность запускать несколько задач параллельно. В таком мире prompt начинает напоминать хорошо написанный GitHub issue: цель, контекст, ограничения, expected behavior, команды проверки.

4️⃣ Есть и lightweight-вариант, который, кажется, сейчас самый практичный для многих команд: PRD/RFC/issue + acceptance tests + CI + agent instructions. Без отдельного фреймворка. Главное, чтобы у задачи был четкий “definition of done”, а агент мог доказать, что он его достиг.

На практике это дает несколько преимуществ
- Меньше неопределенность - агент хуже всего работает там, где человек сам не решил, чего хочет
- Большие задачи проще делегировать - их можно резать на независимые кусочки и проверять по частям
- Появляется трассировка между намерением, дизайном решения, задачами и тестами
- Review перестает быть только чтением diff'а - он становится проверкой: “достигли ли мы цели, которую сами же сформулировали?”

Правда, не все так безоблачно - spec-driven development (SDD) сам по себе не гарантирует качество. Пeлохая спецификация просто быстрее производит неправильный код.

#Engineering #AI #Software #Architecture #Management #DevTools #Agents #ML #SystemDesign

1❤17👍6🔥6

3.22K viewsAlexander Polomodov, edited 11:44

Книжный куб

AI Dev Podcast #2: Александр Поломодов, Сергей Баранов / Архитектура в эпоху ИИ (Рубрика #Architecture)

Около месяца назад мы записывали подкаст вместе с Сергеем Барановым (основателем ArchDays) и Андреем Дмтриевым (со-основателем JUG.RU) в рамках подготовки к сегодняшней конфе AI Dev Conf. Так получилось, что дальше я уехал в отпуск и забыл поделиться с вами этим эпизодом, а он был интересным:) Речь в нем шла про то, как LLM и мультиагентные системы меняют software architecture и инженерные процессы. Обсудили двойственную природу ИИ: с одной стороны - демократизация разработки (через lovable.dev и аналоги), с другой - жесткая необходимость в инженерном фундаменте для масштабирования.

Основными темами выпуска стали
- От SOE 1.0 к SOE 2.0: как люди и агенты будут работать в связке.
- Роль архитектора: больше не "чертежник", а стратег, валидирующий варианты от ИИ и выстраивающий внутренние модели.
- Экономика: почему типовые решения уходят в автоматизацию, а ценность повторного использования компонентов взлетает до небес.
- Болевые точки: бардак с данными и онтологиями, блокирующие зависимости между сервисами и проблема контекста.
- Прогноз: как готовить платформу к "мажорной разработке" с агентами и почему локальные эксперименты с моделями станут базовым навыком архитектора.

В итоге: агенты научатся писать код, делать ревью и документацию. Но ставить цели, изобретать и управлять контекстом останется за человеком. Тех, кто не адаптируется, ждет разорение. Компании уже поняли, что просто заменить людей ИИ недостаточно - им срочно понадобились специалисты, умеющие с ним работать эффективно.

#AI4SDLC #AI #Engineering #Software #Processes #Management #Productivity

YouTube

AI Dev Podcast #2: Александр Поломодов, Сергей Баранов / Архитектура в эпоху ИИ

AI Dev Conf Podcast #2: Архитектура в эпоху ИИ — от хаоса к новой инженерной реальности

Гости выпуска: Сергей Баранов (продюсер ArchDays) и Александр Поломодов (технический директор в Т-Банке).

О чем поговорили:
Как LLM и мультиагентные системы меняют софт…

❤7🔥7👍4🥱1

3.56K viewsAlexander Polomodov, edited 05:08

Книжный куб

Почему AI делает инфраструктуру управленческой темой (Рубрика #AI)

Пару дней назад вышла статья РБК про то, почему бизнес выбирает гибридную инфраструктуру. В этом интервью РБК от 19 мая генеральный директор Yandex Cloud Григорий Атрепьев говорит, что рынок корпоративного ПО в России по итогам 2025 года вырос до 808 млрд руб., а два главных фактора изменения рынка сейчас - информационная безопасность и искусственный интеллект.

А сегодня я весь день преподаю в рамках программы ВШЭ “ИИ-лидеры: бизнес-лаборатория для руководителей” и рассказываю менеджерам про облака, DataOps, MLOps и AIOps. И эта статья отлично попадает в главный тезис моего рассказа: AI в компании начинается не с красивой демки модели. Он начинается с инфраструктуры, данных, безопасности, эксплуатации и управленческой готовности довести пилот до промышленного внедрения.

Если возвращаться к тезисам Григория из статьи то они примерно такие

1️⃣ Искусственный интеллект и информационная безопасность - это комбо-связка. С одной стороны, компании живут в более агрессивной среде: по словам Yandex Cloud, в прошлом году они обрабатывали 103 млрд событий ежедневно в собственной SIEM-системе, в три раза больше год к году. С другой стороны, AI уже перестал быть только экспериментом: на платформе, по данным компании, создано более 18 тыс. агентов.
2️⃣ Дальше начинается самое интересное для менеджеров. AI быстро превращается в инфраструктурную задачу. Растет спрос на GPU, по исследованию Yandex Cloud и Apple Hills Digital среднегодовой темп роста этого сегмента до 2030 года оценивается в 23%. Меняются требования к ЦОД: если раньше стойка могла потреблять 5-6 кВт, то сейчас для AI-нагрузок речь идет уже о 100 кВт и выше.
3️⃣ На этом фоне гибридная инфраструктура выглядит не как компромисс “между облаком и своим железом”, а как рабочая модель зрелой компании. Публичное облако дает скорость экспериментов, быстрые пилоты и гибкое потребление ресурсов. Частный контур нужен там, где есть чувствительные данные, регуляторные ограничения, требования ИБ и уже сложившиеся корпоративные системы.
4️⃣ Но гибридность не достается бесплатно. В статье хорошо перечислены барьеры: разные инструменты и навыки, Kubernetes, API, мониторинг, синхронизация, резервное копирование, безопасность. А с AI добавляется новый слой: нужно контролировать агентов в корпоративных системах, разграничивать доступ к данным, защищать протоколы и наблюдать цепочки действий. Observability становится не только темой SRE, но и темой управления AI-рисками.

В общем, управленческий вывод такой: AI-проекты чаще ломаются не на выборе или доступе к вашей любимой модели. Они начинаю буксовать на качестве данных, доступности инфраструктуры, отсутствии сильного бизнес-спонсора, непонятной модели ответственности и неспособности превратить пилот в повторяемый процесс. Поэтому менеджерам важно понимать не только "какую нейросеть купить". Важно понимать, какой контур данных, облаков, MLOps/AIOps, ИБ, мониторинга и эксплуатации нужен, чтобы AI не остался презентацией на несколько сотрудников, а стал частью корпоративной системы.

#AI #Cloud #DataOps #MLOps #AIOps #Management #Engineering

👍8❤3🔥3🥱1

3.71K viewsAlexander Polomodov, 05:40

Книжный куб

Atomic Heart. Предыстория «Предприятия 3826»: как строилась советская техноутопия до сбоя (Рубрика #SciFi)

Продолжая свое погружение в мир Atomic Heart, прочитал специальное издание "Atomic Heart. Предыстория «Предприятия 3826»" Харальда Хорфа, которая отличается цветными вставками и более плотной и белой бумагой от обычного издания. Про саму игру я уже рассказывал отдельно: для меня Atomic Heart оказался не просто шутером про роботов, а погружением в советскую техноутопию, где автономные системы, централизованное управление и вера в автоматизацию в какой-то момент начинают вести себя как большая распределенная система со сбойнувшим контуром управления (control plane). Также чуть раньше этого я разбирал сборник "Atomic Heart: Далёкое светлое будущее", который показывает мир до старта игры: витрины утопии, бытовых роботов, ощущение прогресса и тот самый момент, когда ты читаешь почти лог системы прямо перед тем, как все пошло по наклонной.

Но новая книга показалась мне еще интереснее - она расскрывает всю историю от открытия полимера Сеченовым до научного рывка, роботизации, инфраструктуры Предприятия 3826 и движения к "Коллективу 2.0". Это крепкая научная фантастика, а не просто справочник с описанием основых персонажей - здесь раскрывается история о том, как большая технологическая мечта постепенно становится системой. Книга добавляет к игре не столько факты, сколько логичную историю с набором причин и следствий, в конце которых мы понимаем как мы оказались на месте майора Нечаева и понимаем кто и как сгенерировал этот сбой. Но это же означает, что книга содержит спойлеры, а значит ее стоит читать уже после прохождения игры. В игре мы уже видим последствия сбоя: агрессивных роботов, закрытые комплексы, поломанный контур управления и странное ощущение, что красивые лозунги будущего обернулись инфраструктурной катастрофой. А здесь видишь, почему люди вообще могли поверить в такую систему. Почему она выглядела не опасной, а логичной, прогрессивной и почти неизбежной.

Это, кстати, хорошо дополняет мои предыдущие мысли про Atomic Heart. Большая автономная система опасна не потому, что роботы внезапно “злые”. Она опасна, когда масштаб, централизация, доступы, цели, governance и границы ответственности становятся частью архитектуры, но к ним относятся как к второстепенным деталям. В мире Atomic Heart это выглядит красиво: наука, заводы, полимер, роботы, коллективное будущее. Но инженерно ты все время видишь вопрос: а где план Б, observability, kill switch и независимый контур контроля?

Мне кажется, что как отдельная фантастическая книга эта предыстория зайдет не всем, но она понравится тем, кому уже интересен Atomic Heart или кто хотя бы примерно понимает мир игры. Она делает мир плотнее и понятнее. После нее Предприятие 3826 воспринимается не просто как декорация для шутера, а как большой технологический проект со своей логикой, идеологией и архитектурной ценой. В общем, если вам нравится Atomic Heart, советская техноутопия, автономные роботы и истории о том, как “идеальное будущее” постепенно превращается в систему с огромным радиусом сбоя, книгу можно смело брать.

#SciFi #Games #AtomicHeart #AI #Robotics #Architecture #SystemDesign

❤12👍7🔥6🗿1

3.92K viewsAlexander Polomodov, 17:20

Книжный куб

State of AI4SDLC (Рубрика #AI4SDLC)

Появилась запись моего апрельского выступления на DevOps Conf с докладом про "State of AI4SDLC" или что сейчас реально происходит с AI в разработке и почему история уже давно не только про генерацию кода.

Про само исследование я уже рассказывал много раз, поэтому коротко. AI уже стал повседневным инструментом для кодогенерации. По нашим данным, 58% часто или всегда используют AI для генерации кода, 64% видят рост продуктивности. Но дальше картинка сложнее: доверие к AI-коду остается низким, а качество не улучшается автоматически. Главный вывод для меня такой: AI ускоряет не весь SDLC, а отдельные его участки. Если ничего не менять в инженерной системе, bottleneck просто переезжает из написания кода в review, тесты, CI/CD, интеграцию, безопасность, релизы и управление контекстом.

И вот здесь начинается самое интересное: мы движемся от Software Engineering 1.0 к Software Engineering 2.0.

В классическом Software Engineering 1.0 разработка часто выглядит как цепочка стадий и handoff’ов: требования, дизайн, реализация, review, тестирование, релиз. Даже в agile-командах эта логика никуда полностью не исчезла: есть тикет, есть исполнитель, есть diff, есть ревью, есть pipeline. В AI-native варианте часть работы начинают делать ассистенты и агенты. Они могут писать код, предлагать тесты, читать документацию, анализировать баги, готовить PR, помогать с миграциями. Но человек при этом не исчезает. Скорее меняется его позиция.

Разработчик становится не только автором кода, но и навигатором: задает intent, собирает context, формулирует ограничения, декомпозирует work graph, делегирует задачи агентам, проверяет результат и принимает инженерное решение.

Мне все больше нравится описывать это как цепочку: intent -> context -> plan -> tasks -> implementation -> verification.

И это сильно меняет привычный inner loop. Раньше основное усилие часто было в том, чтобы самому написать реализацию. Теперь все больше усилия уходит в то, чтобы правильно поставить задачу, дать системе достаточно контекста, ограничить пространство решений и построить проверку, которой можно доверять.

Отсюда следующий важный сдвиг: классический ticket tracker начинает трещать. Тикет как “описание задачи + статус + комментарии” был нормальной единицей координации для людей. Но агенту этого мало. Агенту нужен связанный контекст: цель, ограничения, зависимости, решения из прошлого, права доступа, кодовая база, тесты, логи, критерии приемки, доступные инструменты и границы того, что можно менять. Новая единица работы - не тикет, а context-rich work graph, в котором человек и агент могут безопасно довести задачу до результата.

Это влияет и на оргдизайн. AI-native организация - это не просто “меньше людей”. Скорее это меньше лишних handoff’ов, сильнее роль senior и staff engineers, больше self-service, сильнее platform engineering, больше automation и guardrails. То есть организация должна не только генерировать больше output’а, но и уметь безопасно его переваривать.

Именно поэтому метрики usage почти ничего не говорят. Количество запросов к AI, включенных лицензий или сгенерированных строк кода - это vanity metrics. Смотреть надо на всю цепочку: adoption -> throughput -> quality/risk -> economics. То есть: используют ли инструмент; ускорились ли PR, review, time to merge и cycle time; не выросли ли дефекты, инциденты, security-риск и технический долг; какая экономика у этой новой скорости.

Для разработчиков вывод в том, что надо уметь работать с AI как с инженерным контуром: декомпозировать задачи, писать хорошие acceptance критерии, проверять диффы, сгенерированные AI, понимать архитектурные последствия и держать в голове эксплуатацию.

Для тимлидов, EM и CTO вывод еще жестче: AI-внедрение нельзя вести как закупку инструмента. Это изменение production-системы разработки. Нужны правила, доступ к контексту, безопасные контуры, CI/CD, тесты, ownership, platform engineering, evals, observability и метрики результата.

#AI #AI4SDLC #Engineering #DevOps #Management #Architecture

YouTube

State of AI4SDLC / Александр Поломодов

Профессиональная конференция по интеграции процессов разработки, тестирования и эксплуатации DevOpsConf 2026

Презентация и тезисы:
https://devopsconf.io/moscow/2026/abstracts/17935

В этом докладе я поделюсь результатами нашего исследования про влияние…

❤18🔥11👍7

3.96K viewsAlexander Polomodov, edited 07:10

Книжный куб

AI_DISRUPT_PDLC_v3_7_v21_3155df1804.docx

350.3 KB

Whitepaper_FIN_DIGITAL_UPD_bb0bba281b.pdf

30.1 MB

Сбер выпустил AI-Disrupt PDLC — красивый PDF и странный 140-страничный DOC (Рубрика #AI4SDLC)

Прочитал на днях whitepaper Сбера про AI-Disrupt PDLC. Это концепция про то, что AI меняет весь продуктовый цикл разработки: intent, context, specs, agents, harness, evals, governance, risk ladder, evidence bundle, tiny teams и всё такое.

Центральная мысль мне близка. Я примерно об этом уже рассказывал в докладах и постах:
- Как AI меняет инженерную культуру на Yandex конфе
- State of AI4SDLC на DevOps конфе
Если сокращать два мои выступления выше до тезисов, то они звучат так
- AI ускоряет не весь SDLC, а отдельные его участки
- Если не перестроить инженерную систему, bottleneck просто переедет из написания кода в review, тесты, CI/CD, интеграцию, безопасность, релизы и управление контекстом.
- Разработчик становится не только автором кода, а навигатором: задаёт intent, собирает context, формулирует ограничения, делегирует задачи агентам и проверяет результат.

У Сбера это упаковано в язык корпоративной трансформации:
- Intent Loop - человек формулирует намерение.
- Implementation Loop - агенты исполняют.
- IDP / harness - платформа и обвязка, которая превращает недетерминированную модель в управляемый enterprise-инструмент. Кстати, у Сбера под IDP имеется в виду integrated developer platform, а не как в остальном мире internal developer platform
- SDD (spec driven development) - спецификация становится главным контрактом между человеком и агентом.
- Governance - проверки должны жить внутри процесса, а не приходить в конце релиза.

Это правильный сдвиг к перестройке production-системы разработки.

Но мой личный фидбек смешанный и вот почему

➕ PDF получился красивым executive summary. Видно, что ребята постарались, собрали нормальную рамку и понятный нарратив для CTO/CIO. Для российского enterprise это, наверное, полезно: наконец-то вслух проговорили, что модель - не главный актив. Главный актив - context, harness, evals, policies, platform engineering и способность организации безопасно принимать результат работы агентов. Но нового лично для меня там почти нет. Большая часть идей уже давно витает вокруг AI4SDLC: от classic PDLC к AI-native development, от AI-native dev к AI-native org, от тимлида как распределителя задач к тимлиду как проектировщику human-agent системы.

➖А вот большой DOC на 140 страниц — это уже совсем другое впечатление.
Там видно очень плотный LLM-микс: много правильных слов, много Gartner / McKinsey / Anthropic / Bain / AWS, много красивых терминов, но редактура слабая. Местами ощущение, что первоисточники использованы как топливо для генерации, а не как прочитанные и осмысленные работы. Я часть этих источников читал, поэтому некоторые отсылки выглядят забавно. Плюс документ плохо дружит с читателем: длинные полотна, повторы, перекрёстные ссылки, табличная сложность ради табличной сложности, текстом описанные схемы, которые в нормальном документе надо было бы визуализировать. Это скорее сырой материал для внутренней методологической группы, чем документ, который нормальный человек сядет и осилит ... я вот не осилил

В итоге, мне кажется, что этот документ "AI-Disrupt PDLC" ценен не как набор новых идей, а как сигнал о том, что большой российский enterprise легитимизирует тезис, который многие из нас уже обсуждают: AI в разработке - это не генерация кода, а новая архитектура инженерной организации.

#AI #Management #Future #Software #Engineering #Productivity #Agents #Processes

Please open Telegram to view this post

VIEW IN TELEGRAM

👍31❤13💯5👎1😁1🤔1

5.06K viewsAlexander Polomodov, edited 12:11

Книжный куб

The Developer's Playbook for LLM Security (Рубрика #Books)

Прочитал эту книгу за авторством Steve Wilson, который был руководителем проекта "OWASP Top 10 for LLM Applications". Брался за нее с вопросом, насколько книга 2024 года про безопасность больших языковых моделей еще актуальна в 2026-м. Ответ такой: как базовая инженерная рамка - да, очень. Как полный обзор текущей повестки - уже нет, потому что область за два года заметно уехала вперед.

Книга ценна тем, что она не пытается объяснять безопасность LLM как набор страшилок про промпт инъекции”, а показывает более широкую картину: где проходят границы доверия, почему приложение с языковой моделью нельзя воспринимать как обычное приложение, как появляются утечки данных, что делать с галлюцинациями, обработкой ответа, цепочкой поставки, паспортами моделей, SBOM/ML-BOM, защитными ограничениями, проверками атакующими сценариями и эксплуатацией LLM-систем.

Основные моменты из книги следующие

1️⃣ LLM - это не просто модель, а компонент программной системы. У него есть пользователи, контекст, данные, внешние источники, инструменты, среда выполнения, журналы, лимиты, права доступа и последствия действий. Поэтому безопасность нельзя повесить на один фильтр запросов перед моделью.

2️⃣ Промпт инъекции важны, но это не все. Ведь модель имеет доступ к внутренним сервисам, документам, базе знаний или инструментам, риск не в самом тексте, а в том, что он может сдвинуть поведение системы за границу допустимого.

3️⃣ Цепочка поставки в AI становится сложнее обычной цепочки поставки ПО. Кроме библиотек и контейнеров появляются модели, обучающие данные, векторные представления, подключаемые инструменты, шаблоны запросов, наборы для оценки качества и внешние провайдеры. Все это нужно описывать, версионировать, проверять и наблюдать в работе.

4️⃣ Важно выстроить безопасные процессы, а не просто реагировать на инциденты. Книга хорошо подводит к мысли, что безопасность LLM должна жить внутри разработки и эксплуатации: моделирование угроз, тесты, проверки атакующими сценариями, защитные ограничения, централизованные журналы, наблюдение, реакция на инциденты и регулярная переоценка рисков.

Но в 2026 году книгу уже нельзя читать как исчерпывающий справочник. В 2024-м центр тяжести был вокруг чат-ботов, RAG-приложений и LLM как нового класса прикладной безопасности. Сейчас повестка заметно сместилась к агентам: вызов инструментов, автономные рабочие процессы, MCP, память, идентичность, злоупотребление правами, межагентные взаимодействия, наблюдаемость в работе и возможность остановить или откатить действия.

OWASP это тоже отражает: помимо LLM Top 10 уже появились материалы по агентным приложениям и MCP Top 10. Чем больше агент может делать во внешнем мире, тем меньше безопасность похожа на “проверим ответ модели” и тем больше похожа на архитектуру доверия: кто дал цель, какие инструменты доступны, какие права выданы, что агент помнит, что пишется в журналы, кто подтверждает опасные действия и где находится аварийная остановка.

Поэтому моя оценка такая: книгу стоит читать как хороший фундамент для инженеров, архитекторов, специалистов по безопасности приложений, техлидов и руководителей, которые запускают LLM-фичи в промышленную эксплуатацию. Она помогает поставить голову на место и перестать думать, что безопасность AI - это отдельный магический слой вокруг модели.

#Books #AI #Security #LLM #Architecture #Engineering #DevSecOps

O’Reilly Online Learning

The Developer's Playbook for Large Language Model Security

Large language models (LLMs) are not just shaping the trajectory of AI, they're also unveiling a new era of security challenges. This practical book takes you straight to the heart... - Selection from The Developer's Playbook for Large Language Model Security…

🔥6👍4👌3❤1🥱1

2.95K viewsAlexander Polomodov, 06:09

Книжный куб

Upper Management Meeting: когда AI выглядит как магия для менеджмента (Рубрика #Management)

Посмотрел "Upper Management Meeting". Это очень смешно и немного грустно, потому что карикатура попадает в знакомое место: про AI действительно очень легко рассказывать красиво. Особенно если ты не очень хорошо понимаешь, как он устроен. В этом и есть управленческая опасность. Проблема не в том, что менеджеры интересуются AI. Это как раз нормально: технология уже влияет на продукты, процессы, разработку, поддержку, аналитику и стоимость работы. Проблема начинается там, где AI воспринимают как магию, а не как инженерный инструмент.

Артур Кларк, известный английский изобретатель, писатель и футуролог сформулировал знаменитый третий закон:

Любая достаточно развитая технология неотличима от магии

Для пользователя это иногда даже хорошо. Нажал кнопку - получил результат. Зачем ему знать, что там внутри? Но для человека, который принимает управленческие решения, такой подход опасен. Если технология выглядит как магия, ей легко приписать любые свойства: “пусть AI решит”, “добавим AI в продукт”, “сократим людей”, “автоматизируем все”, “сейчас модели сами все поймут”. И в этот момент обсуждение перестает быть инженерным, а становится почти ритуальным.

Хорошее AI-решение начинается не с восторга и не с красивой презентации. Оно начинается с более скучных вопросов:
- Какую конкретную задачу мы решаем
- Какие данные для этого нужны
- Какие ограничения есть у модели
- Как проверим качество
- Кто отвечает за ошибку
- Как это встроится в процесс
- Сколько будет стоить эксплуатация
- Что произойдет, если система уверенно сделает не то

Именно поэтому техническим руководителям сейчас важно уметь переводить AI из магического языка в инженерный: сценарии, ограничения, метрики, риски, контуры проверки, безопасность, эксплуатация и ответственность. AI можно воспринимать как магию, когда смотришь демо. Но нельзя принимать управленческие решения, полагаясь на магическое мышление. Чем сильнее технология, тем важнее понимать не только ее возможности, но и границы.

В общем, ролик короткий, смешной и полезный. Особенно для тех, кто участвует в AI-стратегиях, комитетах, roadmap-сессиях и разговорах с бизнесом.

#Management #AI #Engineering #Architecture #Leadership

YouTube

Upper Management Meeting.

Dying Company's Upper Management Meeting.

Sponsored by Vanta. Compliance for builders. Get started at Vanta.com.

Programmer humor
programmer jokes
Product Management humor.
AI Transformation
Next-gen AI.
Management humor.
Industry Tenure
Corporate Humor…

💯16❤10👍8🔥1

2.83K viewsAlexander Polomodov, 05:08

About

Blog

Apps

Platform