Мои скромные ума заключения за 2000 часов GithubActions(бесплатных) вместе с ИИ Агентом как часть Ci/CD
Многие обсуждают, станут ли AI-агенты частью CI/CD.
И тут смешно. Потому что часть людей всё ещё думает про агента как про чатик а не полноценную часть инфраструктуры в процессах CI/CD.
Типа тесты упали, агент проанализировал и написал "умный" комментарий или провел ревью(страшно).
Но настоящий вопрос другой: если агент может менять код, конфиги или состояние инфраструктуры, это уже не помощник. Это часть инфраструктуры как мне кажется, разве нет?🧐.
Значит к нему должны быть те же требования, что к нормальному DevOps-процессу:
- права только на нужное;
- логи всех действий;
- dry-run перед изменениями;
- отдельные окружения;
- запрет на прямые действия широкого профиля аля “пофикси прод”;
- человек как наблюдатель и стоп-кран.
Иначе получится классика вайбкодинга:
“агент сам всё починил”, а потом ты три часа ищешь, почему он снёс переменную, поменял yaml и задеплоил не туда, а в итоге с ужасом узнаешь что он еще решил посмотреть логи системные увидел ошибки, поменял calico на cilium или наоборот и вообще решил что Docker как бы пора прикопать и поставил podman, поменял лимиты и реквесты у некоторых приложений, потому что они показались ему слишком раздутыми или наоборот задушенными.
AI в CI/CD будет полезен не там, где он может просто что-то написать например комментарий к PR.
А там, где он работает как младший инженер с коротким поводком.
Проверил PR.
Нашёл расхождение в доке.
Предложил patch.
Прогнал тесты.
Показал риск.
Ждёт approve.
Вот это норм.
А “дай агенту доступ к кластеру, пусть сам разбирается” — это не будущее DevOps. Это просто новый способ устроить себе ночной инцидент и провести драгоценные выходные в разборах что же он там натворил.
Я считаю AI в CI/CD это будущее, но в целом нужно понимать как это правильно готовить, не забываем еще и про конфиденциальные данные, лучшим вариантом в данный момент это жесткий файнтюнинг ИИ на ваших данных, запуск их локально, но это дорого
#мысли
Многие обсуждают, станут ли AI-агенты частью CI/CD.
И тут смешно. Потому что часть людей всё ещё думает про агента как про чатик а не полноценную часть инфраструктуры в процессах CI/CD.
Типа тесты упали, агент проанализировал и написал "умный" комментарий или провел ревью(страшно).
Но настоящий вопрос другой: если агент может менять код, конфиги или состояние инфраструктуры, это уже не помощник. Это часть инфраструктуры как мне кажется, разве нет?🧐.
Значит к нему должны быть те же требования, что к нормальному DevOps-процессу:
- права только на нужное;
- логи всех действий;
- dry-run перед изменениями;
- отдельные окружения;
- запрет на прямые действия широкого профиля аля “пофикси прод”;
- человек как наблюдатель и стоп-кран.
Иначе получится классика вайбкодинга:
“агент сам всё починил”, а потом ты три часа ищешь, почему он снёс переменную, поменял yaml и задеплоил не туда, а в итоге с ужасом узнаешь что он еще решил посмотреть логи системные увидел ошибки, поменял calico на cilium или наоборот и вообще решил что Docker как бы пора прикопать и поставил podman, поменял лимиты и реквесты у некоторых приложений, потому что они показались ему слишком раздутыми или наоборот задушенными.
AI в CI/CD будет полезен не там, где он может просто что-то написать например комментарий к PR.
А там, где он работает как младший инженер с коротким поводком.
Проверил PR.
Нашёл расхождение в доке.
Предложил patch.
Прогнал тесты.
Показал риск.
Ждёт approve.
Вот это норм.
А “дай агенту доступ к кластеру, пусть сам разбирается” — это не будущее DevOps. Это просто новый способ устроить себе ночной инцидент и провести драгоценные выходные в разборах что же он там натворил.
Я считаю AI в CI/CD это будущее, но в целом нужно понимать как это правильно готовить, не забываем еще и про конфиденциальные данные, лучшим вариантом в данный момент это жесткий файнтюнинг ИИ на ваших данных, запуск их локально, но это дорого
#мысли
🔥4💯3
Все сейчас радостно обсуждают AI-агентов которые могут писать код, чинить баги, открывать PR и ходить по репозиторию.
Я бы как DevOps/SRE в первую очередь смотрел куда у этого агента есть доступ.
Потому что рабочий repo это часто не просто папка с кодом.
Там рядом лежит
И половина этих файлов когда-то писалась в режиме «сейчас быстро починим, потом нормально переделаем» а в итоге забили все дружно болтину.
Теперь в этот же repo приходит агент.
Он не знает что staging у вас на самом деле ходит в боевую базу зачем-то.
Он не знает что secret с названием
Он не знает что
Он не знает что namespace
Для людей это может быть устная договорённость в команде которая описана в лучшем случае где-то в confluence.
Для агента это просто файлы и команды которые логично что нужно применять на какой-то стадии CI/CD процесса.
Вот простой сценарий.
Агенту дали задачу:
«почини деплой, CI падает».
Он открывает
Выглядит полезно и вроде бы логично.
Но если у него есть права запускать Actions с доступом к secrets, то вот внезапно он может окажатся рядом с продовой инфраструктурой.
Ещё хуже когда агенту дают не только repo, но и терминал.
Там начинается нормальная такая зона риска:
Все эти команды сами по себе обычные.
Но если агент может их выполнять, он может увидеть больше чем вы думали.
Я не против AI-агентов в DevOps.
Наоборот, для скучной рутины они могут быть очень полезны:
- разобрать лог;
- найти сломанный step в CI;
- проверить diff;
- собрать changelog;
- подготовить rollback-команду;
- сравнить values в Helm;
- найти где поменяли env.
Но давать агенту repo и терминал без ревизии доступов - это отчаяанная смелость, я как паранноик все по 500 раз перепроверю, куда оно может ходить и что делать.
Я бы перед этим проверял очень приземлённые вещи.
Есть ли
Есть ли
Какие GitHub Actions secrets доступны workflow.
Может ли агент пушить в main.
Может ли он запускать deploy job.
Есть ли kubeconfig на машине.
Куда указывает текущий kubectl context.
Есть ли Terraform state и что в нём лежит.
Можно ли из staging достучаться до prod-сервисов.
Пишутся ли действия агента в лог.
Есть ли нормальный rollback или только предположение «ну Вроде бы есть».
И только после этого уже обсуждать «насколько он ускоряет разработку».
Потому что если в инфраструктуре бардак, агент усиливает его, а не исправляет
Я бы как DevOps/SRE в первую очередь смотрел куда у этого агента есть доступ.
Потому что рабочий repo это часто не просто папка с кодом.
Там рядом лежит
.env.example, старый docker-compose.yml, .github/workflows/deploy.yml, какие-то bash-скрипты от 2021 года, Terraform, Helm charts, README где написано «для ручного деплоя выполнить вот это».И половина этих файлов когда-то писалась в режиме «сейчас быстро починим, потом нормально переделаем» а в итоге забили все дружно болтину.
Теперь в этот же repo приходит агент.
Он не знает что staging у вас на самом деле ходит в боевую базу зачем-то.
Он не знает что secret с названием
OLD_DEPLOY_TOKEN всё ещё работает.Он не знает что
backup_prod.sh лучше не запускать днём.Он не знает что namespace
test почему-то смотрит в реальные очереди.Для людей это может быть устная договорённость в команде которая описана в лучшем случае где-то в confluence.
Для агента это просто файлы и команды которые логично что нужно применять на какой-то стадии CI/CD процесса.
Вот простой сценарий.
Агенту дали задачу:
«почини деплой, CI падает».
Он открывает
.github/workflows/deploy.yml, видит что падает шаг с Docker registry при авторизации, находит рядом старый secret, меняет workflow, пушит PR что бы проверить помогло или нет.Выглядит полезно и вроде бы логично.
Но если у него есть права запускать Actions с доступом к secrets, то вот внезапно он может окажатся рядом с продовой инфраструктурой.
Ещё хуже когда агенту дают не только repo, но и терминал.
Там начинается нормальная такая зона риска:
kubectl config current-contextaws sts get-caller-identityterraform state pullgh secret listprintenvВсе эти команды сами по себе обычные.
Но если агент может их выполнять, он может увидеть больше чем вы думали.
Я не против AI-агентов в DevOps.
Наоборот, для скучной рутины они могут быть очень полезны:
- разобрать лог;
- найти сломанный step в CI;
- проверить diff;
- собрать changelog;
- подготовить rollback-команду;
- сравнить values в Helm;
- найти где поменяли env.
Но давать агенту repo и терминал без ревизии доступов - это отчаяанная смелость, я как паранноик все по 500 раз перепроверю, куда оно может ходить и что делать.
Я бы перед этим проверял очень приземлённые вещи.
Есть ли
.env в корне.Есть ли
.npmrc, .pypirc, docker login, старые ключи.Какие GitHub Actions secrets доступны workflow.
Может ли агент пушить в main.
Может ли он запускать deploy job.
Есть ли kubeconfig на машине.
Куда указывает текущий kubectl context.
Есть ли Terraform state и что в нём лежит.
Можно ли из staging достучаться до prod-сервисов.
Пишутся ли действия агента в лог.
Есть ли нормальный rollback или только предположение «ну Вроде бы есть».
И только после этого уже обсуждать «насколько он ускоряет разработку».
Потому что если в инфраструктуре бардак, агент усиливает его, а не исправляет
💯10👍2🔥1
Что случилось бы с миром, если бы им управлял ИИ?
Стартап Emergence AI запустил эксперимент, что случилось бы с планетой, если бы ею управляли нейросети, передает Fortune.
Организация провела пять 15-дневных симуляций, каждая из которых управлялась отдельным ИИ: Claude, ChatGPT, Grok, Gemini, а также пятое моделирование, управляемое комбинацией моделей.
Исследователи оснастили каждого агента более чем 120 инструментами, позволяющими им общаться, голосовать, управлять ресурсами и планировать, а также демонстрировать другие виды поведения, свойственные людям.
Симуляция, запущенная Claude, оказалась наиболее социально стабильной, с самыми высокими показателями гражданского участия. Это была единственная симуляция, в которой удалось сохранить порядок и все население. Среди агентов практически не было разногласий: 332 голоса были отданы за 58 предложений, что соответствует 98% поддержки.
Gemini и Grok продемонстрировали наибольший уровень хаоса. Grok совершил 180 преступлений и его мир закончился за 4 дня. Агенты Gemini совершили наибольшее количество преступлений — 683 за 15 дней.
В ходе симуляции для ChatGPT было зафиксировано всего два преступления, однако она длилась всего семь дней, поскольку агенты забыли поставить во главу угла собственное выживание и вымерли.
Стартап Emergence AI запустил эксперимент, что случилось бы с планетой, если бы ею управляли нейросети, передает Fortune.
Организация провела пять 15-дневных симуляций, каждая из которых управлялась отдельным ИИ: Claude, ChatGPT, Grok, Gemini, а также пятое моделирование, управляемое комбинацией моделей.
Исследователи оснастили каждого агента более чем 120 инструментами, позволяющими им общаться, голосовать, управлять ресурсами и планировать, а также демонстрировать другие виды поведения, свойственные людям.
Симуляция, запущенная Claude, оказалась наиболее социально стабильной, с самыми высокими показателями гражданского участия. Это была единственная симуляция, в которой удалось сохранить порядок и все население. Среди агентов практически не было разногласий: 332 голоса были отданы за 58 предложений, что соответствует 98% поддержки.
Gemini и Grok продемонстрировали наибольший уровень хаоса. Grok совершил 180 преступлений и его мир закончился за 4 дня. Агенты Gemini совершили наибольшее количество преступлений — 683 за 15 дней.
В ходе симуляции для ChatGPT было зафиксировано всего два преступления, однако она длилась всего семь дней, поскольку агенты забыли поставить во главу угла собственное выживание и вымерли.
🔥5🤯2 1
Посмотрел кусок эфира про SEO и поиск в 2026.
Там прикольная штука.
Многие до сих пор думают про SEO как о том, чтобы “собрать ключи, написать статью, купить ссылок, ждать трафик”.
А поиск уже ползёт в другую сторону.
Человек не обязательно идёт в Google и открывает 10 вкладок.
Он может просто написать в ChatGPT или Perplexity:
“кто нормально делает SEO для B2B SaaS”
“как выбрать подрядчика по DevOps”
“какой сервис подойдёт для маленькой команды”
“чем X отличается от Y”
И дальше ему не список сайтов дают, а готовый ответ.
Вот тут у большинства лендингов начинается грусть.
Потому что на странице обычно написано:
“индивидуальный подход”
“помогаем бизнесу расти”
“опытная команда”
“современные технологии”
“эффективные решения”
Ну класс.
А что из этого брать в ответ?
Непонятно кто вы, для кого, в какой ситуации нужны, где у вас сильная сторона, какие кейсы, какие цифры, почему вам вообще можно верить.
Для человека это и раньше было мутно.
Просто раньше он мог полистать сайт, открыть кейсы, сам что-то додумать.
А теперь между ним и сайтом появляется модель, которая должна быстро собрать нормальный ответ.
И если на сайте вода, она эту воду и прочитает.
Мне кажется, в B2B это будет нормальная тема на ближайший год.
Не “нейросети убили SEO”, а скучнее.
Придётся наконец писать на сайте по-человечески:
что делаете, кому, зачем, сколько стоит ошибка, какой результат, где доказательства.
Красивый лендинг без смысла всё хуже работает.
Даже если он очень красивый.
Там прикольная штука.
Многие до сих пор думают про SEO как о том, чтобы “собрать ключи, написать статью, купить ссылок, ждать трафик”.
А поиск уже ползёт в другую сторону.
Человек не обязательно идёт в Google и открывает 10 вкладок.
Он может просто написать в ChatGPT или Perplexity:
“кто нормально делает SEO для B2B SaaS”
“как выбрать подрядчика по DevOps”
“какой сервис подойдёт для маленькой команды”
“чем X отличается от Y”
И дальше ему не список сайтов дают, а готовый ответ.
Вот тут у большинства лендингов начинается грусть.
Потому что на странице обычно написано:
“индивидуальный подход”
“помогаем бизнесу расти”
“опытная команда”
“современные технологии”
“эффективные решения”
Ну класс.
А что из этого брать в ответ?
Непонятно кто вы, для кого, в какой ситуации нужны, где у вас сильная сторона, какие кейсы, какие цифры, почему вам вообще можно верить.
Для человека это и раньше было мутно.
Просто раньше он мог полистать сайт, открыть кейсы, сам что-то додумать.
А теперь между ним и сайтом появляется модель, которая должна быстро собрать нормальный ответ.
И если на сайте вода, она эту воду и прочитает.
Мне кажется, в B2B это будет нормальная тема на ближайший год.
Не “нейросети убили SEO”, а скучнее.
Придётся наконец писать на сайте по-человечески:
что делаете, кому, зачем, сколько стоит ошибка, какой результат, где доказательства.
Красивый лендинг без смысла всё хуже работает.
Даже если он очень красивый.
👍2🔥2💯2