UndeRcode 2.0 - DevOps/AI

Мои скромные ума заключения за 2000 часов GithubActions(бесплатных) вместе с ИИ Агентом как часть Ci/CD

Многие обсуждают, станут ли AI-агенты частью CI/CD.

И тут смешно. Потому что часть людей всё ещё думает про агента как про чатик а не полноценную часть инфраструктуры в процессах CI/CD.

Типа тесты упали, агент проанализировал и написал "умный" комментарий или провел ревью(страшно).

Но настоящий вопрос другой: если агент может менять код, конфиги или состояние инфраструктуры, это уже не помощник. Это часть инфраструктуры как мне кажется, разве нет?🧐.

Значит к нему должны быть те же требования, что к нормальному DevOps-процессу:

- права только на нужное;
- логи всех действий;
- dry-run перед изменениями;
- отдельные окружения;
- запрет на прямые действия широкого профиля аля “пофикси прод”;
- человек как наблюдатель и стоп-кран.

Иначе получится классика вайбкодинга:
“агент сам всё починил”, а потом ты три часа ищешь, почему он снёс переменную, поменял yaml и задеплоил не туда, а в итоге с ужасом узнаешь что он еще решил посмотреть логи системные увидел ошибки, поменял calico на cilium или наоборот и вообще решил что Docker как бы пора прикопать и поставил podman, поменял лимиты и реквесты у некоторых приложений, потому что они показались ему слишком раздутыми или наоборот задушенными.

AI в CI/CD будет полезен не там, где он может просто что-то написать например комментарий к PR.
А там, где он работает как младший инженер с коротким поводком.

Проверил PR.
Нашёл расхождение в доке.
Предложил patch.
Прогнал тесты.
Показал риск.
Ждёт approve.

Вот это норм.

А “дай агенту доступ к кластеру, пусть сам разбирается” — это не будущее DevOps. Это просто новый способ устроить себе ночной инцидент и провести драгоценные выходные в разборах что же он там натворил.

Я считаю AI в CI/CD это будущее, но в целом нужно понимать как это правильно готовить, не забываем еще и про конфиденциальные данные, лучшим вариантом в данный момент это жесткий файнтюнинг ИИ на ваших данных, запуск их локально, но это дорого

#мысли

🔥4💯3

137 views13:30

PS Один из моих PR, где агенты общаются и делают ревью моего PR и тестируют код.

🔥5

143 viewsedited 13:39

UndeRcode 2.0 - DevOps/AI

Все сейчас радостно обсуждают AI-агентов которые могут писать код, чинить баги, открывать PR и ходить по репозиторию.

Я бы как DevOps/SRE в первую очередь смотрел куда у этого агента есть доступ.
Потому что рабочий repo это часто не просто папка с кодом.

Там рядом лежит .env.example, старый docker-compose.yml, .github/workflows/deploy.yml, какие-то bash-скрипты от 2021 года, Terraform, Helm charts, README где написано «для ручного деплоя выполнить вот это».

И половина этих файлов когда-то писалась в режиме «сейчас быстро починим, потом нормально переделаем» а в итоге забили все дружно болтину.

Теперь в этот же repo приходит агент.

Он не знает что staging у вас на самом деле ходит в боевую базу зачем-то.

Он не знает что secret с названием OLD_DEPLOY_TOKEN всё ещё работает.

Он не знает что backup_prod.sh лучше не запускать днём.

Он не знает что namespace test почему-то смотрит в реальные очереди.

Для людей это может быть устная договорённость в команде которая описана в лучшем случае где-то в confluence.

Для агента это просто файлы и команды которые логично что нужно применять на какой-то стадии CI/CD процесса.

Вот простой сценарий.

Агенту дали задачу:
«почини деплой, CI падает».

Он открывает .github/workflows/deploy.yml, видит что падает шаг с Docker registry при авторизации, находит рядом старый secret, меняет workflow, пушит PR что бы проверить помогло или нет.

Выглядит полезно и вроде бы логично.

Но если у него есть права запускать Actions с доступом к secrets, то вот внезапно он может окажатся рядом с продовой инфраструктурой.

Ещё хуже когда агенту дают не только repo, но и терминал.

Там начинается нормальная такая зона риска:

kubectl config current-context
aws sts get-caller-identity
terraform state pull
gh secret list
printenv

Все эти команды сами по себе обычные.

Но если агент может их выполнять, он может увидеть больше чем вы думали.

Я не против AI-агентов в DevOps.

Наоборот, для скучной рутины они могут быть очень полезны:
- разобрать лог;
- найти сломанный step в CI;
- проверить diff;
- собрать changelog;
- подготовить rollback-команду;
- сравнить values в Helm;
- найти где поменяли env.

Но давать агенту repo и терминал без ревизии доступов - это отчаяанная смелость, я как паранноик все по 500 раз перепроверю, куда оно может ходить и что делать.

Я бы перед этим проверял очень приземлённые вещи.

Есть ли .env в корне.

Есть ли .npmrc, .pypirc, docker login, старые ключи.

Какие GitHub Actions secrets доступны workflow.

Может ли агент пушить в main.

Может ли он запускать deploy job.

Есть ли kubeconfig на машине.

Куда указывает текущий kubectl context.

Есть ли Terraform state и что в нём лежит.

Можно ли из staging достучаться до prod-сервисов.

Пишутся ли действия агента в лог.

Есть ли нормальный rollback или только предположение «ну Вроде бы есть».

И только после этого уже обсуждать «насколько он ускоряет разработку».

Потому что если в инфраструктуре бардак, агент усиливает его, а не исправляет

💯10👍2🔥1

119 viewsedited 12:31

UndeRcode 2.0 - DevOps/AI

Что случилось бы с миром, если бы им управлял ИИ?

Стартап Emergence AI запустил эксперимент, что случилось бы с планетой, если бы ею управляли нейросети, передает Fortune.

Организация провела пять 15-дневных симуляций, каждая из которых управлялась отдельным ИИ: Claude, ChatGPT, Grok, Gemini, а также пятое моделирование, управляемое комбинацией моделей.

Исследователи оснастили каждого агента более чем 120 инструментами, позволяющими им общаться, голосовать, управлять ресурсами и планировать, а также демонстрировать другие виды поведения, свойственные людям.

Симуляция, запущенная Claude, оказалась наиболее социально стабильной, с самыми высокими показателями гражданского участия. Это была единственная симуляция, в которой удалось сохранить порядок и все население. Среди агентов практически не было разногласий: 332 голоса были отданы за 58 предложений, что соответствует 98% поддержки.

Gemini и Grok продемонстрировали наибольший уровень хаоса. Grok совершил 180 преступлений и его мир закончился за 4 дня. Агенты Gemini совершили наибольшее количество преступлений — 683 за 15 дней.

В ходе симуляции для ChatGPT было зафиксировано всего два преступления, однако она длилась всего семь дней, поскольку агенты забыли поставить во главу угла собственное выживание и вымерли.

🔥5🤯21

136 views18:52

UndeRcode 2.0 - DevOps/AI

Посмотрел кусок эфира про SEO и поиск в 2026.

Там прикольная штука.

Многие до сих пор думают про SEO как о том, чтобы “собрать ключи, написать статью, купить ссылок, ждать трафик”.

А поиск уже ползёт в другую сторону.

Человек не обязательно идёт в Google и открывает 10 вкладок.

Он может просто написать в ChatGPT или Perplexity:

“кто нормально делает SEO для B2B SaaS”
“как выбрать подрядчика по DevOps”
“какой сервис подойдёт для маленькой команды”
“чем X отличается от Y”

И дальше ему не список сайтов дают, а готовый ответ.

Вот тут у большинства лендингов начинается грусть.

Потому что на странице обычно написано:

“индивидуальный подход”
“помогаем бизнесу расти”
“опытная команда”
“современные технологии”
“эффективные решения”

Ну класс.

А что из этого брать в ответ?

Непонятно кто вы, для кого, в какой ситуации нужны, где у вас сильная сторона, какие кейсы, какие цифры, почему вам вообще можно верить.

Для человека это и раньше было мутно.

Просто раньше он мог полистать сайт, открыть кейсы, сам что-то додумать.

А теперь между ним и сайтом появляется модель, которая должна быстро собрать нормальный ответ.

И если на сайте вода, она эту воду и прочитает.

Мне кажется, в B2B это будет нормальная тема на ближайший год.

Не “нейросети убили SEO”, а скучнее.

Придётся наконец писать на сайте по-человечески:
что делаете, кому, зачем, сколько стоит ошибка, какой результат, где доказательства.

Красивый лендинг без смысла всё хуже работает.

Даже если он очень красивый.

👍2🔥2💯2

57 viewsedited 18:24

About

Blog

Apps

Platform