Десятки, а иногда и сотни тысяч событий в день. Каждое — потенциальная авария, а может, просто шум. L1-инженеру нужно решить: добавить событие к инциденту? Создать новый? А может, это часть уже закрытого? Или всё серьёзнее — и перед нами экосистемный сбой, затрагивающий десятки сервисов?
Раньше в МТС это классифицировали вручную. Но при таком объёме и разнообразии инфраструктуры быстро поняли, что нужна автоматизация. Слишком велик риск пропустить важное, не найти корень проблемы, потратить драгоценные минуты в критический момент.
В этой статье — Михаил Копытин, руководитель команды разработки, и Евгений Лачугин, руководитель экосистемной команды поддержки в МТС Web Services – расскажут, как построили автоматизацию, какие архитектурные решения приняли, какие грабли собрали и как достигли точности разметки выше 80%.
Раньше в МТС это классифицировали вручную. Но при таком объёме и разнообразии инфраструктуры быстро поняли, что нужна автоматизация. Слишком велик риск пропустить важное, не найти корень проблемы, потратить драгоценные минуты в критический момент.
В этой статье — Михаил Копытин, руководитель команды разработки, и Евгений Лачугин, руководитель экосистемной команды поддержки в МТС Web Services – расскажут, как построили автоматизацию, какие архитектурные решения приняли, какие грабли собрали и как достигли точности разметки выше 80%.
Хабр
Как мы научили ML группировать 50 000 событий в инциденты
Десятки, а иногда и сотни тысяч событий в день. Каждое — потенциальная авария, а может, просто шум. L1-инженеру нужно решить: добавить событие к инциденту? Создать новый? А может, это часть уже...
Если на ваших проектах SLA часто превращаются из полезного инструмента в головную боль, эта статья поможет изменить подход и начать строить платформы с гарантированной надежностью.
Мы разберем, как перейти от «красивых на бумаге» метрик к реально работающим SLA, основанным на архитектуре системы. Посмотрим, почему классические SLI вроде Latency и доступности прокси не всегда полезны. Разберем, как анализ компонентов платформы помогает связать метрики с алертами и построить адекватный план SLA.
О непростых технических компромиссах и ошибках, которые превратились в ценный опыт, расскажет инженерный менеджер с 13 годами опыта Игорь Цупко.
Мы разберем, как перейти от «красивых на бумаге» метрик к реально работающим SLA, основанным на архитектуре системы. Посмотрим, почему классические SLI вроде Latency и доступности прокси не всегда полезны. Разберем, как анализ компонентов платформы помогает связать метрики с алертами и построить адекватный план SLA.
О непростых технических компромиссах и ошибках, которые превратились в ценный опыт, расскажет инженерный менеджер с 13 годами опыта Игорь Цупко.
Хабр
Как не потерять миллионы на SLA: архитектурный подход к управлению ожиданиями
Нарушение SLA — это условность, которую придумали поверх технических проблем. В IT-инфраструктуре любая техническая проблема быстро превращается в убытки, особенно если не умеешь правильно управлять...
❤2🔥1
Если вы настраивали доступ к Grafana, Argo CD, Vault или Prometheus через «костыли» — эта статья для вас!
Пошаговое руководство от CTO в Hilbert Team Алексея Цыкунова о том, как удобно организовать Single Sign-on с помощью Keycloak. В первой части статьи рассматриваются: развертывание Keycloak в Kubernetes, настройка Terraform-провайдера для автоматизации и интеграция с популярными инфраструктурными сервисами. Здесь вы погрузитесь в теорию, чтобы подготовиться к практической части.
Пошаговое руководство от CTO в Hilbert Team Алексея Цыкунова о том, как удобно организовать Single Sign-on с помощью Keycloak. В первой части статьи рассматриваются: развертывание Keycloak в Kubernetes, настройка Terraform-провайдера для автоматизации и интеграция с популярными инфраструктурными сервисами. Здесь вы погрузитесь в теорию, чтобы подготовиться к практической части.
Хабр
SSO через Keycloak для инфраструктурных сервисов: часть 1, теория
Если вы хоть раз настраивали доступ к Grafana, Argo CD, Vault или Prometheus и сталкивались с аутентификацией «на костылях», значит, тоже задавались вопросом: почему бы не сделать это один раз и...
❤4🔥1👏1
Практическое продолжение вчерашней статьи 🙌
Теперь попрактикуемся, развернем Keycloak в Kubernetes, настроим Terraform-провайдер, подключим к нему Grafana, Argo CD и другие сервисы. Проверим реальные конфигурации клиентов, scopes и mappings, чтобы SSO заработал с нужными токенами, ролями и группами.
Теперь попрактикуемся, развернем Keycloak в Kubernetes, настроим Terraform-провайдер, подключим к нему Grafana, Argo CD и другие сервисы. Проверим реальные конфигурации клиентов, scopes и mappings, чтобы SSO заработал с нужными токенами, ролями и группами.
Хабр
SSO через Keycloak для инфраструктурных сервисов: часть 2, практика
В первой части мы разобрали, как устроен Keycloak, какие у него сущности и зачем вообще нужен SSO в DevOps-инфраструктуре. Теперь — к делу. Во второй части переходим от теории к практике....
👍5🤝2🔥1
⚡Прием докладов открыт
Друзья, если вы хотите стать спикером DevOpsConf 2026, то сейчас идеальное время для того, чтобы отправить заявку. У вас будет больше шансов попасть в программу и хороший запас времени на подготовку 💪
DevOpsConf – это площадка для обсуждения практических вопросов из мира DevOps, SRE, разработки и инженерных практик. Здесь нет места теоретическим рассуждениям или поверхностному изучению тем. Максимально прагматично рассматриваем реальные вопросы и задачи, возникающие у инженеров, техлидов, тимлидов, СТО, СІО.
✅ Узнать тематику конференции и отправить заявку можно на сайте
Ждем ваши доклады 🙌
Друзья, если вы хотите стать спикером DevOpsConf 2026, то сейчас идеальное время для того, чтобы отправить заявку. У вас будет больше шансов попасть в программу и хороший запас времени на подготовку 💪
DevOpsConf – это площадка для обсуждения практических вопросов из мира DevOps, SRE, разработки и инженерных практик. Здесь нет места теоретическим рассуждениям или поверхностному изучению тем. Максимально прагматично рассматриваем реальные вопросы и задачи, возникающие у инженеров, техлидов, тимлидов, СТО, СІО.
✅ Узнать тематику конференции и отправить заявку можно на сайте
Ждем ваши доклады 🙌
🔥4🎉2❤1
Технология eBPF открывает новые возможности для наблюдения и обеспечения безопасности на уровне ядра Linux, но одновременно становится потенциальным вектором атак.
В статье Льва Хакимова, DevOps и Kubernetes Security Lead в MWS Cloud Platform, подробно разбирается, как работает eBPF, какие угрозы с ней связаны и как от них эффективно защититься.
Разбор нюансов написания кода в Kernel Space, особенностей capabilities, уязвимостей типа атак на shared maps, обходов через io_uring и защиты с rootkit-ов на базе eBPF — все это в статье ✅
В статье Льва Хакимова, DevOps и Kubernetes Security Lead в MWS Cloud Platform, подробно разбирается, как работает eBPF, какие угрозы с ней связаны и как от них эффективно защититься.
Разбор нюансов написания кода в Kernel Space, особенностей capabilities, уязвимостей типа атак на shared maps, обходов через io_uring и защиты с rootkit-ов на базе eBPF — все это в статье ✅
Хабр
eBPF & Security: возможности, угрозы и способы защиты
Технология eBPF не нова. Её используют повсеместно, ведь она упрощает написание кода для ядра ОС. Классно и удобно, а главное безопасно! Но, как оказывается на практике, не все так гладко… Это не...
❤2👍2👏1
Привет, друзья!
Мы начинаем работу над новым продуктом и хотели бы обратиться к вам за помощью 🖐️
Приглашаем вас принять участие в опросе, который поможет нам лучше понять ваши потребности.
Для участия достаточно перейти по ссылке и заполнить опрос.
Это займет всего пару минут, но для нас это важная информация для создания действительно полезного и нужного продукта для вас.
✅ Пройти опрос
Спасибо за ваше участие!
Мы начинаем работу над новым продуктом и хотели бы обратиться к вам за помощью 🖐️
Приглашаем вас принять участие в опросе, который поможет нам лучше понять ваши потребности.
Для участия достаточно перейти по ссылке и заполнить опрос.
Это займет всего пару минут, но для нас это важная информация для создания действительно полезного и нужного продукта для вас.
✅ Пройти опрос
Спасибо за ваше участие!
🤝4❤1 1
Как управлять масштабной инфраструктурой из 15 000 инстансов баз данных для 100 инженеров проектов?
Андрей Аксенов, Tech Lead of DBA Core RnD компании Wildberries, поделился опытом автоматизации раскатки, настройки и жизненного цикла БД с помощью Ansible, Tarantool и продуманной архитектуры.
Узнайте, как команда построила удобный конвейер с изолированными переменными, уменьшила порог входа для инженеров, внедрила систему тестирования ролей и настроила CI/CD для надежности и масштабируемости.
Если вы работаете с большими инфраструктурами и стремитесь снизить когнитивную нагрузку команды, этот кейс станет отличным примером для вдохновения и практических идей 🙌
Андрей Аксенов, Tech Lead of DBA Core RnD компании Wildberries, поделился опытом автоматизации раскатки, настройки и жизненного цикла БД с помощью Ansible, Tarantool и продуманной архитектуры.
Узнайте, как команда построила удобный конвейер с изолированными переменными, уменьшила порог входа для инженеров, внедрила систему тестирования ролей и настроила CI/CD для надежности и масштабируемости.
Если вы работаете с большими инфраструктурами и стремитесь снизить когнитивную нагрузку команды, этот кейс станет отличным примером для вдохновения и практических идей 🙌
Хабр
Оркестрируем 15 тысяч инстансов разных БД без боли (почти)
Привет, Хабр! Это Андрей Аксенов, Tech Lead of DBA Core RnD компании Wildberries. Занимаюсь базами данных, а точнее — автоматизирую их раскатку, настройку и весь жизненный цикл. Расскажу, как мы...
👍3❤1
Друзья, с праздником 🎉
Пусть ваши деплои будут быстрыми, пайплайны зелёными, а продакшн стабильным! Kubernetes слушается с первого раза, Terraform всегда аплится успешно, а мониторинг молчит лишь потому, что всё идеально работает 🤌
Продолжайте держать инфраструктуру в тонусе и радовать пользователей бесперебойностью сервисов 💪
Пусть ваши деплои будут быстрыми, пайплайны зелёными, а продакшн стабильным! Kubernetes слушается с первого раза, Terraform всегда аплится успешно, а мониторинг молчит лишь потому, что всё идеально работает 🤌
Продолжайте держать инфраструктуру в тонусе и радовать пользователей бесперебойностью сервисов 💪
🎉7❤2😎2
Почему быть спикером полезно и интересно?
Ответила на этот вопрос и поделилась своим опытом Анна Лучник, спикер DevOpsConf 2025. Анна — ментор Сколково, помогает стартапам в разработке стратегии, управлении киберрисками и выстраивании продаж сложных IТ-решений.
✋ А мы напоминаем, что прием заявок на доклады на DevOpsConf 2026 открыт. Если вы хотите стать спикером, не откладывайте подачу заявок на последний момент. Чем раньше отправите — тем меньше конкуренция и больше шансов попасть в программу!
➡️ Ознакомиться с темами и отправить заявку можно на сайте
🖐️ Ждем ваши доклады и до встречи на DevOpsConf 2026 — профессиональной конференции по интеграции процессов разработки, тестирования и эксплуатации.
Ответила на этот вопрос и поделилась своим опытом Анна Лучник, спикер DevOpsConf 2025. Анна — ментор Сколково, помогает стартапам в разработке стратегии, управлении киберрисками и выстраивании продаж сложных IТ-решений.
✋ А мы напоминаем, что прием заявок на доклады на DevOpsConf 2026 открыт. Если вы хотите стать спикером, не откладывайте подачу заявок на последний момент. Чем раньше отправите — тем меньше конкуренция и больше шансов попасть в программу!
➡️ Ознакомиться с темами и отправить заявку можно на сайте
🖐️ Ждем ваши доклады и до встречи на DevOpsConf 2026 — профессиональной конференции по интеграции процессов разработки, тестирования и эксплуатации.
👍4❤3⚡1
В каждой компании есть необходимость выстроить систему observability. В hh.ru перестраивали архитектуру под большее количество данных несколько раз — сейчас там на входе 24k RPS, 1 миллион спанов в секунду, 5k инстансов сервисов.
Если вы — инженер, который находится в процессе построения или перестройки собственной системы трейсинга, эта статья от Александра Казанцева — для вас 🙌
Если вы — инженер, который находится в процессе построения или перестройки собственной системы трейсинга, эта статья от Александра Казанцева — для вас 🙌
Хабр
Трейсинг в hh.ru: как мы выросли от 1 тысячи до 1 миллиона событий в секунду без семплирования
В каждой компании есть необходимость выстроить систему observability. В hh.ru мы перестраивали архитектуру под большее количество данных несколько раз — сейчас имеем на входе 24к RPS, 1 миллион спанов...
👍2🤝1
Чтобы принимать верные решения и создавать прорывные продукты, нужно постоянно быть в потоке: знать последние тренды, иметь доступ к лучшим практикам и уметь быстро применять их в работе.
Но как успевать за всем? Где брать время на поиск и фильтрацию тонн информации?
Представляем вам Поддерживающую базу знаний — ваш персональный пропуск в мир экспертизы для разработчиков, архитекторов и лидеров цифровой индустрии.
Что вы получите уже сегодня:
🚀 Мгновенный доступ к инсайдам. Записи всех конференций — уже через две недели после их проведения, а не через полгода, как для всех остальных. Вы будете первыми знать о ключевых обновлениях и трендах.
📚 Более 4000 единиц эксклюзивного контента с профессиональных конференций. Перестаньте тратить время на поиск — начните эффективно учиться и применять.
🔧 Практические руководства от экспертов. Мы не просто даем теорию. Мы собираем готовые алгоритмы действий из видео, статей и кейсов, которые ваша команда сможет использовать в проектах сразу же.
💡 Эксклюзив: встреча с экспертом. К каждому гайду мы организуем live-сессию с экспертом. Получайте ответы на свои вопросы и ценные инсайты из первых рук для ускорения развития и уверенности в каждом решении.
Переходите по ссылке https://clck.ru/3PNkA8, регистрируйтесь и получите полный доступ к библиотеке на 1 месяц в подарок.
Но как успевать за всем? Где брать время на поиск и фильтрацию тонн информации?
Представляем вам Поддерживающую базу знаний — ваш персональный пропуск в мир экспертизы для разработчиков, архитекторов и лидеров цифровой индустрии.
Что вы получите уже сегодня:
🚀 Мгновенный доступ к инсайдам. Записи всех конференций — уже через две недели после их проведения, а не через полгода, как для всех остальных. Вы будете первыми знать о ключевых обновлениях и трендах.
📚 Более 4000 единиц эксклюзивного контента с профессиональных конференций. Перестаньте тратить время на поиск — начните эффективно учиться и применять.
🔧 Практические руководства от экспертов. Мы не просто даем теорию. Мы собираем готовые алгоритмы действий из видео, статей и кейсов, которые ваша команда сможет использовать в проектах сразу же.
💡 Эксклюзив: встреча с экспертом. К каждому гайду мы организуем live-сессию с экспертом. Получайте ответы на свои вопросы и ценные инсайты из первых рук для ускорения развития и уверенности в каждом решении.
Переходите по ссылке https://clck.ru/3PNkA8, регистрируйтесь и получите полный доступ к библиотеке на 1 месяц в подарок.
❤1
Если вы хотите стать спикером DevOpsConf 2026, но считаете, что вам нечего рассказать – это видео для вас. Валерий Евдокимов был спикером нашей конференции и у него есть для вас действенный совет 😉
После просмотра видео переходите на сайт, выбирайте свою тему для доклада и отправляйте заявку!
Ждем ваши доклады и вас на DevOpsConf 2026 🙌
После просмотра видео переходите на сайт, выбирайте свою тему для доклада и отправляйте заявку!
Ждем ваши доклады и вас на DevOpsConf 2026 🙌
❤3👍1🔥1👏1
Холодная война между разработчиками и DevOps — здесь нет выживших, только выгоревшие.
Хорошие новости в том, что есть способы это изменить и превратить конфликты в полезное сотрудничество!
В этой статье о том, как выстроить работу так, чтобы было удобно и разработчикам, и самим девопсам. Как выйти из роли «пожарной команды», навести порядок в ожиданиях и инструментах, построить платформу и не сгореть.
Хорошие новости в том, что есть способы это изменить и превратить конфликты в полезное сотрудничество!
В этой статье о том, как выстроить работу так, чтобы было удобно и разработчикам, и самим девопсам. Как выйти из роли «пожарной команды», навести порядок в ожиданиях и инструментах, построить платформу и не сгореть.
Хабр
От DevOps к платформе: как улучшить взаимодействие команд
Команды разработки и DevOps начинают совместную работу с энтузиазма и взаимного уважения. Но со временем отношения превращаются в холодную войну. В ней нет победителей — только выгоревшие....
220+ минут полезного и концентрированного контента для тех, кто хочет заложить или укрепить культурный и технологический фундамент DevOps на практике.
Принесли вам записи докладов с конференции HighLoad++ 2024 из секции «DevOps-практики и культура», на которых эксперты: развеяли мифы о PowerShell7, поделились опытом адаптации PHP-приложений под Kubernetes и рассказали, как оптимизировать облачные расходы. Вы также узнаете о важности инженерной культуры и получите советы по управлению инцидентами в распределённых системах.
Обращаем внимание, что записи доступны только подписчикам сообщества HighLoad++. Подписывайтесь, чтобы видеть больше полезного контента, который периодически будет дополняться 😉
1️⃣ Когда Powershell лучше, чем Ansible? Рецепты приготовления на 1000+ серверов. Михаил Соколов
2️⃣ Теперь готовлю только так: как мы затащили новостные сайты на Drupal 8 в Kubernetes. Алексей Демьянов
3️⃣ FinOps: Optimize для K8s. Илья Кочнев
4️⃣ Инженерная культура на масштабе: Как развивать и оценивать практики! Евгений Харченко
5️⃣ Дизастер нерекавери, или Как на очередных учениях по отказоустойчивости у нас сломались PostgreSQL-кластеры. Артем Федоров
Смотрите сами и делитесь с коллегами 🙌
Принесли вам записи докладов с конференции HighLoad++ 2024 из секции «DevOps-практики и культура», на которых эксперты: развеяли мифы о PowerShell7, поделились опытом адаптации PHP-приложений под Kubernetes и рассказали, как оптимизировать облачные расходы. Вы также узнаете о важности инженерной культуры и получите советы по управлению инцидентами в распределённых системах.
Обращаем внимание, что записи доступны только подписчикам сообщества HighLoad++. Подписывайтесь, чтобы видеть больше полезного контента, который периодически будет дополняться 😉
1️⃣ Когда Powershell лучше, чем Ansible? Рецепты приготовления на 1000+ серверов. Михаил Соколов
На нынешний день есть несколько мифов об использовании PowerShell7 в индустрии. Очень хочется их разрушить и взять на заметку советы и паттерны для Configuration Management при условии, когда Ansible уже может не справляться или его использование затруднено.
2️⃣ Теперь готовлю только так: как мы затащили новостные сайты на Drupal 8 в Kubernetes. Алексей Демьянов
Алексей рассказал историю одного php-приложения, которое было адаптировано под kubernetes. Из этого доклада вы поймете, что это не так сложно сделать, как говорится «глаза боятся — руки делают». Узнаете, какие подводные камни могут ожидать на этом пути, и благодаря докладу сможете их избежать.
3️⃣ FinOps: Optimize для K8s. Илья Кочнев
Облако съело годовой бюджет проекта за неделю? Илья объяснил, что самое неоптимальное — это виртуальные машины, которые недогружены. В частности, узлы K8s. Спикер рассказал, каким образом сохранить деньги без потери эффективности работы приложения.
4️⃣ Инженерная культура на масштабе: Как развивать и оценивать практики! Евгений Харченко
В докладе затрагиваются вопросы, связанные с внедрением, развитием и оценкой инженерной культуры, процессов и практик в больших технологических и enterprise компаниях.
5️⃣ Дизастер нерекавери, или Как на очередных учениях по отказоустойчивости у нас сломались PostgreSQL-кластеры. Артем Федоров
Каждый любит истории падений. Кто тестирует на проде, тот знает им цену. Вероятно, многие, кто имел дело с распределёнными базами данных, встречался с проблемами Split Brain или перевыборами. Как обезопасить себя во время падений дата-центра, что делать во время и после инцидента — всё здесь!
Смотрите сами и делитесь с коллегами 🙌
❤2🔥1
Станьте голосом DevOps-сообщества 🎤
🖐️ Напоминаем, что у нас открыт прием заявок на доклады на профессиональную конференцию по интеграции процессов разработки, тестирования и эксплуатации DevOpsConf 2026, которая пройдет в апреле следующего года в Москве.
📍Заявки принимаются до 24 ноября. Очень советуем отправлять заранее, не тяните до дедлайна — чем раньше отправите, тем больше будет шансов попасть в программу!
Нам интересно обсуждение практических вопросов из мира DevOps, SRE, разработки и инженерных практик. На DevOpsConf нет места теоретическим рассуждениям или поверхностному изучению тем. Максимально прагматично рассматриваем реальные вопросы и задачи, возникающие у инженеров, техлидов, тимлидов, СТО, СІО.
✅ Ознакомиться с перечнем актуальных тем и отправить заявку можно на сайте
Если у вас есть опыт, который может быть полезен аудитории конференции, обязательно отправляйте заявку. Если вы сомневаетесь в актуальности своей темы — отправляйте заявку, Программный комитет даст обратную связь и поможет с подготовкой к выступлению 🤝
Ждем ваши заявки и до встречи на DevOpsConf 2026 🙌
🖐️ Напоминаем, что у нас открыт прием заявок на доклады на профессиональную конференцию по интеграции процессов разработки, тестирования и эксплуатации DevOpsConf 2026, которая пройдет в апреле следующего года в Москве.
📍Заявки принимаются до 24 ноября. Очень советуем отправлять заранее, не тяните до дедлайна — чем раньше отправите, тем больше будет шансов попасть в программу!
Нам интересно обсуждение практических вопросов из мира DevOps, SRE, разработки и инженерных практик. На DevOpsConf нет места теоретическим рассуждениям или поверхностному изучению тем. Максимально прагматично рассматриваем реальные вопросы и задачи, возникающие у инженеров, техлидов, тимлидов, СТО, СІО.
✅ Ознакомиться с перечнем актуальных тем и отправить заявку можно на сайте
Если у вас есть опыт, который может быть полезен аудитории конференции, обязательно отправляйте заявку. Если вы сомневаетесь в актуальности своей темы — отправляйте заявку, Программный комитет даст обратную связь и поможет с подготовкой к выступлению 🤝
Ждем ваши заявки и до встречи на DevOpsConf 2026 🙌
❤2👍1