Если вы управляете базами данных в Kubernetes, то знаете, сколько времени уходит на настройку, мониторинг и обновления. В статье на Medium автор подробно рассказывает про PGO (Postgres Operator) от Crunchy Data — инструмент, который автоматизирует работу с PostgreSQL.
👉 Читать статью полностью и узнать, чем лучше Zalando Operator.
Это оператор Kubernetes, который берёт на себя рутину: от развертывания PostgreSQL-кластеров до настройки высокой доступности (HA) и резервного копирования. Работает с Patroni, чтобы кластеры оставались на плаву даже при сбоях.
— Автоматизация: разворачивайте кластеры, настраивайте реплики и бэкапы (pgbackrest) без ручной работы.
— Оптимизация: можно сделать мощный Primary и лёгкие реплики, чтобы не тратить лишние ресурсы.
— Мониторинг: встроенный pgmonitor (лучше postgres_exporter) даёт видимость состояния кластера. Интеграция с Grafana также доступна.
— Безопасность: контейнеры без root, суперпользователь ограничен — меньше рисков утечек данных.
— GitOps: PGO дружит с Helm и Kustomize.
PGO — отличный выбор, если нужна надёжная PostgreSQL в Kubernetes с минимумом ручного труда. Особенно для e-commerce или финтеха, где важны HA и отказоустойчивость.
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤3🔥3😎2👾2
Forwarded from Drim Dev
Ticketon опубликовал постмортем по следам сбоя 11 апреля. Я провёл его анализ и постарался извлечь больше технических деталей вместе с рекомендациями по предотвращению таких проблем в будущем.
https://teletype.in/@drimdev/ticketon-postmortem-2025-analysis
https://teletype.in/@drimdev/ticketon-postmortem-2025-analysis
Teletype
Анализ постмортема сбоя Ticketon 11 апреля 2025 года
Как и обещали, Ticketon опубликовали постмортем по итогам сбоя 11 апреля. Вот мой анализ этого документа.
🔥14👍9😎4👾2
NaaS предлагает креативные или реалистичные поводы сказать «нет» — будь то для шутки, симуляции отказа или даже интеграции в проекты.
Случайный текст отказа выбирается из базы с более чем 1000 универсальных причин — от серьёзных («Я занят, у меня дедлайн») до абсурдных («Я занят, у меня встреча с диваном, и он не принимает отказов»).
Как работает:
reasons.json/no API возвращает JSON с одной случайной причинойexpress-rate-limit)Теперь вам точно есть, чем заняться в выходные 😜😂 Пробуйте и делитесь с коллегами
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - hotheadhacker/no-as-a-service: No-as-a-Service (NaaS) is a simple API that returns a random rejection reason. Use it when…
No-as-a-Service (NaaS) is a simple API that returns a random rejection reason. Use it when you need a realistic excuse, a fun “no,” or want to simulate being turned down in style. - hotheadhacker/n...
🤣6👍5🔥4😎3
Ежегодная конференция объединит всех, кто интересуется аналитикой, трендами и инновациями уже в 6 раз.
В этом году на DataBoom Birthday:
• выступления спикеров из крупных IT-компаний
• ярмарка вакансий с ТОП-работодателями Казахстана
• возможность лично пообщаться с топовыми экспертами рынка;
• нетворкинг, неповторимая атмосфера, активности и розыгрыш.
👉 Покупайте билет и узнайте больше
#партнерский_пост
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥5❤3👎2🤣2
Forwarded from Aurteam
Как мы подготовили Aurma к росту: про инфраструктуру на Yandex Cloud, которую не видно, но которая важна
Когда ты создаёшь онлайн-маркетплейс аптек, где важно всё — от скорости работы до сохранности данных и стабильности сервиса — тебе нужна основа, на которую можно опереться.
В Aurma мы изначально поставили перед собой амбициозную цель: быть надёжным, доступным и удобным сервисом для миллионов пользователей по всей стране. Чтобы масштабироваться без потерь и сбоев, мы подошли к вопросу инфраструктуры как к стратегическому ресурсу.
📌 Мы выстроили систему, которая:
— выдерживает рост трафика и нагрузки
— не боится сбоев и отказов
— не требует огромной команды поддержки
— позволяет быстро обновлять и выкатывать новые фичи
Технологически это: Kubernetes, CI/CD, репликация БД, отказоустойчивость, автоматизация через Terraform и многое другое. Инфраструктура развёрнута в Yandex Cloud — надёжной и гибкой среде, где удобно управлять ресурсами и масштабировать нагрузку.
Оркестрация, надёжность, безопасность — всё это «под капотом», чтобы вы как пользователь просто открывали приложение и находили нужное быстрее и удобнее.
🎯 Реализовать эту историю нам помогли партнёры из Core 24/7 — надёжная команда, которая глубоко понимает задачи стартапов и умеет строить работающие решения для устойчивого роста.
👉 Подробности и подход, который мы использовали — в кейсе
#Aurma #маркетплейсаптек #инфраструктура #стартап #масштабирование #технологиивбизнесе #devops #цифроваяфармация #kubernetes
Когда ты создаёшь онлайн-маркетплейс аптек, где важно всё — от скорости работы до сохранности данных и стабильности сервиса — тебе нужна основа, на которую можно опереться.
В Aurma мы изначально поставили перед собой амбициозную цель: быть надёжным, доступным и удобным сервисом для миллионов пользователей по всей стране. Чтобы масштабироваться без потерь и сбоев, мы подошли к вопросу инфраструктуры как к стратегическому ресурсу.
📌 Мы выстроили систему, которая:
— выдерживает рост трафика и нагрузки
— не боится сбоев и отказов
— не требует огромной команды поддержки
— позволяет быстро обновлять и выкатывать новые фичи
Технологически это: Kubernetes, CI/CD, репликация БД, отказоустойчивость, автоматизация через Terraform и многое другое. Инфраструктура развёрнута в Yandex Cloud — надёжной и гибкой среде, где удобно управлять ресурсами и масштабировать нагрузку.
Оркестрация, надёжность, безопасность — всё это «под капотом», чтобы вы как пользователь просто открывали приложение и находили нужное быстрее и удобнее.
🎯 Реализовать эту историю нам помогли партнёры из Core 24/7 — надёжная команда, которая глубоко понимает задачи стартапов и умеет строить работающие решения для устойчивого роста.
👉 Подробности и подход, который мы использовали — в кейсе
#Aurma #маркетплейсаптек #инфраструктура #стартап #масштабирование #технологиивбизнесе #devops #цифроваяфармация #kubernetes
🔥7😎6❤5👍5👾2
Недавно стало известно, что компания Elastic приобрела агрегатор событий из систем мониторинга Keep. За этим определенно стоит что-то большое, чем простое поглощение. Интересно, как Elastic интегрирует этот инструмент в свои продукты?
На этом фоне предлагаем вспомнить про Grafana OnCall, который славился красивыми алертами в Slack и других мессенджерах. Его OSS-версию закрыли, сделав платной частью коммерческих продуктов Grafana. Сам проект Grafana OnCall OSS переходит в режим только для чтения и обслуживания. Полное архивирование запланировано на 24 марта 2026 года. Код останется открытым под лицензией AGPLv3, но новых функций ждать не стоит — только критические исправления и патчи безопасности.
И теперь судьба Keep вызывает вопросы: не повторит ли он путь OnCall, став платным внутри экосистемы Elastic?
Похоже, крупные игроки вроде Elastic и Grafana всё чаще монетизируют свои проекты, закрывая или ограничивая бесплатные OSS-версии. Keep, возможно, ждёт аналогичный путь — от бесплатного агрегатора к платной интеграции в Elastic Stack. Это тренд: компании усиливают коммерческие продукты, жертвуя открытой частью.
Нам остаётся наблюдать, тестировать и адаптироваться. А что думаете вы? Делитесь в комментариях! 👇
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥5😎2👾2
beetech conf — это ежегодная IT-конференция для всех, кто двигает IT и технологии вперёд.
В этом году QazCode, Beeline Казахстан и DAR Tech подготовили насыщенную программу:
Стрим AI & Beyond
Стрим General
разработки к экспорту казахстанского кода
И многие другие эксперты.
👉 Посмотреть программу и купить билеты
#партнерский_пост
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤2🔥2😎2👾2
Судя по вашим реакциям, вам понравились постмортемы инцидентов. Публикуем новый — на этот раз от Spotify.
16 апреля 2025 года в Spotify произошёл масштабный сбой, затронувший пользователей по всему миру. Команда сервиса рассказывает, что произошло и какие меры предприняли, чтобы избежать подобных ситуаций в будущем.
Далее со слов команды Spotify:
«Мы используем Envoy Proxy для периметровых сетевых систем. Периметр — это первый уровень ПО, который принимает трафик и распределяет его по другим сервисам. Для этого мы используем облачные регионы.
Чтобы расширить возможности Envoy, мы создаем кастомные фильтры. Например, фильтр для ограничения скорости (rate limiting).
В день инцидента мы изменили порядок применения фильтров Envoy. Это изменение посчитали низкорисковым, поэтому применили его сразу везде. Однако случился баг в одном из фильтров, что привело к аварийному завершению работы Envoy. Этот краш затронул все экземпляры Envoy одновременно.
Мгновенный перезапуск экземпляров Envoy и повторные попытки на стороне клиентских приложений создали всплеск нагрузки на периметр.
Этот внезапный рост трафика указал на ошибку в конфигурации: максимальный
heap size Envoy был установлен выше допустимого лимита памяти в Kubernetes. Из-за этого новые экземпляры Envoy при запуске получали огромный объём трафика, превышали лимит памяти Kubernetes, и Kubernetes автоматически их отключал. Этот цикл повторялся.Для устранения сбоя мы увеличили общую ёмкость периметровых серверов, что позволило снизить потребление памяти Envoy ниже лимитов Kubernetes и остановить бесконечный цикл перезапусков.
Вот что мы делаем для улучшения наших систем и предотвращения подобных инцидентов:
— Исправили баг, из-за которого Envoy аварийно завершал работу.
— Устранили несоответствие между размером кучи Envoy и лимитами памяти Kubernetes.
— Улучшим процесс внедрения изменений конфигурации на периметре.
— Усовершенствуем мониторинг, чтобы быстрее обнаруживать подобные проблемы»
Что думаете, коллеги?
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15❤6🔥6⚡5
— Наблюдаемость как код: версионируйте и автоматизируйте дашборды с помощью новых инструментов и шаблонов.
— Динамические дашборды: упрощённая навигация с вкладками и условным отображением панелей.
— Улучшенные таблицы: обработка 40 000+ строк с ростом производительности CPU на 97,8% благодаря react-data-grid.
— SQL-выражения: объединяйте данные из Loki, MySQL, PostgreSQL и других источников.
— Grafana Alerting: упрощён импорт правил оповещений из Prometheus и Loki.
— Drilldown в GA: переход между дашбордами стал стабильной функцией.
Kubernetes Policy Working Group представила проект OpenReports — единый стандарт для отчётов операторов (Trivy, Kyverno и др.). Новый API Reference решает проблемы централизованной видимости, анализа и автоматизации аудита.
Казахстанский стартап Finflow помогает малому и среднему бизнесу управлять финансами. AI заменяет бухгалтера, строит прогнозы и бюджеты. Проект уже привлёк $80 000 инвестиций при выручке $35 000.
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍4😎3❤2
Forwarded from DevOpsDays Tashkent
Speaker #8 at DevOpsDays Tashkent 2025 - Arman Nurgaliyev
📍Almaty, Kazakhstan
💼 Solutions Architect @ Yandex Cloud
10 years in IT, journey from system administrator to cloud architect. Once wanted to pursue security, but a single task in Azure changed everything: since then has been working exclusively with clouds. Currently an AWS Community Builder in the Serverless domain.
What will the talk be about?
🔁 DRY Terraform - how to reuse code without turning infrastructure into chaos. Simple techniques that save a DevOps engineer's time and sanity.
Who is this for?
For beginner and intermediate DevOps specialists who want to write cleaner, faster, and smarter code.
"Community and supporting young professionals are important to me. After all, DevOps is not just about technology, but also about people."
📍 See you on May 24 at Digital.uz
🔗 devopsdays.uz
#DevOpsDays #DevOpsTashkent #Terraform #YandexCloud #SpeakerIntro #DevOpsCommunity
@devopsdaysuz
📍Almaty, Kazakhstan
💼 Solutions Architect @ Yandex Cloud
10 years in IT, journey from system administrator to cloud architect. Once wanted to pursue security, but a single task in Azure changed everything: since then has been working exclusively with clouds. Currently an AWS Community Builder in the Serverless domain.
What will the talk be about?
🔁 DRY Terraform - how to reuse code without turning infrastructure into chaos. Simple techniques that save a DevOps engineer's time and sanity.
Who is this for?
For beginner and intermediate DevOps specialists who want to write cleaner, faster, and smarter code.
"Community and supporting young professionals are important to me. After all, DevOps is not just about technology, but also about people."
📍 See you on May 24 at Digital.uz
🔗 devopsdays.uz
#DevOpsDays #DevOpsTashkent #Terraform #YandexCloud #SpeakerIntro #DevOpsCommunity
@devopsdaysuz
👍8🔥8❤6👾2
По умолчанию контейнеры в Kubernetes наследуют определённый набор возможностей (
capabilities) — кучу привилегий словно с root-доступом.Это называется
Default Capabilities, и вот что в них есть:— Разрешить менять владельцев файлов (
cap_chown).— Игнорировать права доступа к файлам (
cap_dac_override).— Привязываться к портам (<1024,
cap_net_bind_service).— И даже писать в журнал ядра (
cap_audit_write) или создавать файлы (cap_mknod)Всего — 14 привилегий, которые могут выйти боком.
Чтобы избежать рисков, добавьте в настройки workloads:
securityContext:
capabilities:
drop:
- ALL
Это выключает все лишние привилегии.
С инфраструктурными сервисами принцип тот же — давайте как можно меньше привилегий.
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤5🔥4😎2
20 мая в 14:00 (по времени Алматы)
Спикер: архитектор Yandex Cloud — Арман Нургалиев.
Вебинар будет полезен архитекторам, разработчикам, DevOps-специалистам, продакт-менеджерам, администраторам систем виртуализации и руководителям, отвечающим за технологии и инфраструктуру.
На конкретных примерах разберём:
🔵 Как быстро и безопасно настроить VPN через маркетплейс Yandex Cloud
🔵 Первые шаги в Terraform — как автоматизировать инфраструктуру и сэкономить время команды
🔵 Миграция с Hystax — безболезненный переезд в облако без простоев и потерь данных
🔵 Применение локализованного SpeechKit в Казахстане: доступность, сценарии и примеры интеграций
🔵 Как закрыть базовые потребности инфраструктуры с помощью готовых сервисов из маркетплейса
Также ответят на вопросы участников.
👉 Регистрируйтесь здесь
#партнерский_пост
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍8❤5🔥5👎1
Предлагаем 3 детальных доклада, которые помогут обеспечить надежную инфраструктуру, мониторинг и грамотный выбор инструментов.
➖ Презентация от Postgres Professional — проект загрузки петабайта данных в распределённую базу данных PostgreSQL с использованием Shardman.
➖ Презентация Павла Конотопова от Postgres Professional — про создание отказоустойчивого кластера PostgreSQL и минимизацию ошибок при его настройке.
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍5🔥5👾2
Если хотите протестировать и внедрить свои технологии в реальную сферу, у вас есть возможность поработать с лидерами транспортной отрасли.
TTC Ventures ищут решения в сферах:
Что вы получите:
👉 Подайте заявку на участие
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍6🔥4🎉3🤡1
Инженерные команды часто сталкиваются с типичными проблемами: надежность, масштабируемость и обслуживание.
Предлагаем краткий разбор основных шаблонов проектирования Kubernetes, которые должен знать каждый разработчик и архитектор cloud native приложений — от проб состояния и боковых вагонов до операторов и шаблона одиночного сервиса.
👉 Читайте в новой статье
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡6👍4❤3😎2
Forwarded from DevOpsDays Tashkent
Speaker #12 at DevOpsDays Tashkent 2025 - Viktor Khomenko
📍Almaty, Kazakhstan
💼 Enterprise Architect @ AITAS KZ
Nearly 20 years in IT. Once, his team pioneered production deployment automation in the company, unaware it was already termed DevOps. Today, he leads architecture and guides others on their journey from engineer to manager.
What's the talk about?
🧭 How to enhance soft skills through an engineering approach to grow into an architect, CTO, or CIO role.
There will also be a technical segment on business modeling language. All content is tried and tested through practice and experience.
Who will benefit?
Young engineers contemplating their future, who aim not just to "climb the career ladder," but to build a purposeful career and make an impact.
"Good managers aren't appointed. They're nurtured. And it's better to start this process early."
📍 May 24, Digital.uz
🔗 devopsdays.uz
#DevOpsDays #DevOpsTashkent #SpeakerIntro #CareerInTech #SoftSkillsForEngineers #AITASKZ
📍Almaty, Kazakhstan
💼 Enterprise Architect @ AITAS KZ
Nearly 20 years in IT. Once, his team pioneered production deployment automation in the company, unaware it was already termed DevOps. Today, he leads architecture and guides others on their journey from engineer to manager.
What's the talk about?
🧭 How to enhance soft skills through an engineering approach to grow into an architect, CTO, or CIO role.
There will also be a technical segment on business modeling language. All content is tried and tested through practice and experience.
Who will benefit?
Young engineers contemplating their future, who aim not just to "climb the career ladder," but to build a purposeful career and make an impact.
"Good managers aren't appointed. They're nurtured. And it's better to start this process early."
📍 May 24, Digital.uz
🔗 devopsdays.uz
#DevOpsDays #DevOpsTashkent #SpeakerIntro #CareerInTech #SoftSkillsForEngineers #AITASKZ
👍6🔥4❤2🤡2
k8s-to-mermaid — проект, который анализирует YAML-файлы Kubernetes и генерирует диаграммы классов в формате Mermaid. Они визуализируют ресурсы Kubernetes и их взаимосвязи в кластере.
Поддерживает обработку различных ресурсов:
— Deployments
— StatefulSets
— DaemonSets
— Services
— Ingresses
— ConfigMaps
— Secrets
— PersistentVolumeClaims
— NetworkPolicies
— HorizontalPodAutoscalers
Особенно полезно для анализа конфигураций и документирования инфраструктуры.
Пользуйтесь и делитесь с коллегами
@DevOpsKaz
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥4❤3😎2
Приглашаем на конференцию о новейших технологиях построения цифровых сетей в Казахстане. Только актуальные вопросы и перспективы развития телекома.
12 спикеров расскажут про:
Спутники для обеспечения связи в отдаленных местах, их роль в чрезвычайных ситуациях
Стратегические узлы связи и точки обмена трафиком, а также связывающие их линии связи
Роль «оптики» в построении современных сетей, оптоволоконные новинки
Оконечные узлы и линии связи, современные технологии и оборудование
Построение высокоскоростных, надежных и энергоэффективных сетей для различных сценариев использования
Применение IoT-устройств в различных областях, безопасность интернета вещей
Роль искусственного интеллекта в построении, оптимизации, управлении, мониторинге и защите телеком-инфраструктуры
Угрозы и атаки на телекоммуникационные сети, методы обнаружения и предотвращения атак
👉 Регистрируйтесь здесь
#партнерский_пост
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤2🔥2😎2