KazDevOps
5.38K subscribers
1.3K photos
27 videos
19 files
1.3K links
Канал о DevOps во всех проявлениях: K8s, CI/CD, AppSec, AI/ML, Cloud, Linux
Поможем с DevOps: https://core247.kz/
По рекламе @UlKonovalova
Download Telegram
🔥 Как упростить работу с PostgreSQL в Kubernetes. Разбираем PGO от Crunchy Data

Если вы управляете базами данных в Kubernetes, то знаете, сколько времени уходит на настройку, мониторинг и обновления. В статье на Medium автор подробно рассказывает про PGO (Postgres Operator) от Crunchy Data — инструмент, который автоматизирует работу с PostgreSQL.

👉 Читать статью полностью и узнать, чем лучше Zalando Operator.

⚪️ Что такое PGO

Это оператор Kubernetes, который берёт на себя рутину: от развертывания PostgreSQL-кластеров до настройки высокой доступности (HA) и резервного копирования. Работает с Patroni, чтобы кластеры оставались на плаву даже при сбоях.

⚪️Чем поможет нам

Автоматизация: разворачивайте кластеры, настраивайте реплики и бэкапы (pgbackrest) без ручной работы.
Оптимизация: можно сделать мощный Primary и лёгкие реплики, чтобы не тратить лишние ресурсы.
Мониторинг: встроенный pgmonitor (лучше postgres_exporter) даёт видимость состояния кластера. Интеграция с Grafana также доступна.
Безопасность: контейнеры без root, суперпользователь ограничен — меньше рисков утечек данных.
GitOps: PGO дружит с Helm и Kustomize.

❗️ Обновление мажорных версий PostgreSQL сложное — нужно использовать CRD и перезапускать кластер. Поэтому планируйте заранее.

PGO — отличный выбор, если нужна надёжная PostgreSQL в Kubernetes с минимумом ручного труда. Особенно для e-commerce или финтеха, где важны HA и отказоустойчивость.


@DevOpsKaz 😛
Please open Telegram to view this post
VIEW IN TELEGRAM
👍43🔥3😎2👾2
Forwarded from Drim Dev
Ticketon опубликовал постмортем по следам сбоя 11 апреля. Я провёл его анализ и постарался извлечь больше технических деталей вместе с рекомендациями по предотвращению таких проблем в будущем.

https://teletype.in/@drimdev/ticketon-postmortem-2025-analysis
🔥14👍9😎4👾2
👀 No-as-a-Service (NaaS) — забавный API, который выдаёт случайные причины для отказа

NaaS предлагает креативные или реалистичные поводы сказать «нет» — будь то для шутки, симуляции отказа или даже интеграции в проекты.

Случайный текст отказа выбирается из базы с более чем 1000 универсальных причин — от серьёзных («Я занят, у меня дедлайн») до абсурдных («Я занят, у меня встреча с диваном, и он не принимает отказов»).

Как работает:

⚪️ API написан на Node.js. Вся база причин хранится в файле reasons.json
⚪️ После GET-запроса на /no API возвращает JSON с одной случайной причиной
⚪️ Есть лимит в 120 запросов в минуту на IP, чтобы избежать перегрузки (библиотека express-rate-limit)
⚪️ API можно встроить в чат-ботов или системы автоматизации, чтобы генерировать отказы в реальном времени
⚪️Проект под лицензией MIT, можно свободно использовать и модифицировать

Теперь вам точно есть, чем заняться в выходные 😜😂 Пробуйте и делитесь с коллегами 🫡

@DevOpsKaz 😛
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣6👍5🔥4😎3
🔥DataBoom Birthday 2025 пройдёт 28 июня в Алматы!

Ежегодная конференция объединит всех, кто интересуется аналитикой, трендами и инновациями уже в 6 раз.

🐤 Early Bird: стоимость билета до 15 мая — 2500-3500 тенге. Для VIP: 45 000 тенге.

В этом году на DataBoom Birthday:

• выступления спикеров из крупных IT-компаний
• ярмарка вакансий с ТОП-работодателями Казахстана
• возможность лично пообщаться с топовыми экспертами рынка;
• нетворкинг, неповторимая атмосфера, активности и розыгрыш.

👉 Покупайте билет и узнайте больше

#партнерский_пост

@DevOpsKaz 😛
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥53👎2🤣2
Forwarded from Aurteam
Как мы подготовили Aurma к росту: про инфраструктуру на Yandex Cloud, которую не видно, но которая важна

Когда ты создаёшь онлайн-маркетплейс аптек, где важно всё — от скорости работы до сохранности данных и стабильности сервиса — тебе нужна основа, на которую можно опереться.

В Aurma мы изначально поставили перед собой амбициозную цель: быть надёжным, доступным и удобным сервисом для миллионов пользователей по всей стране. Чтобы масштабироваться без потерь и сбоев, мы подошли к вопросу инфраструктуры как к стратегическому ресурсу.

📌 Мы выстроили систему, которая:

— выдерживает рост трафика и нагрузки
— не боится сбоев и отказов
— не требует огромной команды поддержки
— позволяет быстро обновлять и выкатывать новые фичи

Технологически это: Kubernetes, CI/CD, репликация БД, отказоустойчивость, автоматизация через Terraform и многое другое. Инфраструктура развёрнута в Yandex Cloud — надёжной и гибкой среде, где удобно управлять ресурсами и масштабировать нагрузку.

Оркестрация, надёжность, безопасность — всё это «под капотом», чтобы вы как пользователь просто открывали приложение и находили нужное быстрее и удобнее.

🎯 Реализовать эту историю нам помогли партнёры из Core 24/7 — надёжная команда, которая глубоко понимает задачи стартапов и умеет строить работающие решения для устойчивого роста.

👉 Подробности и подход, который мы использовали — в кейсе

#Aurma #маркетплейсаптек #инфраструктура #стартап #масштабирование #технологиивбизнесе #devops #цифроваяфармация #kubernetes
🔥7😎65👍5👾2
👀 Что происходит с инструментами мониторинга: Keep и Grafana OnCall

Недавно стало известно, что компания Elastic приобрела агрегатор событий из систем мониторинга Keep. За этим определенно стоит что-то большое, чем простое поглощение. Интересно, как Elastic интегрирует этот инструмент в свои продукты?

На этом фоне предлагаем вспомнить про Grafana OnCall, который славился красивыми алертами в Slack и других мессенджерах. Его OSS-версию закрыли, сделав платной частью коммерческих продуктов Grafana. Сам проект Grafana OnCall OSS переходит в режим только для чтения и обслуживания. Полное архивирование запланировано на 24 марта 2026 года. Код останется открытым под лицензией AGPLv3, но новых функций ждать не стоит — только критические исправления и патчи безопасности.

И теперь судьба Keep вызывает вопросы: не повторит ли он путь OnCall, став платным внутри экосистемы Elastic?

Похоже, крупные игроки вроде Elastic и Grafana всё чаще монетизируют свои проекты, закрывая или ограничивая бесплатные OSS-версии. Keep, возможно, ждёт аналогичный путь — от бесплатного агрегатора к платной интеграции в Elastic Stack. Это тренд: компании усиливают коммерческие продукты, жертвуя открытой частью.


Нам остаётся наблюдать, тестировать и адаптироваться. А что думаете вы? Делитесь в комментариях! 👇

@DevOpsKaz 😛
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥5😎2👾2
🔥 Программа стримов beetech conf 31 мая в Алматы

beetech conf — это ежегодная IT-конференция для всех, кто двигает IT и технологии вперёд.

В этом году QazCode, Beeline Казахстан и DAR Tech подготовили насыщенную программу:

⚪️ Актуальные темы в сферах IT и AI
⚪️ Спикеры из казахстанских и международных компаний
⚪️ Квартирники, практические воркшопы и консультации с экспертами

Стрим AI & Beyond

⚪️ Елдан Абдрашим, Apple. AI/ML в Big Tech: архитектура, лучшие практики и реальные фейлы
⚪️ Абылайхан Турласов, Zencoder. LLM Антипсихотики или Guideddecoding
⚪️ Осип Чин-Го-Пин, Yandex Qazaqstan. Яндекс.Поиск. Антифрод. Роботы

Стрим General

⚪️ Олжас Каиржанов, Kolesa Group. ML в монетизации: как сделать платные услуги эффективными, чтобы их покупали
⚪️ Алексей Шаравар, СЕО QazCode. Как мы перешли от внутренней
разработки к экспорту казахстанского кода
⚪️ Антон Зотин, Orhanizational Coach, Trainer, Facilitator agilesm.com Delivery Hero (Mercedes-Benz, Raiffeisen Bank, Roche, Semrush). Нафига придумали Agile?

И многие другие эксперты.

👉 Посмотреть программу и купить билеты

❗️ Билетов всё меньше. Успейте купить

#партнерский_пост
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🔥2😎2👾2
👀 Отчёт об инциденте: сбой Spotify

Судя по вашим реакциям, вам понравились постмортемы инцидентов. Публикуем новый — на этот раз от Spotify.

16 апреля 2025 года в Spotify произошёл масштабный сбой, затронувший пользователей по всему миру. Команда сервиса рассказывает, что произошло и какие меры предприняли, чтобы избежать подобных ситуаций в будущем.


Далее со слов команды Spotify:

«Мы используем Envoy Proxy для периметровых сетевых систем. Периметр — это первый уровень ПО, который принимает трафик и распределяет его по другим сервисам. Для этого мы используем облачные регионы.

Чтобы расширить возможности Envoy, мы создаем кастомные фильтры. Например, фильтр для ограничения скорости (rate limiting).

В день инцидента мы изменили порядок применения фильтров Envoy. Это изменение посчитали низкорисковым, поэтому применили его сразу везде. Однако случился баг в одном из фильтров, что привело к аварийному завершению работы Envoy. Этот краш затронул все экземпляры Envoy одновременно.

Мгновенный перезапуск экземпляров Envoy и повторные попытки на стороне клиентских приложений создали всплеск нагрузки на периметр.

Этот внезапный рост трафика указал на ошибку в конфигурации: максимальный heap size Envoy был установлен выше допустимого лимита памяти в Kubernetes. Из-за этого новые экземпляры Envoy при запуске получали огромный объём трафика, превышали лимит памяти Kubernetes, и Kubernetes автоматически их отключал. Этот цикл повторялся.

Для устранения сбоя мы увеличили общую ёмкость периметровых серверов, что позволило снизить потребление памяти Envoy ниже лимитов Kubernetes и остановить бесконечный цикл перезапусков.

Вот что мы делаем для улучшения наших систем и предотвращения подобных инцидентов:

— Исправили баг, из-за которого Envoy аварийно завершал работу.
— Устранили несоответствие между размером кучи Envoy и лимитами памяти Kubernetes.
— Улучшим процесс внедрения изменений конфигурации на периметре.
— Усовершенствуем мониторинг, чтобы быстрее обнаруживать подобные проблемы»

Что думаете, коллеги? 🤔

@DevOpsKaz 😛
Please open Telegram to view this post
VIEW IN TELEGRAM
👍156🔥65
🔥 Новости мира DevOps и не только

⚪️ Вышла новая версия Grafana 12 с крутыми обновлениями:

— Наблюдаемость как код: версионируйте и автоматизируйте дашборды с помощью новых инструментов и шаблонов.
— Динамические дашборды: упрощённая навигация с вкладками и условным отображением панелей.
— Улучшенные таблицы: обработка 40 000+ строк с ростом производительности CPU на 97,8% благодаря react-data-grid.
— SQL-выражения: объединяйте данные из Loki, MySQL, PostgreSQL и других источников.
— Grafana Alerting: упрощён импорт правил оповещений из Prometheus и Loki.
— Drilldown в GA: переход между дашбордами стал стабильной функцией.

⚪️ OpenReports: стандарт отчётов для Kubernetes

Kubernetes Policy Working Group представила проект OpenReports — единый стандарт для отчётов операторов (Trivy, Kyverno и др.). Новый API Reference решает проблемы централизованной видимости, анализа и автоматизации аудита.

⚪️ Finflow: AI для бизнеса в Казахстане

Казахстанский стартап Finflow помогает малому и среднему бизнесу управлять финансами. AI заменяет бухгалтера, строит прогнозы и бюджеты. Проект уже привлёк $80 000 инвестиций при выручке $35 000.

@DevOpsKaz 😛
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍4😎32
Forwarded from DevOpsDays Tashkent
Speaker #8 at DevOpsDays Tashkent 2025 - Arman Nurgaliyev

📍Almaty, Kazakhstan
💼 Solutions Architect @ Yandex Cloud

10 years in IT, journey from system administrator to cloud architect. Once wanted to pursue security, but a single task in Azure changed everything: since then has been working exclusively with clouds. Currently an AWS Community Builder in the Serverless domain.

What will the talk be about?

🔁 DRY Terraform - how to reuse code without turning infrastructure into chaos. Simple techniques that save a DevOps engineer's time and sanity.

Who is this for?

For beginner and intermediate DevOps specialists who want to write cleaner, faster, and smarter code.

"Community and supporting young professionals are important to me. After all, DevOps is not just about technology, but also about people."

📍 See you on May 24 at Digital.uz
🔗 devopsdays.uz

#DevOpsDays #DevOpsTashkent #Terraform #YandexCloud #SpeakerIntro #DevOpsCommunity

@devopsdaysuz
👍8🔥86👾2
🔥 Решение для 99% любых бизнес-микросервисов в Kubernetes

По умолчанию контейнеры в Kubernetes наследуют определённый набор возможностей (capabilities) — кучу привилегий словно с root-доступом.

Это называется Default Capabilities, и вот что в них есть:

— Разрешить менять владельцев файлов (cap_chown).
— Игнорировать права доступа к файлам (cap_dac_override).
— Привязываться к портам (<1024, cap_net_bind_service).
— И даже писать в журнал ядра (cap_audit_write) или создавать файлы (cap_mknod)

Всего — 14 привилегий, которые могут выйти боком.

Чтобы избежать рисков, добавьте в настройки workloads:

securityContext:
capabilities:
drop:
- ALL


Это выключает все лишние привилегии.

С инфраструктурными сервисами принцип тот же — давайте как можно меньше привилегий.

@DevOpsKaz 😛
Please open Telegram to view this post
VIEW IN TELEGRAM
👍65🔥4😎2
🔥 Приглашаем на бесплатный вебинар Yandex Cloud об эффективном запуске и масштабировании облачной инфраструктуры в Казахстане

20 мая в 14:00 (по времени Алматы)

Спикер: архитектор Yandex Cloud — Арман Нургалиев.

Вебинар будет полезен архитекторам, разработчикам, DevOps-специалистам, продакт-менеджерам, администраторам систем виртуализации и руководителям, отвечающим за технологии и инфраструктуру.

На конкретных примерах разберём:

🔵 Как быстро и безопасно настроить VPN через маркетплейс Yandex Cloud
🔵 Первые шаги в Terraform — как автоматизировать инфраструктуру и сэкономить время команды
🔵 Миграция с Hystax — безболезненный переезд в облако без простоев и потерь данных
🔵 Применение локализованного SpeechKit в Казахстане: доступность, сценарии и примеры интеграций
🔵 Как закрыть базовые потребности инфраструктуры с помощью готовых сервисов из маркетплейса

Также ответят на вопросы участников.

❗️ Участие бесплатное, но доступ только по подтверждённым приглашениям.

👉 Регистрируйтесь здесь

#партнерский_пост
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍85🔥5👎1
👀 Погружение в SRE: PostgreSQL, Kafka и Observability

Предлагаем 3 детальных доклада, которые помогут обеспечить надежную инфраструктуру, мониторинг и грамотный выбор инструментов.

Презентация от Postgres Professional — проект загрузки петабайта данных в распределённую базу данных PostgreSQL с использованием Shardman.

Презентация Павла Конотопова от Postgres Professional — про создание отказоустойчивого кластера PostgreSQL и минимизацию ошибок при его настройке.

Презентация Observability от Ozon tech посвящена Kafka в качестве основного инструмента для асинхронного взаимодействия, обработки данных и мультикаста.

@DevOpsKaz 😛
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍5🔥5👾2
🔥 Внедрите свои идеи в реальную инфраструктуру — прокачайте железную дорогу будущего вместе с КТЖ

Если хотите протестировать и внедрить свои технологии в реальную сферу, у вас есть возможность поработать с лидерами транспортной отрасли.

TTC Ventures ищут решения в сферах:

⚪️ Умные вокзалы
⚪️ Управление движением
⚪️ Цифровизация процессов
⚪️ Безопасность на путях

Что вы получите:

⚪️ Доступ к реальной инфраструктуре
⚪️ Пилот с КТЖ
⚪️ Менторство и экспертизу
⚪️ Шанс на инвестиции

👉 Подайте заявку на участие

@DevOpsKaz 😛
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍6🔥4🎉3🤡1
🔥 Основные шаблоны проектирования Kubernetes: создание надежных cloud native приложений

Инженерные команды часто сталкиваются с типичными проблемами: надежность, масштабируемость и обслуживание.

Предлагаем краткий разбор основных шаблонов проектирования Kubernetes, которые должен знать каждый разработчик и архитектор cloud native приложений — от проб состояния и боковых вагонов до операторов и шаблона одиночного сервиса.

👉
Читайте в новой статье

@DevOpsKaz 😛
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍43😎2
Forwarded from DevOpsDays Tashkent
Speaker #12 at DevOpsDays Tashkent 2025 - Viktor Khomenko

📍Almaty, Kazakhstan
💼 Enterprise Architect @ AITAS KZ

Nearly 20 years in IT. Once, his team pioneered production deployment automation in the company, unaware it was already termed DevOps. Today, he leads architecture and guides others on their journey from engineer to manager.

What's the talk about?

🧭 How to enhance soft skills through an engineering approach to grow into an architect, CTO, or CIO role.
There will also be a technical segment on business modeling language. All content is tried and tested through practice and experience.

Who will benefit?

Young engineers contemplating their future, who aim not just to "climb the career ladder," but to build a purposeful career and make an impact.

"Good managers aren't appointed. They're nurtured. And it's better to start this process early."

📍 May 24, Digital.uz
🔗 devopsdays.uz

#DevOpsDays #DevOpsTashkent #SpeakerIntro #CareerInTech #SoftSkillsForEngineers #AITASKZ
👍6🔥42🤡2
🔥 Визуализация связи ресурсов в Kubernetes

k8s-to-mermaid — проект, который анализирует YAML-файлы Kubernetes и генерирует диаграммы классов в формате Mermaid. Они визуализируют ресурсы Kubernetes и их взаимосвязи в кластере.

Поддерживает обработку различных ресурсов:

— Deployments
— StatefulSets
— DaemonSets
— Services
— Ingresses
— ConfigMaps
— Secrets
— PersistentVolumeClaims
— NetworkPolicies
— HorizontalPodAutoscalers

Особенно полезно для анализа конфигураций и документирования инфраструктуры.

Пользуйтесь и делитесь с коллегами 🫡

@DevOpsKaz 😛
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥43😎2
🔥 PROFIT Telecom Day — уже 23 мая в Алматы

Приглашаем на конференцию о новейших технологиях построения цифровых сетей в Казахстане. Только актуальные вопросы и перспективы развития телекома.

12 спикеров расскажут про:

⚪️ Спутниковая связь
Спутники для обеспечения связи в отдаленных местах, их роль в чрезвычайных ситуациях

⚪️ Магистральные каналы
Стратегические узлы связи и точки обмена трафиком, а также связывающие их линии связи

⚪️ Оптические сети
Роль «оптики» в построении современных сетей, оптоволоконные новинки

⚪️ Последняя миля
Оконечные узлы и линии связи, современные технологии и оборудование

⚪️ Сети 5G
Построение высокоскоростных, надежных и энергоэффективных сетей для различных сценариев использования

⚪️ Интернет вещей
Применение IoT-устройств в различных областях, безопасность интернета вещей

⚪️ Искусственный интеллект
Роль искусственного интеллекта в построении, оптимизации, управлении, мониторинге и защите телеком-инфраструктуры

⚪️ Кибербезопасность
Угрозы и атаки на телекоммуникационные сети, методы обнаружения и предотвращения атак

👉 Регистрируйтесь здесь

#партнерский_пост
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🔥2😎2