DevOps&SRE Library
18.4K subscribers
461 photos
3 videos
2 files
5.01K links
Библиотека статей по теме DevOps и SRE.

Реклама: @ostinostin
Контент: @mxssl

РКН: https://www.gosuslugi.ru/snet/67704b536aa9672b963777b3
Download Telegram
Victorialogs vs Loki - Benchmarking Results

TL;DR – After side‑by‑side testing on a 500 GB/7‑day workload, VictoriaLogs cut query latencies by 94 %, shrank storage by ≈40 %, and used < 50 % of the CPU & RAM we previously allocated to Loki. This post explains why we switched.


https://truefoundry.com/blog/victorialogs-vs-loki
What I Really Mean When I Say “Good Communication” in Incident Response

“Good communication” is one of those phrases everyone nods along to — until the incident hits, and suddenly comms unravel before your eyes.

So here’s what I actually mean when I say communication matters.


https://uptimelabs.io/articles/good-communication-in-incident-response
The JVM Pause That Wasn't: A War Story

A high-throughput Java service was stalling. The culprit? Stop-the-World GC pauses were blocked by synchronous log writes to a busy disk.


https://dzone.com/articles/the-jvm-pause-that-wasnt-a-war-story
Kubernetes Informers are so easy... to misuse!

https://render.com/blog/kubernetes-informers
Breaking Boundaries - Kubernetes Namespaces and multi-tenancy

https://blog.amberwolf.com/blog/2025/september/kubernetes_namespace_boundaries
Бесплатный вебинар: «GitOps + Flux — ваш путь к автоматизированному деплою в Kubernetes»!

Вы хотите развернуть приложение в Kubernetes без тонны ручных команд и нервов? Мечтаете о системе, где код сам «доставляется» в прод по принципу «закоммитил — заработало»?

Приглашаем вас на открытый урок в рамках курса «Инфраструктурная платформа на основе Kubernetes , где разберём»:
- как перестать вручную деплоить приложения;
- как добиться стабильного состояния кластера;
- как сделать процессы прозрачными и контролируемыми.

🗓 Когда: 23.12, в 20-00
Для кого: DevOps‑инженеры, разработчики, администраторы Kubernetes, все, кто хочет автоматизировать деплой.

На уроке вы узнаете:
💚 Что такое GitOps и почему это новый стандарт работы с Kubernetes.
💚 Как Flux автоматизирует синхронизацию кластера с Git‑репозиторием.
💚Практические примеры настройки Flux для реальных сценариев.
💚Как избежать типичных ошибок при внедрении GitOps.
💚Какие преимущества даёт подход «конфигурация как код».

После урока вы сможете:
- настроить базовый пайплайн GitOps с Flux;
- понять, как интегрировать Flux в существующую инфраструктуру;
- оценить, подходит ли GitOps для вашего проекта.

Регистрирация: https://vk.cc/cSeanl

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqvZGKJ2
Please open Telegram to view this post
VIEW IN TELEGRAM
pvc-autoresizer

pvc-autoresizer resizes PersistentVolumeClaims (PVCs) when the free amount of storage is below the threshold.

It queries the volume usage metrics from Prometheus that collects metrics from kubelet.


https://github.com/topolvm/pvc-autoresizer
🔥 OTUS запускает курс «DevOps-инженер: практики и инструменты» — тестирование уже открыто!

Готовы к настоящему DevOps в продакшене + максимальная скидка? Пройдите бесплатный тест и зафиксируйте спеццену и место в группе!

За 5 месяцев вы получите:
- Боевой стек 2025–2026: Docker → K8s → Terraform → Ansible → GitLab CI/CD → Prometheus + Grafana
- Бесплатный Yandex Cloud + большой финальный проект с защитой
- Демки в прямом эфире + код-ревью от менторов из Сбера, IBM, Касперского
- Только то, что реально юзают в проде

Научитесь:
- Делать CI/CD, который не падает в 3 ночи
- Управлять инфраструктурой как кодом
- Запускать отказоустойчивый Kubernetes
- Настраивать полный мониторинг и спать спокойно

Старт: 29 января 2026 г.

👉 Пройти тест и забронировать место: https://vk.cc/cSqJCH

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzquygXCE
Why I Use Terragrunt Over Terraform/OpenTofu in 2025

Terragrunt vs Terraform: Why I chose Terragrunt to eliminate code duplication, automate state management, orchestrate deployments, and follow pattern-level reuse


https://www.axelmendoza.com/posts/terraform-vs-terragrunt
Introducing Observable Load Testing = Locust + OpenTelemetry!

https://medium.com/locust-cloud/observable-load-testing-locust-opentelemetry-c5fced129d84
Patterns for Deploying OTel Collector at Scale

As applications grow, the question quickly shifts from what OTel can do to how we can deploy it effectively at scale. In this post, we’ll explore some deployment patterns for the OTel Collector!


https://newsletter.signoz.io/p/patterns-for-deploying-otel-collector
Better observability, deeper insights: OpenSearch’s new Piped Processing Language capabilities

https://opensearch.org/blog/better-observability-deeper-insights-opensearchs-new-piped-processing-language-capabilities