DevOps&SRE Library
19K subscribers
426 photos
2 videos
2 files
5.16K links
Библиотека статей по теме DevOps и SRE.

Реклама: @ostinostin
Контент: @mxssl

РКН: https://www.gosuslugi.ru/snet/67704b536aa9672b963777b3
Download Telegram
Vault: secure Kubernetes authentication with hashicorp Vault OIDC

Explains how to use Vault as an OIDC provider to replace static kubeconfig credentials with short-lived tokens.


https://phuchoang.sbs/posts/gitops-kubernetes-oidc-vault
Security Inside Kubernetes: Admission & Runtime Guardrails with Kyverno and KubeArmor

Covers layered Kubernetes security by combining Kyverno admission policies with KubeArmor runtime enforcement.


https://medium.com/globant/security-inside-kubernetes-admission-runtime-guardrails-with-kyverno-and-kubearmor-6d2f97264cbc
Оптимизация СУБД в облаке: ускоряем запросы и стабилизируем прод

Нет ничего более постоянного, чем что-то временное, поэтому проекты часто обрастают костыльными решениями, которые потом сложно переписывать.

24 марта, 17:00 (мск) мы проведем вебинар, где на практике разберем, как правильно создавать запросы в разных СУБД, как работать с их встроенными инструментами и как нужно интерпретировать метрики.

Почему стоит прийти на вебинар
- Посмотрим, как и почему происходит деградация производительности после релиза
- Попрактикуемся в оптимизации запросов MySQL и PostgreSQL, а также посмотрим на универсальные решения
- Разберем типовые ошибки и антипаттерны: как избегать использования костылей при снятии блокировок
- Соберем чек‑лист качественной оптимизации СУБД

До встречи в эфире! Будет много практики и прикладных решений.

Зарегистрироваться
Crust-Gather - kubectl Cluster Snapshot Plugin

Open-source kubectl plugin for collecting a structured cluster snapshot for debugging and analysis.


https://github.com/crust-gather/crust-gather
Kogaro - Kubernetes Configuration Hygiene Agent

Agent project focused on improving Kubernetes configuration hygiene and reducing misconfiguration risk.


https://github.com/topiaruss/kogaro
llm-d: SOTA inference performance

Project targeting high-performance large language model inference workloads.


https://github.com/llm-d/llm-d
Kthena: Enterprise LLM serving

Enterprise-oriented platform for serving and operating LLM workloads on Kubernetes.


https://github.com/volcano-sh/kthena
HyperDrive — GitOps-платформа для инфраструктуры разработки

Основная идея:
описываете целевую конфигурацию инфраструктуры через код → система приводит ее в желаемое состояние → получаете self-service и автоматическое создание нужных сред (четвергов)

То есть вместо ручной настройки:
— шаблоны окружений
— воспроизводимые среды
— все состояние в Git

24 марта будет демо архитектуры платформы.
Регистрация.

Реклама. ООО "Орион", ИНН: ИНН 9704113582, erid: 2VtzqwfS4VK
Easykube: Local Kubernetes development

Tooling aimed at simplifying local Kubernetes development environments.


https://github.com/torloejborg/easykube
Проверяем навыки DevOps-инженеров. Проверим ваши?

Привет, это KTS. Мы создаем цифровые продукты и ведём блог на Хабре, где делимся практикой из проектов. Блогу исполнилось 5 лет, и мы решили отметить эту дату челленджем для девопсов. Победителям дарим футболки с нашим фирменным принтом — Котзиллой (как Годзилла, только кот).

В чем суть головоломки: вы получите доступ к тестовому стенду с Kubernetes-кластером, ArgoCD и GitLab с Helm-чартом. В ArgoCD добавлено приложение, но оно не деплоится.

Ваша задача — разобраться, что пошло не так, исправить конфигурацию и довести деплой до зелёного статуса.

Десять самых быстрых участников получат футболки. Прям СДЭКом отправим 📦

Начать можно по ссылке.

Итоги через неделю, 26 марта в 19:00.

Реклама. ООО "Студия КТС", ИНН: 7733257480, erid: 2VtzqvG6W9b
Guardon: Kubernetes security extension

Security-focused extension project for strengthening Kubernetes environments.


https://github.com/guardon-dev/guardon
difftastic

a structural diff that understands syntax


http://github.com/Wilfred/difftastic
We Cut Our Kubernetes Pods by 60% and Doubled Traffic Capacity

This case study explains how JVM tuning, a smaller Hikari pool, and faster HPA scale-up doubled traffic capacity while reducing baseline pods.


https://medium.com/@feridquluzade2002/we-cut-our-kubernetes-pods-by-60-and-doubled-traffic-capacity-b1cfb6850fca
Hidden Kubernetes Bad Practices Learned the Hard Way During Incidents

This article distills incident-driven lessons on troubleshooting, configuration mistakes, and operational habits that make Kubernetes outages worse.


https://hackernoon.com/hidden-kubernetes-bad-practices-learned-the-hard-way-during-incidents
From Chaos to 99.9% Uptime: Rebuilding a Kubernetes Platform for GPU Workloads

This article covers rebuilding a Kubernetes platform for GPU workloads to reach 99.9% uptime after operational instability.


https://medium.com/@mateenali66/from-chaos-to-99-9-uptime-rebuilding-a-kubernetes-platform-for-gpu-workloads-4fadb1067a0b
Benchmarking Kubernetes Log Collectors: vlagent, Vector, Fluent Bit, OpenTelemetry Collector, and more

At VictoriaMetrics, we built vlagent as a high-performance log collector for VictoriaLogs. To validate its performance and correctness under a real production-like load, we developed a benchmark suite and ran it against 8 popular log collectors. This post covers the methodology, throughput results, resource usage, and delivery correctness.


https://victoriametrics.com/blog/log-collectors-benchmark-2026/index.html
Making and scaling a game server in Kubernetes using agones

This tutorial walks through building a Go game server with Agones, matchmaking, Fleet allocation, and autoscaling on Kubernetes.


https://noe-t.dev/posts/making-and-scaling-a-game-server-in-k8s-using-agones
PostgreSQL migration with CloudNativePG Logical Replication on Kubernetes - Zero-Downtime

This tutorial shows how to migrate PostgreSQL to CloudNativePG on Kubernetes with logical replication and no downtime.


https://kndoni.medium.com/postgresql-migration-with-cloudnativepg-logical-replication-on-kubernetes-zero-downtime-aef1c33a3a53
Gateway API setup on GKE with NGINX Gateway Fabric

This tutorial shows how to deploy NGINX Gateway Fabric on GKE with Terraform, split traffic paths, and automate TLS certificates.


https://medium.com/@henrikamirbekyan/gateway-api-setup-on-gke-with-nginx-gateway-fabric-1b0d0ec3bbf3
Как запустить микросервисы в Managed Kubernetes

Микросервисное приложение мало просто задеплоить — нужны правила запуска, обновлений, масштабирования и изоляции. Именно они делают эксплуатацию предсказуемой, а инфраструктуру — готовой к росту нагрузки.


На вебинаре 26 марта в 11:00 эксперты Cloud.ru разберут, как превратить Managed Kubernetes в удобную и надежную платформу для работы микросервисов.

В программе:
1⃣ разберете, в каких проектах микросервисы действительно нужны и как быстро запустить готовое масштабируемое решение в облаке без лишних сложностей;

2⃣ рассмотрите базовую структуру Kubernetes для микросервисов: что потребуется сразу, а что можно отложить;

3⃣обсудите, как организовать деплой, обновления и откаты, чтобы релизы были управляемыми;

4⃣ настроите масштабирование с помощью нативных инструментов Kubernetes;

5⃣ свяжете платформу с реестром артефактов;

6⃣ узнаете, как следить за метриками и логами приложения.


👉Зарегистрироваться👈
Please open Telegram to view this post
VIEW IN TELEGRAM