DevOps&SRE Library
19K subscribers
426 photos
2 videos
2 files
5.16K links
Библиотека статей по теме DevOps и SRE.

Реклама: @ostinostin
Контент: @mxssl

РКН: https://www.gosuslugi.ru/snet/67704b536aa9672b963777b3
Download Telegram
Kogaro - Kubernetes Configuration Hygiene Agent

Agent project focused on improving Kubernetes configuration hygiene and reducing misconfiguration risk.


https://github.com/topiaruss/kogaro
llm-d: SOTA inference performance

Project targeting high-performance large language model inference workloads.


https://github.com/llm-d/llm-d
Kthena: Enterprise LLM serving

Enterprise-oriented platform for serving and operating LLM workloads on Kubernetes.


https://github.com/volcano-sh/kthena
HyperDrive — GitOps-платформа для инфраструктуры разработки

Основная идея:
описываете целевую конфигурацию инфраструктуры через код → система приводит ее в желаемое состояние → получаете self-service и автоматическое создание нужных сред (четвергов)

То есть вместо ручной настройки:
— шаблоны окружений
— воспроизводимые среды
— все состояние в Git

24 марта будет демо архитектуры платформы.
Регистрация.

Реклама. ООО "Орион", ИНН: ИНН 9704113582, erid: 2VtzqwfS4VK
Easykube: Local Kubernetes development

Tooling aimed at simplifying local Kubernetes development environments.


https://github.com/torloejborg/easykube
Проверяем навыки DevOps-инженеров. Проверим ваши?

Привет, это KTS. Мы создаем цифровые продукты и ведём блог на Хабре, где делимся практикой из проектов. Блогу исполнилось 5 лет, и мы решили отметить эту дату челленджем для девопсов. Победителям дарим футболки с нашим фирменным принтом — Котзиллой (как Годзилла, только кот).

В чем суть головоломки: вы получите доступ к тестовому стенду с Kubernetes-кластером, ArgoCD и GitLab с Helm-чартом. В ArgoCD добавлено приложение, но оно не деплоится.

Ваша задача — разобраться, что пошло не так, исправить конфигурацию и довести деплой до зелёного статуса.

Десять самых быстрых участников получат футболки. Прям СДЭКом отправим 📦

Начать можно по ссылке.

Итоги через неделю, 26 марта в 19:00.

Реклама. ООО "Студия КТС", ИНН: 7733257480, erid: 2VtzqvG6W9b
Guardon: Kubernetes security extension

Security-focused extension project for strengthening Kubernetes environments.


https://github.com/guardon-dev/guardon
difftastic

a structural diff that understands syntax


http://github.com/Wilfred/difftastic
We Cut Our Kubernetes Pods by 60% and Doubled Traffic Capacity

This case study explains how JVM tuning, a smaller Hikari pool, and faster HPA scale-up doubled traffic capacity while reducing baseline pods.


https://medium.com/@feridquluzade2002/we-cut-our-kubernetes-pods-by-60-and-doubled-traffic-capacity-b1cfb6850fca
Hidden Kubernetes Bad Practices Learned the Hard Way During Incidents

This article distills incident-driven lessons on troubleshooting, configuration mistakes, and operational habits that make Kubernetes outages worse.


https://hackernoon.com/hidden-kubernetes-bad-practices-learned-the-hard-way-during-incidents
From Chaos to 99.9% Uptime: Rebuilding a Kubernetes Platform for GPU Workloads

This article covers rebuilding a Kubernetes platform for GPU workloads to reach 99.9% uptime after operational instability.


https://medium.com/@mateenali66/from-chaos-to-99-9-uptime-rebuilding-a-kubernetes-platform-for-gpu-workloads-4fadb1067a0b
Benchmarking Kubernetes Log Collectors: vlagent, Vector, Fluent Bit, OpenTelemetry Collector, and more

At VictoriaMetrics, we built vlagent as a high-performance log collector for VictoriaLogs. To validate its performance and correctness under a real production-like load, we developed a benchmark suite and ran it against 8 popular log collectors. This post covers the methodology, throughput results, resource usage, and delivery correctness.


https://victoriametrics.com/blog/log-collectors-benchmark-2026/index.html
Making and scaling a game server in Kubernetes using agones

This tutorial walks through building a Go game server with Agones, matchmaking, Fleet allocation, and autoscaling on Kubernetes.


https://noe-t.dev/posts/making-and-scaling-a-game-server-in-k8s-using-agones
PostgreSQL migration with CloudNativePG Logical Replication on Kubernetes - Zero-Downtime

This tutorial shows how to migrate PostgreSQL to CloudNativePG on Kubernetes with logical replication and no downtime.


https://kndoni.medium.com/postgresql-migration-with-cloudnativepg-logical-replication-on-kubernetes-zero-downtime-aef1c33a3a53
Gateway API setup on GKE with NGINX Gateway Fabric

This tutorial shows how to deploy NGINX Gateway Fabric on GKE with Terraform, split traffic paths, and automate TLS certificates.


https://medium.com/@henrikamirbekyan/gateway-api-setup-on-gke-with-nginx-gateway-fabric-1b0d0ec3bbf3
Как запустить микросервисы в Managed Kubernetes

Микросервисное приложение мало просто задеплоить — нужны правила запуска, обновлений, масштабирования и изоляции. Именно они делают эксплуатацию предсказуемой, а инфраструктуру — готовой к росту нагрузки.


На вебинаре 26 марта в 11:00 эксперты Cloud.ru разберут, как превратить Managed Kubernetes в удобную и надежную платформу для работы микросервисов.

В программе:
1⃣ разберете, в каких проектах микросервисы действительно нужны и как быстро запустить готовое масштабируемое решение в облаке без лишних сложностей;

2⃣ рассмотрите базовую структуру Kubernetes для микросервисов: что потребуется сразу, а что можно отложить;

3⃣обсудите, как организовать деплой, обновления и откаты, чтобы релизы были управляемыми;

4⃣ настроите масштабирование с помощью нативных инструментов Kubernetes;

5⃣ свяжете платформу с реестром артефактов;

6⃣ узнаете, как следить за метриками и логами приложения.


👉Зарегистрироваться👈
Please open Telegram to view this post
VIEW IN TELEGRAM
Migrating Kubernetes Off Big Cloud

This interview compares the cost and operational tradeoffs of moving a Kubernetes workload from GKE Autopilot to Hetzner with Edka.


https://kube.fm/migrating-kubernetes-off-big-cloud-fernando
GoKubeDownscaler

A horizontal autoscaler for Kubernetes workloads, saving cloud costs by scaling workloads down after hours. This is a golang port and successor of the popular (py-)kube-downscaler with improvements and quality of life changes.


https://github.com/caas-team/GoKubeDownscaler
Karpenter Optimizer: cost optimization

This tool analyzes Karpenter NodePool usage and offers AI-powered recommendations to reduce AWS EC2 costs while maintaining performance.


https://github.com/kaskol10/karpenter-optimizer
cek

Explore OCI container images without running them.


https://github.com/bschaatsbergen/cek