Кубертатный период
480 subscribers
144 photos
10 videos
3 files
319 links
DevOps Underdog
Download Telegram
💡 А вы знали, что в logrotate daily и size — не работают вместе?

В logrotate нельзя просто заюзать daily и size вместе — они взаимоисключающие. Size плюёт на время ротации, а daily не смотрит на размер логов. Итог? Логи либо растут, либо ротируются когда не нужно.

maxsize <size> -- ротирует логи, если они перевалили за размер, учитывая время (daily, weekly, monthly). Так мы получим что хотели.

📜 man logrotate
maxsize size: Log files are rotated when they grow bigger than size bytes even before the specified time interval. Both size and timestamp are considered.


Один гений решил не читать доки — дальше вы знаете что произошло. 😎
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍82👎11
🚀 GPU-шаринг в Kubernetes: Project HAMi

Ранее уже писал про шаринг GPU в Kubernetes и репостил про сложности мониторинга. Сейчас наткнулся на более зрелый проект — k8s-vGPU-scheduler, который теперь называется Project HAMi (Heterogeneous AI Computing Virtualization Middleware).

💡 Почему вообще появился HAMi? По словам разработчиков, потому что ни одно из существующих решений не покрывает реальные потребности:

- Time slicing — просто в конфигурации, но нет изоляции и плохо с производительностью.
- MPS — поддерживает параллельные вычисления, но снова нет изоляции.
- MIG — есть изоляция, но нужна статичная конфигурация ноды, и работает только на дорогих картах.
- vGPU — платное, требует виртуализации, не вписывается в kubernetes-native подход.

🔧 Что умеет HAMi:
- Использование vGPU с любым значением памяти
- Гибкая конфигурация нагрузок: тип карты, affinity и т.д.
- Метрики GPU на уровне контейнеров с готовыми дашбордами
- Динамический MIG — без ребутов и статических настроек
- Работает с любыми видеокартами, не только A100
- Поддержка NVLink уже на подходе

👀 Выглядит как очень интересное решение для AI-нагрузок в Kubernetes.
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍42🦄1
🚀 Argo CD 3.0

🧱 Что изменилось:

– argocd-server теперь один бинарник
– убрали redis
– добавили lua-плагины
– много упрощений вокруг rbac

🏠 Проект становится проще и взрослее в плане архитектуры, но глобально — ничего не поменялось. Можно не спешить обновляться.
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍82🦄22
Forwarded from Кубернетичек
Все, 65к нод не модно. Eks говорит, мы предоставляем кластера со 100к нод https://aws.amazon.com/blogs/containers/under-the-hood-amazon-eks-ultra-scale-clusters/. Для этого нужно: использовать tmpfs, шардировать ключи (разделить кластера etcd по ключам в kube api), пенести транзакционную модель на кастомный плагин, дождать изменений в кубе 1.31 и 1.33 с констистентным чтением и стриминг пакетов, поправить индексацию в популярных куб контроллер. И вуаля)
221
🚀 А вы знали, что Karpenter работает не только в AWS?

💡 Появился провайдер для GCP, добавляющий поддержку Karpenter в GKE — https://github.com/cloudpilot-ai/karpenter-provider-gcp
Также есть провайдер под Azure

Что умеет GCP-провайдер:
📦 Smart node provisioning and autoscaling
💸 Cost-optimized instance selection
🔌 Deep GCP service integration
Fast node startup and termination
Please open Telegram to view this post
VIEW IN TELEGRAM
142👍1
Forwarded from Dmitry Ibragimov
А, хотел с вам поделиться, в начале года форкнули наконец нормально Lens и продолжают развивать - https://freelensapp.github.io/ . Всем, кому с кубером надо работать must have
👍8422
🪣 Storadera — альтернатива S3 на Hetzner

🇪🇪 Собственное S3-совместимое хранилище на bare metal серверах Hetzner (Германия, Финляндия) и других площадках (например, в Эстонии — не на Hetzner).
Они пишут свой S3 backend, оптимизированный под HDD, и позиционируются как «простой и предсказуемый» сервис без лишних фич.

📦 Используется модель fair use — выкачка данных не должна превышать объём хранимых. Главное — не использовать как CDN.
Please open Telegram to view this post
VIEW IN TELEGRAM
82👍2🦄21
Forwarded from Pavel Klyuev
блять я не могу это остановиться смотреть
Forwarded from Pavel Klyuev
every terraform apply is a chaos engineering
5
Forwarded from Pavel Klyuev
propagating errors in automating ways
👍4
Forwarded from Кубернетичек
https://kubernetes.io/blog/2025/09/04/kubernetes-v1-34-introducing-psi-metrics-beta/

Я хотел написать про psi, но погуглил, кажется вот в этих постах написали более интересно, чем сделал бы я.
https://xn--r1a.website/azalio_tech/5
https://xn--r1a.website/troubleperf/73

То есть теперь нативно можно получать более подробную информацию о том, как ваши поды контейнеры процессы контролируемые кубом "страдают" от нехватки ресурсов, и страдают ли.
12👍2🦄1
🐬 MySQL/Percona 5.7: подводные камни при очистке и восстановлении

Когда база на диске разрастается сильнее, чем сами таблицы, в глаза бросается огромный ibdata1.
Кажется логичным удалить файл и перезапустить сервер, но это гарантированно ломает системные таблицы и кладёт MySQL.

Че делать-то?

📦 Бэкап
— Дампим только прикладные БД (без mysql, sys, performance_schema, information_schema).
— Пользователей сохраняем отдельно: pt-show-grants или mysqlpump --users.

🔄 Инициализация
— Чистый datadir → mysqld --initialize-insecure → root без пароля.

🌍 Часовой пояс
— Всегда UTC (`TZ=UTC`, `/etc/localtime → UTC`).

Все упражнения выполнялись не на продовой базе. Подскажите, как вы решаете проблему роста данных под мускулем? или это проблема старых версий?
41👍1🦄11