Кубертатный период
480 subscribers
144 photos
10 videos
3 files
319 links
DevOps Underdog
Download Telegram
Forwarded from Кубернетичек
https://kubernetes.io/blog/2025/09/04/kubernetes-v1-34-introducing-psi-metrics-beta/

Я хотел написать про psi, но погуглил, кажется вот в этих постах написали более интересно, чем сделал бы я.
https://xn--r1a.website/azalio_tech/5
https://xn--r1a.website/troubleperf/73

То есть теперь нативно можно получать более подробную информацию о том, как ваши поды контейнеры процессы контролируемые кубом "страдают" от нехватки ресурсов, и страдают ли.
12👍2🦄1
🐬 MySQL/Percona 5.7: подводные камни при очистке и восстановлении

Когда база на диске разрастается сильнее, чем сами таблицы, в глаза бросается огромный ibdata1.
Кажется логичным удалить файл и перезапустить сервер, но это гарантированно ломает системные таблицы и кладёт MySQL.

Че делать-то?

📦 Бэкап
— Дампим только прикладные БД (без mysql, sys, performance_schema, information_schema).
— Пользователей сохраняем отдельно: pt-show-grants или mysqlpump --users.

🔄 Инициализация
— Чистый datadir → mysqld --initialize-insecure → root без пароля.

🌍 Часовой пояс
— Всегда UTC (`TZ=UTC`, `/etc/localtime → UTC`).

Все упражнения выполнялись не на продовой базе. Подскажите, как вы решаете проблему роста данных под мускулем? или это проблема старых версий?
41👍1🦄11
Forwarded from Pavel Klyuev
официально, Nomad, теперь

работать запрещено! only hustle
6🦄7653
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
193
Please open Telegram to view this post
VIEW IN TELEGRAM
🦄84
Говорят, что картинку нельзя сохранить/заскринить. Вот.
🛡️ ModSecurity vs SaaS-WAF

А может ли ModSecurity Web Application Firewall заменить SaaS WAF?

💡 Туда можно прикрутить OWASP CRS Actions, но что нужно, что защититься от DDoS и ботов?
Please open Telegram to view this post
VIEW IN TELEGRAM
Говорят, что комменты нельзя оставить под постами. Давайте протестируем и поможем системному администратору настроить телеграмм канал правильно ?
8
Forwarded from Sergey Pechenkó
Пример правил:
* всякая роль отвечает за единственный компонент (пример - роль редиса, она настраивает редис полностью, как кластер вместе с сентинелом либо как единичный сервис);
* ни одна роль не может использовать никакую внешнюю переменную "внезапно" - только через role_params;
* ни одна роль не может настраивать компонент, за который отвечает другая роль;
* ни одна роль не может выполнять рестарт/релоад компонента, за который отвечает другая роль;
* ни одна роль не может использовать условия (when) - необходимо использовать группы узлов;
* всякая роль обязана "прослушать" (listen) для своего компонента сигналы типа restart, reload;
* любая дичь на баше должна быть выброшена и переписана в питонячий модуль Ansible;
* любая роль должна поддерживать теги;
* любое использование модуля shell должно вызывать подозрительные красные пятна на коже у всей команды, и шквал вопросов в МР типа "почему без этого нельзя обойтись?";
* к использованию модуля shell должно быть отношение типа "гоните его, насмехайтесь над ним";
* зависимости типа драйвера Postgres или других кастомных модулей должны жить в проекте.

Если по какой-то причине какое-то из этих правил (особенно про shell) не соблюдается - заводится задача с чёткими сроками переписывания на Python в виде модуля Ansible.
2👍32🦄11
🤦‍♂️ Не думал, что придется разжевывать простые вещи, но придется: почему Grafana не подходит для алертинга и инцидентов.

👀 Grafana — это “витрина” метрик.
Она отлично рисует графики, даёт ад-hoc анализ, аннотации, переменные, сравнения и т. п. Это про наблюдение.

🚨 Алертинг — это отдельный контур.
Его делают движки правил (Prometheus rules / vmalert) + маршрутизатор уведомлений (Alertmanager) + «пейджер» с гарантиями доставки (Opsgenie/PagerDuty и т. п.). Это про управление инцидентами.

💡 Почему это стоит разделять:
Надёжность: движки правил и Alertmanager спроектированы под HA, ретраи, дедупликацию, ингибишн, тайминги, “maintenance windows”. Grafana — не про гарантии доставки.
Чёткие зоны ответственности: дашборды ≠ жизненный цикл алертов (эскалации, расписания, SLO/SLA).
Управление: сотни/тысячи правил удобнее хранить/версионировать как код (rules/CRD), а не в UI дашборда.
Роутинг и подавление шума: Alertmanager умеет группировать, подавлять каскадные алерты, ставить “silences” — этого часто не хватает в “встроенном” алертинге.

⚠️ Да, есть “Unified Alerting”, это удобно для быстрой проверки правил на графиках. Но:
нет (или ограничены) полноценные дедуп/ингибиции/сложный роутинг/федерация;
сложнее обеспечить HA и гарантии доставки;
правила хуже живут как код (код-ревью, тесты, промоушен между средами).

👉 Поэтому в проде используем его как игрушку в дополнение, а не как основной инструмент.

📌 ИТОГО:
• Grafana = визуализация и обзор.
• Prometheus/vmalert = тул, который решает «когда зажигать алерт».
• Alertmanager = диспетчер, который решает «кому и как посылать алерт».
• Opsgenie/PagerDuty/OnCall = гарантия доставки, расписания и эскалации.
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍5🦄1
Forwarded from Azalio_tech (Mikhail [azalio] Petrov)
This media is not supported in your browser
VIEW IN TELEGRAM
Я думаю вас никогда так не рикролили :)
Рассказываю сегодня про l2 анонсы в #cilium.
14🦄32
🐓 Bitnami снова «порадовали», надеюсь в последний раз

Я старательно пытался избегать использовать что образа от bitnami, что в нынешнее время чарты. Но исключением был redis, а теперь valkey.

Но в полку петушар в ИТ прибыло, индустрия стремительно катится в "коммерческое" дно под соусом OSS.

🔗 https://github.com/bitnami/containers/issues/83267

💸 Стоимость услуги от Bitnami $6k/месяц, минимально от 12 месяцев.

Все образа перенесли в bitnamilegacy, а в bitnamisecure теперь только latest таги.

Надеюсь поскорее все перепишут, а я готов даже поконтрибутить в valkey chart
👉 https://github.com/valkey-io/valkey/issues/2371
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍7🦄42
Kubernetes Ingress NGINX -- ВСЕ!!!

Поддержка официального Kubernetes будпрекращается в мартe 2026, кстати говоря как и InGate, который должен был прийти на смену в качестве Gateway API Controller.

Что делать? Как можно скорее мигрировать на Gateway API Controller
- Envoy
- Istio
- Traefik Gateway API
- HAProxy Kubernetes Gateway 🔝
- F5 NGINX Kubernetes Gateway 💩

Речь тут о Kubernetes Ingress NGINX Controller, а не F5 NGINX Ingress Controller
Please open Telegram to view this post
VIEW IN TELEGRAM
5621
Там еще незаметно как-то подвезли Helm 4

Но что-то кроме Server-Side Apply и отслеживания состояния ресурсов я ничего любопытного не обнаружил.

Что-то еще пишут про
Multi-Document Values
Split complex values across multiple YAML files. Perfect for testing different environment configs.

но я не сообразил пока как это судя по issue https://github.com/helm/helm/issues/13097
11🦄11
Cloudflare лежит
34👍3🦄1
Кубертатный период
Cloudflare лежит
Пишут, что в ClickHouse изменились права/метаданные, что привело к дублированию данных, после чего из-за превышения лимитов данных начались 5хх ошибки. Решилось все откатом назад.

https://blog.cloudflare.com/18-november-2025-outage/
5👍311
CF снова пал. Не хотел бы я быть тем инженером что за него отвечает
14👍2
Forwarded from Админим с Буквой (Aleksandr Kondratev)
Пу-пу-пу часть2

https://github.com/minio/minio/commit/27742d469462e1561c776f88ca7a1f26816d69e2

Бесплатный минио - всё.

This project is currently under maintenance and is not accepting new changes.
1
Использование Kubernetes крупными корпорациями привело к росту пользователей иных OpenSource решений, что напрямую влияет на текущую коммерциализацию потихоньку всего рынка — теперь это Minio, что не стало в целом неожиданностью.

Некоторые винят облачных провайдеров, что те продают SaaS и не делятся с разработчиками, но ведь с другой стороны весь Open Source — это и есть профессиональные разработчики, которые ради коммерческих нужд развивали весь рынок.

Неважно, просто скоро появится K8sStore с приложениями.
13👎22