Practical Considerations for AI Incident Reviews
https://fgj.codes/posts/ai-incident-reviews
The post argues AI-written incident reviews fail without rich cross-system data and human engagement because incident reviews are socio-technical learning work, not just document generation.
https://fgj.codes/posts/ai-incident-reviews
Вебинар: Механизмы защиты от переполнения диска в Databases
Что делать, если диск переполнен? Экстренно очистить кэш пакетного менеджера или удалить старые логи, но важно другое. А как вообще не допускать таких ситуаций? Как построить систему хранения данных, чтобы не переплачивать за автомасштабирование, но обезопасить себя от простоев? Приходите на наш вебинар, чтобы узнать узнать больше про работу с дисками и поучаствовать в обсуждении актуальных кейсов.
16 апреля, 16:00 (мск)
О чем будем говорить
- Зачем нужны WAL, и что будет если их удалить
- Какие существуют неочевидные причины переполнения дисков, как это влияет на доступность БД
- Сколько стоят последствия даунтаймов. Какие есть инструменты, чтобы все исправить
- Чек-лист инструментов, чтобы избежать переполнения WAL-диска: мониторинг, алертинг и профилирование нагрузки
Кому будет полезен вебинар
- DevOps/SRE-инженерам
- DBA и инженерам сопровождения БД
- архитекторам облачных решений
- техническим лидам, отвечающим за стабильность сервисов
Зарегистрироваться
Что делать, если диск переполнен? Экстренно очистить кэш пакетного менеджера или удалить старые логи, но важно другое. А как вообще не допускать таких ситуаций? Как построить систему хранения данных, чтобы не переплачивать за автомасштабирование, но обезопасить себя от простоев? Приходите на наш вебинар, чтобы узнать узнать больше про работу с дисками и поучаствовать в обсуждении актуальных кейсов.
16 апреля, 16:00 (мск)
О чем будем говорить
- Зачем нужны WAL, и что будет если их удалить
- Какие существуют неочевидные причины переполнения дисков, как это влияет на доступность БД
- Сколько стоят последствия даунтаймов. Какие есть инструменты, чтобы все исправить
- Чек-лист инструментов, чтобы избежать переполнения WAL-диска: мониторинг, алертинг и профилирование нагрузки
Кому будет полезен вебинар
- DevOps/SRE-инженерам
- DBA и инженерам сопровождения БД
- архитекторам облачных решений
- техническим лидам, отвечающим за стабильность сервисов
Зарегистрироваться
10 Real-World Status Page Examples: And What You Can Learn From Them
https://uptimerobot.com/blog/10-real-status-page-examples
The post walks through ten status page examples and highlights clear communication, simple layouts, and expectation-setting details that help users during incidents.
https://uptimerobot.com/blog/10-real-status-page-examples
Disappointing People Early
https://log.andvari.net/disappointing-people-early.html
The post argues teams should make reliability targets, support limits, and roadmap uncertainty explicit early so customers and stakeholders do not build riskier implicit expectations.
https://log.andvari.net/disappointing-people-early.html
5 Suggestions to Upgrade your OpenTofu/Terraform & AWS Development Experience
https://www.uturndata.com/insights/5-suggestions-upgrade-opentofu-terraform-aws-development-experience
Five practical DX improvements for daily OpenTofu/Terraform + AWS work: use `tenv` for seamless version switching, a `grep` alias to summarize plans quickly, `tflint` with cloud provider plugins for linting, `awsp` for fast AWS profile switching, and a customized shell prompt showing the current branch/workspace/profile at a glance to prevent costly wrong-context mistakes.
https://www.uturndata.com/insights/5-suggestions-upgrade-opentofu-terraform-aws-development-experience