Forwarded from CatOps
Google have perfect blog-post about SRE & Devops
They explain complicated things in simple words:
1. The difference between DevOps and SRE
2. SLIs, SLOs, and SLAs
3. Risk and error budgets
4. Toil and toil budgets
5. Customer Reliability Engineering (CRE)
#monitoring #sre #culture
They explain complicated things in simple words:
1. The difference between DevOps and SRE
2. SLIs, SLOs, and SLAs
3. Risk and error budgets
4. Toil and toil budgets
5. Customer Reliability Engineering (CRE)
#monitoring #sre #culture
Forwarded from Пятничный деплой
Многие знают про readiness/liveness probes в Kubernetes, но часто не понимают что именно в них должно быть. Статья которая раскрывает тему healthcheck достаточно глубоко - https://medium.com/@copyconstruct/health-checks-in-distributed-systems-aa8a0e8c1672 Настоятельно советую посмотреть еще ссылки в конце - там тоже много вкусного.
#sre #healtcheck
#sre #healtcheck
Medium
Health Checks and Graceful Degradation in Distributed Systems
Thanks, as always, to Fred Hebert and Sargun Dhillon for reading a draft of this post and offering some invaluable suggestions.
Forwarded from Пятничный деплой
Про отказоустойчивость - термины, виды, методы расчета https://docs.microsoft.com/en-us/azure/architecture/resiliency/
#resilency #sre #sla
#resilency #sre #sla
Docs
Overview of the reliability pillar - Microsoft Azure Well-Architected Framework
Learn about the reliability pillar of the Azure Well-Architected Framework with this high-level summary.
Forwarded from Пятничный деплой
Огромная подборка материалов и статей для SRE https://github.com/lorin/resilience-engineering/blob/master/README.md #sre
GitHub
resilience-engineering/README.md at master · lorin/resilience-engineering
Resilience engineering papers. Contribute to lorin/resilience-engineering development by creating an account on GitHub.
Forwarded from Пятничный деплой
Очень подробная и обстоятельная первая статья в цикле статей про chaos engineering, если вы не в курсе что это - обязательно ознакомьтесь, остальным могут быть интересны "исторические" подробности https://medium.com/@adhorn/chaos-engineering-ab0cc9fbd12a #netflix #chaos #sre
Medium
Chaos Engineering — Part 1
The art of breaking things purposefully
Forwarded from Tech Cheat Sheet (Oleg Kovalov)