rxd_txd
302 subscribers
505 photos
31 videos
22 files
2.79K links
Download Telegram
Forwarded from CatOps
​​Google have perfect blog-post about SRE & Devops

They explain complicated things in simple words:
1. The difference between DevOps and SRE
2. SLIs, SLOs, and SLAs
3. Risk and error budgets
4. Toil and toil budgets
5. Customer Reliability Engineering (CRE)

#monitoring #sre #culture
Многие знают про readiness/liveness probes в Kubernetes, но часто не понимают что именно в них должно быть. Статья которая раскрывает тему healthcheck достаточно глубоко - https://medium.com/@copyconstruct/health-checks-in-distributed-systems-aa8a0e8c1672 Настоятельно советую посмотреть еще ссылки в конце - там тоже много вкусного.
#sre #healtcheck
Очень подробная и обстоятельная первая статья в цикле статей про chaos engineering, если вы не в курсе что это - обязательно ознакомьтесь, остальным могут быть интересны "исторические" подробности https://medium.com/@adhorn/chaos-engineering-ab0cc9fbd12a #netflix #chaos #sre
Forwarded from Tech Cheat Sheet (Oleg Kovalov)
#sre Disaster recovery
Recovery Point Objective (RPO)
Recovery Time Objective (RTO)