rxd_txd
306 subscribers
479 photos
25 videos
22 files
2.71K links
[
{
"channel":"rxd_txd",
"info":"my bookmarks",
"feedback":"@flsixtyfour",
"topics":[
"devops",
"linux",
"sci",
"music",
"go",
"/dev/null"
]
}
]
Download Telegram
Forwarded from CatOps
​​Google have perfect blog-post about SRE & Devops

They explain complicated things in simple words:
1. The difference between DevOps and SRE
2. SLIs, SLOs, and SLAs
3. Risk and error budgets
4. Toil and toil budgets
5. Customer Reliability Engineering (CRE)

#monitoring #sre #culture
Многие знают про readiness/liveness probes в Kubernetes, но часто не понимают что именно в них должно быть. Статья которая раскрывает тему healthcheck достаточно глубоко - https://medium.com/@copyconstruct/health-checks-in-distributed-systems-aa8a0e8c1672 Настоятельно советую посмотреть еще ссылки в конце - там тоже много вкусного.
#sre #healtcheck
Очень подробная и обстоятельная первая статья в цикле статей про chaos engineering, если вы не в курсе что это - обязательно ознакомьтесь, остальным могут быть интересны "исторические" подробности https://medium.com/@adhorn/chaos-engineering-ab0cc9fbd12a #netflix #chaos #sre
Forwarded from Tech Cheat Sheet (Oleg Kovalov)
#sre Disaster recovery
Recovery Point Objective (RPO)
Recovery Time Objective (RTO)