Dev0ps
40 subscribers
211 photos
3 videos
50 files
3.33K links
Download Telegram
Forwarded from CatOps
Рекомендую статью Monitoring and Observability от Cindy Sridharan‏

Там простым языком (английким) объясняется, чем таки мониторинг отличается от "observability" и зачем кому-то нужен ещё один термин.

Написано хорошо, но мы то понимаем. Цитирую:

 I’m an engineer that can help provide monitoring to the other engineers in the organization
> Great, here’s $80k.
I’m an architect that can help provide observability for cloud-native, container-based applications
> Awesome! Here’s $300k!


#monitoring #observability
Forwarded from CatOps
А почитайте про Canopy систему от Facebook для сквозного (end-to-end) анализа производительности

Это как раз и есть то, что назвали бы модным словом "observability", но в статье его ни разу не встречается (хаха!) и, честно говоря, от самого слова уже начинает дёргаться глазик

#monitoring #observability
Forwarded from CatOps
​​Окей, вы настроили мониторинг. У вас есть куча метрик, которые даже собраны в красивые дашборды

Куда смотреть? Надо ли будить половину команды, если вырос cpu_wio на 7% бэкэндов? А на 20%? Или мы просто будем сомтреть на valid_response_p95_rate и алерить по данной метрике?

Конечно, это всё очень индивидуально, и у разных людей разные мнения по поводу "золотых сигналов". Т.е индикаторов, что у нас сейчас всё overall good или overall bad. Почитать о разных мнениях можно тут:

https://medium.com/devopslinks/how-to-monitor-the-sre-golden-signals-1391cadc7524

В кратце о методах:

Google: Latency, Traffic, Errors, and Saturation
Brendan Gregg: Utilization, Saturation, and Errors
Tom Wilkie: Rate, Errors, and Duration

Ну а дальше уже в статье всё разжёвано детальней

#monitoring #observability
Forwarded from CatOps
Pinterest заопенсорсили свой агент логгирования — Singer

Судя по документации, логи предполагается писать в Кафку, но есть вот такая строка:

> Extensible design: Singer can be easily extended to support data uploading to custom destinations.

#logging #observability
Forwarded from CatOps
​​Framework for an Observability Maturity Model

Observability is on the minds of just about every modern dev team running a production service, and it’s time everyone spoke the same language, so we can build something greater on the top of our shared understanding. Access to observable systems is the path toward less frustration and more happiness—both for those responsible for production, and the customers they serve.

For this propose, Honeycomb was created white paper, where they sharing own vision of observability based on goals instead of tools.

P.S. Monitoring is only little part of this Framework.
P.P.S. If you earlier skiped Achieving Observability guide, it's time to read it.

#books #observability
Forwarded from CatOps
Ретроспектива трёх лет понятия "observability" от одной из основательниц движения - Charity Majors

В статье описана история возникновения понятие, почему метрики - это ещё не observability, практическую сторону вопроса и прочее.

#observability
Forwarded from CatOps
Если вам лень что-то читать по понедельникам, вот выпуск подкаста про Observability: инженер Uber рассказывает про распределенный трейсинг.

Если всё же читать вам приятней, чем слушать, вот интервью на том же Packt с Charity Majors - одной из пионеров этого понятия.

#observability