Dev0ps
40 subscribers
211 photos
3 videos
50 files
3.33K links
Download Telegram
Forwarded from Мониторим ИТ
На Медиуме есть автор Стив Мушеро (Steve Mushero), который много пишет о SRE и о подходах к мониторингу по этой методологии. Здесь он пишет про золотые сигналы SRE (Latency, Traffic, Errors, and Saturation), методики USE и RED, но есть и статьи о метриках, которые он рекомендует собирать в контексте SRE по конкретным элементам систем. Ниже подборка таких статей.

Метрики балансировщика (AWS ALB/ELB, HAProxy)

Метрики веб-серверов (Apache & Nginx)

Метрики серверов приложений (PHP, FPM, Java, Ruby, Node, Go, Python)

Метрики серверов баз данных (MySQL & AWS RDS и AWS Aurora)

Метрики Линукс-серверов (Linux)
Forwarded from Мониторим ИТ
Обнаружение аномалий в Prometheus — выступление Andrew Newdigate на Monitorama PDX 2019. Расскажет о своём опыте и подходах. А здесь слайды презентации.
Forwarded from CatOps
​​Статья Henning Jacobs - начальника Developer Productivity в Zalando - о том, как экономить косты в облаке с Kubernetes. Статья вышла месяц назад, но на фоне тренда урезания затрат везде, где можно, очень даже актуальна.

Бонусом, посмотрите его выступление c прошлогоднего Кубкона о Kubernetes Failure Stories

#kubernetes #aws #costs #slides
Forwarded from CatOps
На фоне кризиса многие компании режут косты на инфраструктуру. Вот только, чтобы их эффективно резать, надо сначала их хотя бы считать :)

Вот Антон Бабенко создал сервис для подсчёта стоимости инфраструктуры по Terraform стейту.

Бесплатно, без регистрации. Пока что считает только aws_instance ресурсы

#terraform #hashicorp #cost
Доклады с Seattle SRE Meetup

Embracing service-level-objectives of your microservices in your Cl/CD
https://youtu.be/qJXeDHfJkIU?t=432

Reliability Since the Dawn of the Internet
https://youtu.be/qJXeDHfJkIU?t=2040

Слайды
https://www.dropbox.com/sh/6n3mdxaxrzfcbvb/AAAfnF5Gg-dUMNBxNjhen43xa?dl=0
Webinars: Encrypting data in Kubernetes deployments. Protect your data, not just your Secrets
https://www.youtube.com/watch?v=gEv9JACCCXA

Слайды
https://www.cncf.io/wp-content/uploads/2020/05/ZettasetCNCFWebinar20200506.pdf
🕰 Time on Unix - большой пост о том, что такое время в Unix и Linux. Системное, хардварное время, таймеры, обновление времени, что такое atime, ctime, mtime, таймзоны и всё вот это вот собранное в одной статье. А для тех, кому будет мало прочитанного, доступна большая порция ссылок с дополнительными подробностями. #time #напочитать
И вот ещё о работе со временем - утилита, которая позволяет при работе скриптов или ПО передать им любое, нужное вам время - faketime. В том числе, и время в прошлом. #time #faketime #будничное
Media is too big
VIEW IN TELEGRAM
Когда то я увидел у @count0_digest ссылки на цикл статей про Chaos Engineering и вот наконец-то добрался до них и прочитал. Было интересно.

Chaos Engineering — Part 1
The art of breaking things purposefully
https://medium.com/@adhorn/chaos-engineering-ab0cc9fbd12a

Chaos Engineering — Part 2
Planning your first experiment
https://medium.com/@adhorn/chaos-engineering-part-2-b9c78a9f3dde

Chaos Engineering — Part 3
Failure Injection — Tools and Methods.
https://medium.com/@adhorn/chaos-engineering-part-3-61579e41edd8

Так же у автора этого цикла есть вебинар "Chaos Engineering on AWS. Building Resilient Systems"
https://anz-resources.awscloud.com/anz-webinars-on-demand-developer/applying-chaos-engineering-principles-for-building-fault-tolerant-applications

Для тех, кто не хочет там регаться я прицепил к посту видео собственно с самим вебинаром.
Статья от этого же автора

Immutable Infrastructure
Reliability, consistency and confidence through immutability
https://medium.com/@adhorn/immutable-infrastructure-21f6613e7a23