Dev0ps
40 subscribers
211 photos
3 videos
50 files
3.33K links
Download Telegram
Forwarded from The Devs
22 SSH examples, practical tips and tunnels.

#tutorial #coding #ssh
@thedevs

https://kutt.it/Xw7141
Forwarded from DevOps&SRE Library
Какие метрики и как стоит замониторить в Nginx.

How to monitor NGINX:
https://www.datadoghq.com/blog/how-to-monitor-nginx

How to collect NGINX metrics:
https://www.datadoghq.com/blog/how-to-collect-nginx-metrics

How to monitor NGINX with Datadog:
https://www.datadoghq.com/blog/how-to-monitor-nginx-with-datadog
Forwarded from DevOps Deflope News
Очень интересный доклад от Gregory Stark на PGCONF EU 2018 про построение мониторинга PostgreSQL с помощью Prometheus и Grafana. С реальными примерами, графиками и теорией про USE, RED.
P.S. Видео к сожалению пока не нашлось ¯\_(ツ)_/¯

Блог: http://amp.gs/VpF6
Конференция: http://amp.gs/VpXj
Слайды: http://amp.gs/VpXI
#monitoring #prometheus #postgresql
Forwarded from DevOps Deflope News
Отличный постмортем от Dan Woods из Target про то, как одно небольшое изменение может ОЧЕНЬ многое каскадно сломать в сложной распределенной инфраструктуре)

http://amp.gs/Vpq2
Forwarded from DevOps&SRE Library
nginx_cookbook_2019.pdf
3.1 MB
NGINX Cookbook
Advanced Recipes for High
Performance Load Balancing

Derek DeJonghe

2019
Forwarded from DevOps&SRE Library
Automating Datacenter Operations at Dropbox

Отличный пост в техническом блоге Dropbox про то, как они делают провижен свичей и серверов в своих ДЦ.

https://blogs.dropbox.com/tech/2019/01/automating-datacenter-operations-at-dropbox
Forwarded from DevOps&SRE Library
Какие метрики и как стоит замониторить в Nginx.

How to monitor NGINX:
https://www.datadoghq.com/blog/how-to-monitor-nginx

How to collect NGINX metrics:
https://www.datadoghq.com/blog/how-to-collect-nginx-metrics

How to monitor NGINX with Datadog:
https://www.datadoghq.com/blog/how-to-monitor-nginx-with-datadog
Forwarded from DevOps&SRE Library
Какие метрики и как стоит замониторить в Redis.

How to monitor Redis performance metrics:
https://www.datadoghq.com/blog/how-to-monitor-redis-performance-metrics

How to collect Redis metrics:
https://www.datadoghq.com/blog/how-to-collect-redis-metrics

Monitor Redis using Datadog:
https://www.datadoghq.com/blog/monitor-redis-using-datadog
Forwarded from DevOps&SRE Library
Designing resilient systems: Circuit Breakers or Retries?

Серия из 2х постов про важные концепции для построения распределенных отказоустойчивых систем - circuit breakers и retries.

https://engineering.grab.com/designing-resilient-systems-part-1
https://engineering.grab.com/designing-resilient-systems-part-2
Forwarded from DevOps Deflope News
Отличный репозиторий на гитхабе с кучей ссылок на различные курсы и обучающие материалы.
http://amp.gs/Vvoc

P.S. Спасибо за ссылку, Миша =^._.^= ∫
#github #courses
Forwarded from CatOps
​​Статья о том, как в Dropbox автоматизируют конфигурацию своих датацентров

Так как Dropbox одни из первых (по крайней мере первые из громких) переехали из публичного облака на своё железо, там вам никакого Terraform’а — всё по хардкору с валидацией свичей, стресс-тестами и бенчмарками.
Forwarded from DevOps&SRE Library
Architecting for Reliability

Серия постов про то, какими способами можно улучшить надежность работы приложений.

Part 1 - Concepts:
https://medium.com/becloudy/architecting-for-reliability-part-1-concepts-17028343089

Part 2  -  Resiliency and Availability Design Patterns for the Cloud:
https://medium.com/becloudy/architecting-for-reliability-part-2-resiliency-and-availability-design-patterns-for-the-cloud-cf7aaaed0df2

Part 3 - High Availability Architectures:
https://medium.com/becloudy/architecting-for-reliability-part-3-high-availability-architectures-8dfd0f87d25e
Forwarded from DevOps Deflope News
В блоге компании Gruntwork вышла серия статей про автоматизацию HashiCorp Vault.
Рассматривается auto-unseal и аутентификация с помощью метаданных инстанса и IAM для AWS и GCP.

* http://amp.gs/Vr1L
* http://amp.gs/Vr1Q
* http://amp.gs/Vr1o

#gruntwork #vault #aws
Forwarded from DevOps&SRE Library
Systems_Performance.pdf
8.2 MB
Systems Performance

Отличная книга про производительность операционных систем и приложений. Хоть книга уже и не новая, я всеравно настоятельно советую ее прочитать хотябы по диагонали. В книге объясняется множество базовых концепций и методологий, которые не утратили свою актуальность.

Brendan Gregg

2014
Forwarded from CatOps
​​How about building Feature Toggles into Terraform?

Technically - nothing new, but it can be very useful when you have many slightly different environments.

As bonus, you can read definitive guide how cook feature toggles at weekend.

#terraform #culture
Многие знают про readiness/liveness probes в Kubernetes, но часто не понимают что именно в них должно быть. Статья которая раскрывает тему healthcheck достаточно глубоко - https://medium.com/@copyconstruct/health-checks-in-distributed-systems-aa8a0e8c1672 Настоятельно советую посмотреть еще ссылки в конце - там тоже много вкусного.
#sre #healtcheck