Dev0ps
40 subscribers
211 photos
3 videos
50 files
3.33K links
Download Telegram
Forwarded from DevOps Deflope News
Отличный постмортем от Dan Woods из Target про то, как одно небольшое изменение может ОЧЕНЬ многое каскадно сломать в сложной распределенной инфраструктуре)

http://amp.gs/Vpq2
Forwarded from DevOps&SRE Library
nginx_cookbook_2019.pdf
3.1 MB
NGINX Cookbook
Advanced Recipes for High
Performance Load Balancing

Derek DeJonghe

2019
Forwarded from DevOps&SRE Library
Automating Datacenter Operations at Dropbox

Отличный пост в техническом блоге Dropbox про то, как они делают провижен свичей и серверов в своих ДЦ.

https://blogs.dropbox.com/tech/2019/01/automating-datacenter-operations-at-dropbox
Forwarded from DevOps&SRE Library
Какие метрики и как стоит замониторить в Nginx.

How to monitor NGINX:
https://www.datadoghq.com/blog/how-to-monitor-nginx

How to collect NGINX metrics:
https://www.datadoghq.com/blog/how-to-collect-nginx-metrics

How to monitor NGINX with Datadog:
https://www.datadoghq.com/blog/how-to-monitor-nginx-with-datadog
Forwarded from DevOps&SRE Library
Какие метрики и как стоит замониторить в Redis.

How to monitor Redis performance metrics:
https://www.datadoghq.com/blog/how-to-monitor-redis-performance-metrics

How to collect Redis metrics:
https://www.datadoghq.com/blog/how-to-collect-redis-metrics

Monitor Redis using Datadog:
https://www.datadoghq.com/blog/monitor-redis-using-datadog
Forwarded from DevOps&SRE Library
Designing resilient systems: Circuit Breakers or Retries?

Серия из 2х постов про важные концепции для построения распределенных отказоустойчивых систем - circuit breakers и retries.

https://engineering.grab.com/designing-resilient-systems-part-1
https://engineering.grab.com/designing-resilient-systems-part-2
Forwarded from DevOps Deflope News
Отличный репозиторий на гитхабе с кучей ссылок на различные курсы и обучающие материалы.
http://amp.gs/Vvoc

P.S. Спасибо за ссылку, Миша =^._.^= ∫
#github #courses
Forwarded from CatOps
​​Статья о том, как в Dropbox автоматизируют конфигурацию своих датацентров

Так как Dropbox одни из первых (по крайней мере первые из громких) переехали из публичного облака на своё железо, там вам никакого Terraform’а — всё по хардкору с валидацией свичей, стресс-тестами и бенчмарками.
Forwarded from DevOps&SRE Library
Architecting for Reliability

Серия постов про то, какими способами можно улучшить надежность работы приложений.

Part 1 - Concepts:
https://medium.com/becloudy/architecting-for-reliability-part-1-concepts-17028343089

Part 2  -  Resiliency and Availability Design Patterns for the Cloud:
https://medium.com/becloudy/architecting-for-reliability-part-2-resiliency-and-availability-design-patterns-for-the-cloud-cf7aaaed0df2

Part 3 - High Availability Architectures:
https://medium.com/becloudy/architecting-for-reliability-part-3-high-availability-architectures-8dfd0f87d25e
Forwarded from DevOps Deflope News
В блоге компании Gruntwork вышла серия статей про автоматизацию HashiCorp Vault.
Рассматривается auto-unseal и аутентификация с помощью метаданных инстанса и IAM для AWS и GCP.

* http://amp.gs/Vr1L
* http://amp.gs/Vr1Q
* http://amp.gs/Vr1o

#gruntwork #vault #aws
Forwarded from DevOps&SRE Library
Systems_Performance.pdf
8.2 MB
Systems Performance

Отличная книга про производительность операционных систем и приложений. Хоть книга уже и не новая, я всеравно настоятельно советую ее прочитать хотябы по диагонали. В книге объясняется множество базовых концепций и методологий, которые не утратили свою актуальность.

Brendan Gregg

2014
Forwarded from CatOps
​​How about building Feature Toggles into Terraform?

Technically - nothing new, but it can be very useful when you have many slightly different environments.

As bonus, you can read definitive guide how cook feature toggles at weekend.

#terraform #culture
Многие знают про readiness/liveness probes в Kubernetes, но часто не понимают что именно в них должно быть. Статья которая раскрывает тему healthcheck достаточно глубоко - https://medium.com/@copyconstruct/health-checks-in-distributed-systems-aa8a0e8c1672 Настоятельно советую посмотреть еще ссылки в конце - там тоже много вкусного.
#sre #healtcheck
Forwarded from DevOps Deflope News
Немножко утилит про сети.

* ksniff — kubectl плагин, который использует tcpdump и Wireshark для снятия трафика в любом поде в кластере Kubernetes.
http://amp.gs/VWbN
P.S. Напоминаю, что плагины kubectl теперь можно удобно ставить с помощью krew
http://amp.gs/VWbJ

* kubefwd — решение для форвардинга портов из Kubernetes на локальное окружение.
http://amp.gs/VWbL

* sshuttle — простая штука для создания подобия VPN через ssh соединение без админских прав.
http://amp.gs/VWb3
И kuttle — обертка для sshuttle для kubectl для пробрасывания сети из Kubernetes на локалхост.
http://amp.gs/VWb2

#tools #network
Forwarded from DevOps Deflope News
Если вы давно слышали про флеймграфы от Брендана Грегга, но все не доходили руки попробовать их, то вот отличная статья от Selectel про его применение для дебага проблем.

http://amp.gs/9jZg

Заодно можно упомянуть доклад Петра Зайцева с FOSDEM http://amp.gs/9jZR
И статью http://amp.gs/9jZV
#flamegraphs #performance