Forwarded from CatOps
История о том, почему нельзя игнорировать трейсинг в распределенных системах
tl;dr: потому что с ним гораздо быстрее искать, где проблема.
#observability
tl;dr: потому что с ним гораздо быстрее искать, где проблема.
#observability
The New Stack
Why You Can’t Afford to Ignore Distributed Tracing for Observability
InfluxData sponsored this post. Observability is a hot topic, but not a lot of people know what it truly means. Everyone reads about monitoring vs. observability these days, and I have had the chance to experience what I think is the main concept behind this…
Forwarded from Vitaliy Levchenko
Господа (и госпожи)! Напоминаю, что митап начинается через 1.5 часа. Если вы в списке участников — самое время собираться, или присоединиться к 36 отказавшихся от участия
https://www.meetup.com/SPb-Reliability-Meetup/events/257499497
и освободить место для желающих из вейтлиста.
Начинаем в 19:00.
Для тех, кому холодно, трансляция с митапа: youtu.be/beOphYOAYy4
https://www.meetup.com/SPb-Reliability-Meetup/events/257499497
и освободить место для желающих из вейтлиста.
Начинаем в 19:00.
Для тех, кому холодно, трансляция с митапа: youtu.be/beOphYOAYy4
Meetup
SPb Reliability Meetup #1
Tue, Jan 22, 2019, 7:00 PM: Митап начнётся с небольшого вводного доклада от Виталия Левченко о том, что такое SRE. Затем у нас будет два основных доклада:1. Трейсинг распределенных систем. Егор Мыскин
Forwarded from DevOps Deflope News
Немного полезняшек для Terraform'a
tfmask — отличная штука для маскирования секретов из вывода terraform plan или apply http://amp.gs/VUIZ;
tfenv — другая утилита для упрощения использования переменных окружения с тераформом http://amp.gs/VUI7;
Ну и напоследок вчера яндекс облако выпустило провайдер для тераформа http://amp.gs/VUIp
#terraform #github
tfmask — отличная штука для маскирования секретов из вывода terraform plan или apply http://amp.gs/VUIZ;
tfenv — другая утилита для упрощения использования переменных окружения с тераформом http://amp.gs/VUI7;
Ну и напоследок вчера яндекс облако выпустило провайдер для тераформа http://amp.gs/VUIp
#terraform #github
GitHub
GitHub - cloudposse/tfmask: Terraform utility to mask select output from `terraform plan` and `terraform apply`
Terraform utility to mask select output from `terraform plan` and `terraform apply` - GitHub - cloudposse/tfmask: Terraform utility to mask select output from `terraform plan` and `terraform apply`
Forwarded from Yandex Cloud
Хорошие новости под вечер вторника — у нас есть Terraform-провайдер .
Terraform — это инструмент, помогающий декларативно управлять облачной инфраструктурой. Состав инфраструктуры определяется с помощью конфигурационных файлов, в которых указываются требуемые облачные ресурсы и их параметры.
Подробнее о том, как использовать Terraform Provider for Yandex Cloud читайте в нашей документации.
#yacloud_news
Terraform — это инструмент, помогающий декларативно управлять облачной инфраструктурой. Состав инфраструктуры определяется с помощью конфигурационных файлов, в которых указываются требуемые облачные ресурсы и их параметры.
Подробнее о том, как использовать Terraform Provider for Yandex Cloud читайте в нашей документации.
#yacloud_news
yandex.cloud
Документация Yandex Cloud | Практические руководства | Начало работы с Terraform
Terraform позволяет быстро создать облачную инфраструктуру в Yandex Cloud и управлять ею с помощью файлов конфигураций. В файлах конфигураций хранится описание инфраструктуры на языке HCL (HashiCorp Configuration Language). При изменении файлов конфигураций…
Forwarded from Vladimir Utratenko
Не прошло 2х месяцев как появилось видео докладов с нашего экспериментального новогоднего митапа. Enjoy!
YouTube
Зачем нужно сообщество, или каково это быть оргом? // Александр Титов, Express42
"Зачем нужно сообщество, или каково это быть оргом?", Александр Титов (Express42)
Немного новогодних слов про то, что сообщество — это то, что помогает нам и нашим компаниям развивать совместно инженерные практики. Как это происходит и почему сообществу…
Немного новогодних слов про то, что сообщество — это то, что помогает нам и нашим компаниям развивать совместно инженерные практики. Как это происходит и почему сообществу…
Forwarded from CatOps
Статья о том, как в Dropbox автоматизируют конфигурацию своих датацентров
Так как Dropbox одни из первых (по крайней мере первые из громких) переехали из публичного облака на своё железо, там вам никакого Terraform’а — всё по хардкору с валидацией свичей, стресс-тестами и бенчмарками.
Так как Dropbox одни из первых (по крайней мере первые из громких) переехали из публичного облака на своё железо, там вам никакого Terraform’а — всё по хардкору с валидацией свичей, стресс-тестами и бенчмарками.
Forwarded from DevOps&SRE Library
Architecting for Reliability
Серия постов про то, какими способами можно улучшить надежность работы приложений.
Part 1 - Concepts:
https://medium.com/becloudy/architecting-for-reliability-part-1-concepts-17028343089
Part 2 - Resiliency and Availability Design Patterns for the Cloud:
https://medium.com/becloudy/architecting-for-reliability-part-2-resiliency-and-availability-design-patterns-for-the-cloud-cf7aaaed0df2
Part 3 - High Availability Architectures:
https://medium.com/becloudy/architecting-for-reliability-part-3-high-availability-architectures-8dfd0f87d25e
Серия постов про то, какими способами можно улучшить надежность работы приложений.
Part 1 - Concepts:
https://medium.com/becloudy/architecting-for-reliability-part-1-concepts-17028343089
Part 2 - Resiliency and Availability Design Patterns for the Cloud:
https://medium.com/becloudy/architecting-for-reliability-part-2-resiliency-and-availability-design-patterns-for-the-cloud-cf7aaaed0df2
Part 3 - High Availability Architectures:
https://medium.com/becloudy/architecting-for-reliability-part-3-high-availability-architectures-8dfd0f87d25e
Forwarded from HABR FEED + OPENNET
Пробую .NET Core + Kubernetes + appmetrics + prometheus + grafana + jobs + health checks
https://habr.com/ru/post/437286/
Tags: .NET, DevOps, kubernetes, .net core, prometheus, grafana, блог компании модульбанк, теги никто не читает, серьёзно
Author SanSYS on #habrahabr
https://habr.com/ru/post/437286/
Tags: .NET, DevOps, kubernetes, .net core, prometheus, grafana, блог компании модульбанк, теги никто не читает, серьёзно
Author SanSYS on #habrahabr
Хабр
Пробую .NET Core + Kubernetes + appmetrics + prometheus + grafana + jobs + health checks
Краткое знакомство с kubernetes для разработчиков на примере разворачивания простого шаблонного сайта, с постановкой его на мониторинг, выполнением джобов по расписанию и health checks (все исходники...
Forwarded from DevOps&SRE Library
Dapp / Werf
Ребята из Flant переписали Dapp c Ruby на Go и назвали его странным словом Werf. Определенно стоит обратить внимание - ребята настроены серьезно и проделали большую работу.
https://github.com/flant/werf
Ребята из Flant переписали Dapp c Ruby на Go и назвали его странным словом Werf. Определенно стоит обратить внимание - ребята настроены серьезно и проделали большую работу.
https://github.com/flant/werf
Forwarded from DevOps Deflope News
Google Customer Reliability Engineering только что открыли доступ к HTML-версии SRE Workbook http://amp.gs/VqWB
Теперь обе книги доступны бесплатно, с нормальным поиском, гиперссылками и прочим)
P.S. Спасибо за новость, Дмитрий
И напомню про курс
http://amp.gs/VqWx
Теперь обе книги доступны бесплатно, с нормальным поиском, гиперссылками и прочим)
P.S. Спасибо за новость, Дмитрий
И напомню про курс
http://amp.gs/VqWx
Ищем утечки памяти в наших приложениях на golang #memory #golang #oom https://medium.com/dm03514-tech-blog/sre-debugging-simple-memory-leaks-in-go-e0a9e6d63d4d
Medium
SRE: Debugging: Simple Memory Leaks in Go
Memory leaks are a class of bugs where memory is not released even after it is no longer needed. They are often explicit, and highly…
Forwarded from DevOps&SRE Library
Site Reliability Engineering | Технострим
Неплохая лекция из курса «Проектирование высоконагруженных систем» от Mail.ru Group про SRE
https://youtu.be/4VW4FGYHMPs
Неплохая лекция из курса «Проектирование высоконагруженных систем» от Mail.ru Group про SRE
https://youtu.be/4VW4FGYHMPs
Forwarded from Українська девопсарня
Do you have an SRE team yet? How to start and assess your journey https://cloud.google.com/blog/products/devops-sre/how-to-start-and-assess-your-sre-journey/
Forwarded from DevOps&SRE Library
Prometheus Alert Testing utility
PAT позволяет писать юнит тесты для алертов prometheus.
https://github.com/kevinjqiu/pat
PAT позволяет писать юнит тесты для алертов prometheus.
https://github.com/kevinjqiu/pat
Forwarded from Записки админа
💭 Tumblr Kubernetes Tools.
Почему-то коллеги об этом не пишут, хотя с kubernetes работают точно плотнее меня. 😉
Tumblr не так давно анонсировал открытие исходников своих нескольких утилит, которые они написали и используют сами, ну и приглашают сообщество познакомиться с инструментами. Сама новость, примеры и подробности по ссылке:
https://engineering.tumblr.com/post/182013497734/open-sourcing-our-kubernetes-tools
Утилиты на Github:
https://github.com/tumblr/k8s-config-projector
https://github.com/tumblr/k8s-secret-projector
https://github.com/tumblr/k8s-sidecar-injector
#kubernetes #github #напочитать
Почему-то коллеги об этом не пишут, хотя с kubernetes работают точно плотнее меня. 😉
Tumblr не так давно анонсировал открытие исходников своих нескольких утилит, которые они написали и используют сами, ну и приглашают сообщество познакомиться с инструментами. Сама новость, примеры и подробности по ссылке:
https://engineering.tumblr.com/post/182013497734/open-sourcing-our-kubernetes-tools
Утилиты на Github:
https://github.com/tumblr/k8s-config-projector
https://github.com/tumblr/k8s-secret-projector
https://github.com/tumblr/k8s-sidecar-injector
#kubernetes #github #напочитать
Forwarded from DevOps&SRE Library
Коллеги подсказывают, что в нативный promtool от разрабов прометеуса тоже возможность писать юнит тесты для алертов завезли:
https://www.robustperception.io/unit-testing-rules-with-prometheus
https://www.robustperception.io/unit-testing-rules-with-prometheus
Утилита от google для мониторинга сайтов/серверов извне - cloudeprober https://medium.com/dm03514-tech-blog/sre-availability-probing-101-using-googles-cloudprober-8c191173923c #google #monitoring #blackbox
Medium
SRE: Uptime: Probing 101 — Using Google’s Cloudprober
Blackbox uptime probes are simple, easy to operate and maintain checks which add a solid first level of system observability. Probes help…
По поводу cloudeprober нужно, наверное, дополнить - это скорее ещё один экспортер, т.е. не standalone, а именно prober
А вот тут обещают рассказать как ставить helm без tiller https://blog.tenx.tech/the-how-and-why-behind-tiller-less-helm-340a071d51c8 #helm #k8s #tiller
Official TenX Blog
The How and Why Behind Tiller-less Helm
If you use Kubernetes, you’ve probably heard of helm the Kubernetes package manager by now. Helm is very useful for installing packages on…