Forwarded from Мониторим ИТ
Слышали про бесплатный инструмент автоматизации воркфлоу n8n.io? Это как Zapier или IFTTT, только энтерпрайзнее что ли. В своём блоге на Медиум они рассказывают о мониторинге и алертинге относительно БД Postgresql. Выглядит просто, но ничего ж не мешает использовать эту штуку для более масштабных задач автоматизации, верно?
Forwarded from Security Wine (бывший - DevSecOps Wine) (Denis Yakimov)
Understanding API Security, Justin Richer and Antonio Sanso
Неплохая книга по защите API в открытом доступе:
https://www.manning.com/books/understanding-api-security
#literature #web
Неплохая книга по защите API в открытом доступе:
https://www.manning.com/books/understanding-api-security
#literature #web
Forwarded from DocOps
Видео опубликовали. Напоминаю: на TechLeadConf рассказывали про инструменты для документации, с фокусом на доки от инженеров и для инженеров. Документирование кода, диаграммы и схемы, публикация в Confluence, вот это всё. Костя Валеев рассказал про Foliant, Семён Факторович — про Pandoc, а я про Sphinx.
https://youtu.be/4qv0YNtuRlE
https://youtu.be/4qv0YNtuRlE
YouTube
Мастер-класс "Чем публиковать Markdown и RST? Обзор современного документационного инструментария"
TechLeadConf 2020 Online
Онлайн-конференция, полностью посвященная инженерным процессам и практикам
https://techleadconf.ru/2020/abstracts/6943
Легковесные языки разметки (Markdown, reStructuredText, Asciidoc) победоносно шагают по планете. Markdown понимает…
Онлайн-конференция, полностью посвященная инженерным процессам и практикам
https://techleadconf.ru/2020/abstracts/6943
Легковесные языки разметки (Markdown, reStructuredText, Asciidoc) победоносно шагают по планете. Markdown понимает…
Forwarded from CatOps
Сага в четырёх частях от СЕО Percona Петра Зайцева о мониторинге производительности в Linux и типичных ошибках:
- Часть первая: CPU
- Часть вторая: Disk
- Часть третья: Memory
- Часть четвёртая: Network
Очень хороший разбор, рекомендую к прочтению 👍
#observability
- Часть первая: CPU
- Часть вторая: Disk
- Часть третья: Memory
- Часть четвёртая: Network
Очень хороший разбор, рекомендую к прочтению 👍
#observability
ma.ttias.be
How to measure Linux Performance Avoiding Most Typical Mistakes: CPU
Learn to measure Linux CPU performance correctly. Avoid load average mistakes, understand iowait vs CPU usage, and use eBPF and PSI for accurate metrics.
Forwarded from Мониторим ИТ
Как бороться с дублями в Elasticsearch при использовании FluentD читайте в этой статье на Хабре.
Хабр
Fluentd: почему важно настроить выходной буфер
В наше время невозможно представить проект на базе Kubernetes без стека ELK, с помощью которого сохраняются логи как приложений, так и системных компонентов кла...
Forwarded from Мониторим ИТ
SRE: Observability: Metric Namespaces and Structures
В этой статье о тайном оружии SRE — древовидном структурировании метрик в Prometheus. На заметку тем, кто не структурирует.
В этой статье о тайном оружии SRE — древовидном структурировании метрик в Prometheus. На заметку тем, кто не структурирует.
Forwarded from Библиотека программиста | программирование, кодинг, разработка
⛅ 10 лучших инструментов облачного мониторинга: плюсы и минусы
Преимущества и недостатки 10 инструментов мониторинга облачных приложений – опенсорсных и проприетарных программ, запускаемых в вебе или локально. Zabbix, Datadog, New Relic и другие.
https://proglib.io/sh/nMg45qN9df
Преимущества и недостатки 10 инструментов мониторинга облачных приложений – опенсорсных и проприетарных программ, запускаемых в вебе или локально. Zabbix, Datadog, New Relic и другие.
https://proglib.io/sh/nMg45qN9df
Библиотека программиста
⛅ 10 лучших инструментов облачного мониторинга: плюсы и минусы
Преимущества и недостатки 10 инструментов мониторинга облачных приложений – опенсорсных и проприетарных программ, запускаемых в вебе или локально. Zabbix, Datadog, New Relic и другие.
Forwarded from Мониторим ИТ
Про Skydive — инструмент для визуализации сетевой топологии на основе netflow, я уже как-то писал. Сегодня на Хабре вышла статья о добавлении ноды в Skydive топологию вручную через Skydive client. Эта возможность появилась благодаря Node rule API, которая появилась начиная с версии 0.20
Forwarded from Записки админа
This media is not supported in your browser
VIEW IN TELEGRAM
Forwarded from Мониторим ИТ
SRE: Performance Analysis: Tuning Methodology Using a Simple HTTP Webserver In Go
Методика работы SRE на примере тюнинга простого веб-сервера.
Методика работы SRE на примере тюнинга простого веб-сервера.
Forwarded from Мониторим ИТ
Tracing and Observability
Небольшая, но достаточно подробная статья о том, как устроены tracing и observability.
Небольшая, но достаточно подробная статья о том, как устроены tracing и observability.
Forwarded from Мониторим ИТ
Для обеспечения высокой доступности мы используем два кластера K8s. Графики ниже показывают эти кластеры: region-1 и region-2. Это создает дополнительную сложность, когда речь идет об автомасштабировании, поскольку кластеры полностью разделены и не имеют общих метрик. Наш веб-сайт работает в режиме active-active и сбалансирован по нагрузке на оба региона.
Из-за проблемы в приложении инженеры по инфраструктуре перевели все запросы к приложению в один регион. Зеленая линия показывает общее количество запросов, которые обслуживает служба, а две другие относятся к каждому региону. Сразу после 16:20 произошло аварийное переключение: оранжевая линия соединилась с зеленой линией, а синяя линия, идущая в ноле, начала расти.
В этой статье об изменении подходов компании к алертингу после максимального масштабирования сервиса из-за нештатной ситуации.
Из-за проблемы в приложении инженеры по инфраструктуре перевели все запросы к приложению в один регион. Зеленая линия показывает общее количество запросов, которые обслуживает служба, а две другие относятся к каждому региону. Сразу после 16:20 произошло аварийное переключение: оранжевая линия соединилась с зеленой линией, а синяя линия, идущая в ноле, начала расти.
В этой статье об изменении подходов компании к алертингу после максимального масштабирования сервиса из-за нештатной ситуации.
Medium
Kubernetes Lessons in Alerting
Live issues are a great opportunity to learn and improve. Here’s what happened to us
Forwarded from Мониторим ИТ
ElasticSearch On Steroids With Avro Schemas
https://towardsdatascience.com/elasticsearch-on-steroids-with-avro-schemas-3bfc483e3b30
https://towardsdatascience.com/elasticsearch-on-steroids-with-avro-schemas-3bfc483e3b30
Forwarded from Мониторим ИТ
Увлекательная 4-серийная сага «Practical Monitoring with Prometheus & Grafana».
Часть 1: Installing Prometheus + Grafana via Helm in 5 Minutes
Часть 2: Using Prometheus blackbox exporter for free uptime checks
Часть 3: Applying simple statistics for anomaly detection using Prometheus
Часть 4: Securing Grafana with Identity-Award Proxy
Часть 1: Installing Prometheus + Grafana via Helm in 5 Minutes
Часть 2: Using Prometheus blackbox exporter for free uptime checks
Часть 3: Applying simple statistics for anomaly detection using Prometheus
Часть 4: Securing Grafana with Identity-Award Proxy
Forwarded from Мониторим ИТ
А в этом репозитории одна штука, чтобы генерить дашборды Grafana из Python-скриптов. Полезно? Не то слово!
Forwarded from Мониторим ИТ
Lessons learned about monitoring the JVM in the era of containers
В этой статье об опыте использования бесплатных профилировщиков JVM VisualVM и Universal GC Log Analyzer.
В этой статье об опыте использования бесплатных профилировщиков JVM VisualVM и Universal GC Log Analyzer.