Forwarded from CatOps
Сага в четырёх частях от СЕО Percona Петра Зайцева о мониторинге производительности в Linux и типичных ошибках:
- Часть первая: CPU
- Часть вторая: Disk
- Часть третья: Memory
- Часть четвёртая: Network
Очень хороший разбор, рекомендую к прочтению 👍
#observability
- Часть первая: CPU
- Часть вторая: Disk
- Часть третья: Memory
- Часть четвёртая: Network
Очень хороший разбор, рекомендую к прочтению 👍
#observability
ma.ttias.be
How to measure Linux Performance Avoiding Most Typical Mistakes: CPU
This post is the first in a four-part blog series by Peter Zaitsev, Percona Chief Executive Officer.
Forwarded from Мониторим ИТ
Как бороться с дублями в Elasticsearch при использовании FluentD читайте в этой статье на Хабре.
Хабр
Fluentd: почему важно настроить выходной буфер
В наше время невозможно представить проект на базе Kubernetes без стека ELK, с помощью которого сохраняются логи как приложений, так и системных компонентов кла...
Forwarded from Мониторим ИТ
SRE: Observability: Metric Namespaces and Structures
В этой статье о тайном оружии SRE — древовидном структурировании метрик в Prometheus. На заметку тем, кто не структурирует.
В этой статье о тайном оружии SRE — древовидном структурировании метрик в Prometheus. На заметку тем, кто не структурирует.
Forwarded from Библиотека программиста | программирование, кодинг, разработка
⛅ 10 лучших инструментов облачного мониторинга: плюсы и минусы
Преимущества и недостатки 10 инструментов мониторинга облачных приложений – опенсорсных и проприетарных программ, запускаемых в вебе или локально. Zabbix, Datadog, New Relic и другие.
https://proglib.io/sh/nMg45qN9df
Преимущества и недостатки 10 инструментов мониторинга облачных приложений – опенсорсных и проприетарных программ, запускаемых в вебе или локально. Zabbix, Datadog, New Relic и другие.
https://proglib.io/sh/nMg45qN9df
Библиотека программиста
⛅ 10 лучших инструментов облачного мониторинга: плюсы и минусы
Преимущества и недостатки 10 инструментов мониторинга облачных приложений – опенсорсных и проприетарных программ, запускаемых в вебе или локально. Zabbix, Datadog, New Relic и другие.
Forwarded from Мониторим ИТ
Про Skydive — инструмент для визуализации сетевой топологии на основе netflow, я уже как-то писал. Сегодня на Хабре вышла статья о добавлении ноды в Skydive топологию вручную через Skydive client. Эта возможность появилась благодаря Node rule API, которая появилась начиная с версии 0.20
Forwarded from Записки админа
This media is not supported in your browser
VIEW IN TELEGRAM
Forwarded from Мониторим ИТ
SRE: Performance Analysis: Tuning Methodology Using a Simple HTTP Webserver In Go
Методика работы SRE на примере тюнинга простого веб-сервера.
Методика работы SRE на примере тюнинга простого веб-сервера.
Forwarded from Мониторим ИТ
Tracing and Observability
Небольшая, но достаточно подробная статья о том, как устроены tracing и observability.
Небольшая, но достаточно подробная статья о том, как устроены tracing и observability.
Forwarded from Мониторим ИТ
Для обеспечения высокой доступности мы используем два кластера K8s. Графики ниже показывают эти кластеры: region-1 и region-2. Это создает дополнительную сложность, когда речь идет об автомасштабировании, поскольку кластеры полностью разделены и не имеют общих метрик. Наш веб-сайт работает в режиме active-active и сбалансирован по нагрузке на оба региона.
Из-за проблемы в приложении инженеры по инфраструктуре перевели все запросы к приложению в один регион. Зеленая линия показывает общее количество запросов, которые обслуживает служба, а две другие относятся к каждому региону. Сразу после 16:20 произошло аварийное переключение: оранжевая линия соединилась с зеленой линией, а синяя линия, идущая в ноле, начала расти.
В этой статье об изменении подходов компании к алертингу после максимального масштабирования сервиса из-за нештатной ситуации.
Из-за проблемы в приложении инженеры по инфраструктуре перевели все запросы к приложению в один регион. Зеленая линия показывает общее количество запросов, которые обслуживает служба, а две другие относятся к каждому региону. Сразу после 16:20 произошло аварийное переключение: оранжевая линия соединилась с зеленой линией, а синяя линия, идущая в ноле, начала расти.
В этой статье об изменении подходов компании к алертингу после максимального масштабирования сервиса из-за нештатной ситуации.
Medium
Kubernetes Lessons in Alerting
Live issues are a great opportunity to learn and improve. Here’s what happened to us
Forwarded from Мониторим ИТ
ElasticSearch On Steroids With Avro Schemas
https://towardsdatascience.com/elasticsearch-on-steroids-with-avro-schemas-3bfc483e3b30
https://towardsdatascience.com/elasticsearch-on-steroids-with-avro-schemas-3bfc483e3b30
Forwarded from Мониторим ИТ
Увлекательная 4-серийная сага «Practical Monitoring with Prometheus & Grafana».
Часть 1: Installing Prometheus + Grafana via Helm in 5 Minutes
Часть 2: Using Prometheus blackbox exporter for free uptime checks
Часть 3: Applying simple statistics for anomaly detection using Prometheus
Часть 4: Securing Grafana with Identity-Award Proxy
Часть 1: Installing Prometheus + Grafana via Helm in 5 Minutes
Часть 2: Using Prometheus blackbox exporter for free uptime checks
Часть 3: Applying simple statistics for anomaly detection using Prometheus
Часть 4: Securing Grafana with Identity-Award Proxy
Forwarded from Мониторим ИТ
А в этом репозитории одна штука, чтобы генерить дашборды Grafana из Python-скриптов. Полезно? Не то слово!
Forwarded from Мониторим ИТ
Lessons learned about monitoring the JVM in the era of containers
В этой статье об опыте использования бесплатных профилировщиков JVM VisualVM и Universal GC Log Analyzer.
В этой статье об опыте использования бесплатных профилировщиков JVM VisualVM и Universal GC Log Analyzer.
Forwarded from @yegor256 news (yegor256)
You need a place to host your private Java artifacts (or Rubygems, NuGet, Docker, Npm, etc.)? You can use Artifactory or Nexus, but you will most likely have to pay for them. Instead, check Artipie (I'm one of its developers and it's open source). It's in beta-testing mode now and it's free for everybody. You heard it right: you can host your private artifacts for free! However, it's for good people only. To get an account there you have to come to our chat and ask for access: @artipie
Forwarded from Ihar Tigar
Сказ о том, как в Мазиле ML в CI внедряли: https://hacks.mozilla.org/2020/07/testing-firefox-more-efficiently-with-machine-learning/?utm_source=dev-newsletter&utm_medium=email&utm_campaign=July16-2020&utm_content=testingffx
Mozilla Hacks – the Web developer blog
Testing Firefox more efficiently with machine learning
A browser is an enormously complex piece of software, and it's always in development. About a year ago, we asked ourselves: how could we do better? Our CI relied heavily ...