Announcing Grafana Tempo, a massively scalable distributed tracing system
И целого Jaeger мало! В семействе Grafana пополнение. Перейти на распределенный трейсинг.
И целого Jaeger мало! В семействе Grafana пополнение. Перейти на распределенный трейсинг.
Pktvisor: Open source tool for network visibility
NS1 announced that pktvisor, a lightweight, open source tool for real-time network visibility, is available on Github. Читать дальше.
Репыч на Гитхабе.
NS1 announced that pktvisor, a lightweight, open source tool for real-time network visibility, is available on Github. Читать дальше.
Репыч на Гитхабе.
Zabbix под замком: включаем опции безопасности компонентов Zabbix для доступа изнутри и снаружи
А не пришло ли время разобраться и навести наконец-то порядок с безопасностью в мониторинге? Тем более, в одной из популярных систем мониторинга и встроенная возможность такая имеется. Читать дальше.
А не пришло ли время разобраться и навести наконец-то порядок с безопасностью в мониторинге? Тем более, в одной из популярных систем мониторинга и встроенная возможность такая имеется. Читать дальше.
@devopslibrary - Канал с актуальными книгами, новостями и гайдами по теме DevOps и Site Reliability Engineering.
Выбор SLO: пошаговая инструкция в блоге Гугл на примере интернет-магазина.
Forwarded from DevOps Tricks | Десять лет в IT
Нужен базовый мониторинг сетевых устройств, но zabbix или nagios избыточны?
Решение есть: Thola!
Thola проверет доступность и базовые показатели мониторинга сетевых устройств. Решение развивается, ждем дополнительную функциональность в следующих версиях.
https://github.com/inexio/thola
https://app.swaggerhub.com/apis-docs/TheFireMike/thola/1.0.0#/
#monitoring #свежак
Решение есть: Thola!
Thola проверет доступность и базовые показатели мониторинга сетевых устройств. Решение развивается, ждем дополнительную функциональность в следующих версиях.
https://github.com/inexio/thola
https://app.swaggerhub.com/apis-docs/TheFireMike/thola/1.0.0#/
#monitoring #свежак
GitHub
GitHub - inexio/thola: Tool for monitoring network devices (mainly using SNMP) - monitoring check plugin
Tool for monitoring network devices (mainly using SNMP) - monitoring check plugin - inexio/thola
How to use relabeling in Prometheus and VictoriaMetrics
Prometheus supports relabeling, which allows performing the following tasks:
⚡️ Adding new label
⚡️ Updating existing label
⚡️ Rewriting existing label
⚡️ Updating metric name
⚡️ Removing unneeded labels
⚡️ Removing unneeded metrics
⚡️ Dropping metrics on certain condition
⚡️ Modifying label names
⚡️ Chaining relabeling rules
Lets’ looks at how to perform each of these tasks. Читать дальше.
Prometheus supports relabeling, which allows performing the following tasks:
⚡️ Adding new label
⚡️ Updating existing label
⚡️ Rewriting existing label
⚡️ Updating metric name
⚡️ Removing unneeded labels
⚡️ Removing unneeded metrics
⚡️ Dropping metrics on certain condition
⚡️ Modifying label names
⚡️ Chaining relabeling rules
Lets’ looks at how to perform each of these tasks. Читать дальше.
Medium
How to use relabeling in Prometheus and VictoriaMetrics
Prometheus supports relabeling, which allows performing the following tasks:
Если у вас TICK или нечто похожее, есть хорошая новость:
InfluxDB 2.0 Open Source is Generally Available
Today, we are proud to announce that InfluxDB Open Source 2.0 is now generally available for everyone. It’s been a long road, and we couldn’t have done it without the amazing support and contributions of our community. This marks a new era for the InfluxDB platform, but it truly is just the beginning. Читать дальше.
InfluxDB 2.0 Open Source is Generally Available
Today, we are proud to announce that InfluxDB Open Source 2.0 is now generally available for everyone. It’s been a long road, and we couldn’t have done it without the amazing support and contributions of our community. This marks a new era for the InfluxDB platform, but it truly is just the beginning. Читать дальше.
InfluxData
InfluxDB 2.0 Open Source is Generally Available
Today, we are proud to announce that InfluxDB Open Source 2.0 is now generally available for everyone.
Trace discovery in Grafana Tempo using Prometheus exemplars, Loki 2.0 queries, and more
Let’s dig into some examples with a live playground to try it out! Читать дальше.
Let’s dig into some examples with a live playground to try it out! Читать дальше.
Grafana Labs
Trace discovery in Grafana Tempo using Prometheus exemplars, Loki 2.0 queries, and more | Grafana Labs
In this blog, we’ll explain how to use other data sources for trace discovery in Grafana Tempo, our new distributed tracing backend.
Низкоуровневое обнаружение (LLD) в Zabbix через SQL-запросы
В этой статье о мониторинге через обнаружение элементов данных в ответе на SQL-запрос. Этот тип мониторинга обычно используется в бизнес-мониторинге, когда собираются показатели производительности бизнес-процесса: количество пользователей, транзакций или выполняется контроль статуса операций. В целом, это универсальный подход, про который администраторы Zabbix иногда забывают. Читать дальше.
В этой статье о мониторинге через обнаружение элементов данных в ответе на SQL-запрос. Этот тип мониторинга обычно используется в бизнес-мониторинге, когда собираются показатели производительности бизнес-процесса: количество пользователей, транзакций или выполняется контроль статуса операций. В целом, это универсальный подход, про который администраторы Zabbix иногда забывают. Читать дальше.
Monitoring GitLab with Prometheus
Prometheus is a powerful time-series monitoring service, providing a flexible platform for monitoring GitLab and other software products. GitLab provides out of the box monitoring with Prometheus, providing easy access to high quality time-series monitoring of GitLab services. Читать дальше.
Prometheus is a powerful time-series monitoring service, providing a flexible platform for monitoring GitLab and other software products. GitLab provides out of the box monitoring with Prometheus, providing easy access to high quality time-series monitoring of GitLab services. Читать дальше.
MONITORING SPRING BOOT WITH PROMETHEUS AND GRAFANA
In a distributed landscape where we are working with microservices, serverless applications, or just event-driven architecture as a whole, observability, which comprises monitoring, logging, tracing, and alerting, is an important architectural concern. Читать дальше.
In a distributed landscape where we are working with microservices, serverless applications, or just event-driven architecture as a whole, observability, which comprises monitoring, logging, tracing, and alerting, is an important architectural concern. Читать дальше.
Как в Smarkets улучшили мониторинг для своих Kubernetes-кластеров
Автор этой статьи — ведущий инженер по инфраструктуре в Smarkets, что позиционирует себя как «одну из самых прибыльных [по доходам на каждого сотрудника] компаний в Европе». Работая с большой и чувствительной к мониторингу инфраструктурой на базе Kubernetes, инженеры компании нашли своё счастье с VictoriaMetrics, которая помогла им решить проблемы с Prometheus, возникшие после добавления новых K8s-кластеров. Читать дальше.
Автор этой статьи — ведущий инженер по инфраструктуре в Smarkets, что позиционирует себя как «одну из самых прибыльных [по доходам на каждого сотрудника] компаний в Европе». Работая с большой и чувствительной к мониторингу инфраструктурой на базе Kubernetes, инженеры компании нашли своё счастье с VictoriaMetrics, которая помогла им решить проблемы с Prometheus, возникшие после добавления новых K8s-кластеров. Читать дальше.
Хабр
Как в Smarkets улучшили мониторинг для своих Kubernetes-кластеров
Прим. перев.: автор этой статьи — ведущий инженер по инфраструктуре в Smarkets, что позиционирует себя как «одну из самых прибыльных [по доходам на каждого сотру...
How to Build Grafana Dashboards with InfluxDB, Flux and InfluxQL
We’re excited about the release of Grafana 7.1, which extends Grafana’s built-in InfluxDB datasource to run queries in both the Flux language and InfluxQL. This means it’s super easy to connect Grafana to InfluxDB — whether you use InfluxDB 1.8 or 2.0, Flux or InfluxQL. Читать дальше.
We’re excited about the release of Grafana 7.1, which extends Grafana’s built-in InfluxDB datasource to run queries in both the Flux language and InfluxQL. This means it’s super easy to connect Grafana to InfluxDB — whether you use InfluxDB 1.8 or 2.0, Flux or InfluxQL. Читать дальше.
Medium
How to Build Grafana Dashboards with InfluxDB, Flux and InfluxQL
We’re excited about today’s release of Grafana 7.1, which extends Grafana’s built-in InfluxDB datasource to run queries in both the Flux…
Попытка побороть шумовые события при помощи ML. Получилось результативно.
Хабр
Действительно ли полезен ML для снижения шума от алертов? Изучаем на примере одного метода
Предыстория Последние пару лет рынок систем мониторинга будоражила аббревиатура AIOps. Все вендоры начали гнаться за использованием искусственного интеллекта в своих сложных и дорогих системах....
One Grafana Dashboard With Multiple Prometheus Datasources
In this article, the following aspects of using Prometheus and Grafana will be demonstrated:
⚡ One Grafana server presenting data from multiple Prometheus resources.
⚡ Each dashboard would show only selected Prometheus datasources (not all configured datasources are relevant to all of the dashboards).
⚡ Present only the relevant data from each datasource according to the dashboard content. (For example in case the dashboard panel present one storage mount which has a different mount requirements per server).
⚡️ Useful dashboards for your needs:
- Host / VM Resources ( CPU, RAM, Storage and I/O, Network).
- Docker Containers (Use of resources per container).
Читать дальше.
In this article, the following aspects of using Prometheus and Grafana will be demonstrated:
⚡ One Grafana server presenting data from multiple Prometheus resources.
⚡ Each dashboard would show only selected Prometheus datasources (not all configured datasources are relevant to all of the dashboards).
⚡ Present only the relevant data from each datasource according to the dashboard content. (For example in case the dashboard panel present one storage mount which has a different mount requirements per server).
⚡️ Useful dashboards for your needs:
- Host / VM Resources ( CPU, RAM, Storage and I/O, Network).
- Docker Containers (Use of resources per container).
Читать дальше.
Medium
One Grafana Dashboard With Multiple Prometheus Datasources
In this article, the following aspects of using Prometheus and Grafana will be demonstrated:
Расчет перцентилей для мониторинга высоконагруженных систем
При мониторинге часто требуется использовать перцентили. Они позволяют понять, как система работает бóльшую часть времени, в отличие от усреднения значений, которое сильно подвержено влиянию выбросов. Если 9 из 10 запросов выполняются за 1 секунду, а один за 10 секунд, то среднее будет 1,9 секунды, а 50-перцентиль — 1 секунда. Это лишь один пример того, что среднее значение не подходит для мониторинга. Возникает необходимость считать перцентили, для этого мы добавили в tarantool/metrics Summary-коллектор. Читать дальше.
При мониторинге часто требуется использовать перцентили. Они позволяют понять, как система работает бóльшую часть времени, в отличие от усреднения значений, которое сильно подвержено влиянию выбросов. Если 9 из 10 запросов выполняются за 1 секунду, а один за 10 секунд, то среднее будет 1,9 секунды, а 50-перцентиль — 1 секунда. Это лишь один пример того, что среднее значение не подходит для мониторинга. Возникает необходимость считать перцентили, для этого мы добавили в tarantool/metrics Summary-коллектор. Читать дальше.
Хабр
Расчет перцентилей для мониторинга высоконагруженных систем
Привет, меня зовут Игорь, и я разработчик решений на Tarantool в Mail.ru Group. Я работаю над витринами маркетинга в реальном времени для Мегафона. При мониторинге часто требуется использовать...
Галс Софтвэр и Broadcom приглашают на вебинар по зонтичной системе мониторинга DX Operations Intelligence
Основа DX OI — это современная распределенная облачная архитектура. В решении реализованы механизмы Machine Learning над всеми поступающими данными как из доменных решений Broadcom, так и от сторонних систем через REST API, таких как Zabbix, SCOM и других популярных систем. Основная функция DX OI — создание полноценной ресурсно-сервисной модели (РСМ) на базе конфигурационных единиц (КЕ), наполняющих инвентарную базу при интеграции со сторонними системами. Важная особенность DX OI — возможность спрогнозировать отказ КЕ в будущем и оценить степень его вляиние на доступность сервиса.
Вебинар состоится в пятницу 27 ноября в 11 часов утра по московскому времени на площадке Zoom.
⚡️ Регистрация на вебинар
⚡️ Статья на Хабре с описанием возможностей
Основа DX OI — это современная распределенная облачная архитектура. В решении реализованы механизмы Machine Learning над всеми поступающими данными как из доменных решений Broadcom, так и от сторонних систем через REST API, таких как Zabbix, SCOM и других популярных систем. Основная функция DX OI — создание полноценной ресурсно-сервисной модели (РСМ) на базе конфигурационных единиц (КЕ), наполняющих инвентарную базу при интеграции со сторонними системами. Важная особенность DX OI — возможность спрогнозировать отказ КЕ в будущем и оценить степень его вляиние на доступность сервиса.
Вебинар состоится в пятницу 27 ноября в 11 часов утра по московскому времени на площадке Zoom.
⚡️ Регистрация на вебинар
⚡️ Статья на Хабре с описанием возможностей
How we eliminated service outages from ‘certificate expired’ by setting up alerts with Grafana and Prometheus
There’s one thing most of the customers have in common: At one point or another, expired certificates have caused a problem. In theory, they shouldn’t; the exact expiration date is known, and so is the process for updating. But still the problems persist!
In this blog post, we present a simple yet effective solution: Monitor the expiration date of certificates with Prometheus and visualize it with Grafana, using features from the new table visualization in Grafana 7. Читать дальше.
There’s one thing most of the customers have in common: At one point or another, expired certificates have caused a problem. In theory, they shouldn’t; the exact expiration date is known, and so is the process for updating. But still the problems persist!
In this blog post, we present a simple yet effective solution: Monitor the expiration date of certificates with Prometheus and visualize it with Grafana, using features from the new table visualization in Grafana 7. Читать дальше.
Monitoring the Mattermost server with Prometheus and Grafana
We’ve been using Prometheus and Grafana to monitor our cluster for a while now, and you can read this great post where my colleague Stylianos explains how we have them working for our multi-cluster environment. Читать дальше.
We’ve been using Prometheus and Grafana to monitor our cluster for a while now, and you can read this great post where my colleague Stylianos explains how we have them working for our multi-cluster environment. Читать дальше.
Mattermost.com
Monitoring the Mattermost server with Prometheus and Grafana
Lately we've been working on improving different parts of the Mattermost server, including our monitoring and observability capabilities using Prometheus and Grafana.
Prometheus и VictoriaMetrics: отказоустойчивая инфраструктура для хранения метрик
Стек, о котором пойдёт речь: Prometheus, Alertmanager, Pushgateway, Blackbox exporter, Grafana и VictoriaMetrics. Читать дальше.
Стек, о котором пойдёт речь: Prometheus, Alertmanager, Pushgateway, Blackbox exporter, Grafana и VictoriaMetrics. Читать дальше.