Мониторим ИТ
8.09K subscribers
202 photos
2 files
1.53K links
Канал о наблюдаемости (Monitoring & Observability): логи, трейсы, метрики.

Реклама: @gals_ad_bot
Вопросы: @antoniusfirst

@usr_bin_linux — Linux, Kubernetes, Docker, Terraform, etc.

@zabbix_ru — только Zabbix

@elasticstack_ru — ElasticSearch/OpenSearch
Download Telegram
Sample vs Metrics vs Cardinality

В статье объясняются три эти понятия относительно работы с TSDB. Читать дальше.
👍2
Alerts, what are they good for?

Статья о работе с алертами: что такое алертинг, каким должен быть правильный алерт и т.д. Читать дальше.

А вы как-то управляете алертами в своей среде? Например, выполняете аудит или проверяете реагирует ли вообще кто-то на них.
👍2
pint

Линтер для Prometheus.

Репыч на Гитхабе
👍7
Understanding OpenTelemetry Collectors

Статья о том, как устроены коллекторы OpenTelemetry. Читать статью.

❗️Статья на Медиум, возможно, будет нужен VPN.
👍1
sampler

Утилита для визуализации метрик производительности и алертинга.

Репыч на Гитхабе.
👍6
End-to-end tracing with OpenTelemetry

Что такое трейсы и как устроен OpenTelemetry. Читать статью.
🔥4👍2
How to Configure Grafana to Use Remote Database for HA

Настройка Grafana для работы в отказоустойчивом режиме с PostgreSQL (вместо встроенной SQLite). Читать статью.

А вы используете внешнюю PostgreSQL для Grafana? Что побудило на неё перейти?
👍8
Yandex Cloud приглашает на Data Open Source Day

Это первая конференция от Yandex Cloud про Open Source инструменты для обработки данных и создания корпоративных хранилищ.

В программе Data Open Source Day:

🔹 Реальные бизнес-задачи, которые можно решать с помощью Open Source продуктов.
🔹 Эксперты из OZON, Яндекс, Битрикс24 и других компаний расскажут, как технологии с открытым исходным кодом помогают им в работе.
🔹 Какой вклад команда Yandex Cloud вносит в развитие ClickHouse® и Greenplum® .
🔹 Open Source продукты Яндекса для работы с данными: расскажем про YDB и YTsaurus.

Также вас ждёт доклад Яндекс Игр об опыте использования управляемых сервисов PostgreSQL, Redis, YDB. Рассказ о том, как Open Source помогает науке и при чём здесь озеро Байкал.

🗓 11 июля 2023, в 15:00. Участие бесплатное. Регистрация по ссылке.
👎1
17 DevOps Metrics To Measure Success

Описание специализированных DevOps-метрик. Среди них, конечно, DORA, количество запусков CI, количество успешных запусков CI и т.д. Читать статью.

Расскажите в комментариях какие DevOps-метрики используете у себя.
🔥3
Grafana Faro

Grafana Faro Web SDK - это JavaScript-агент с открытым исходным кодом, который внедряется в веб-приложения для сбора данных мониторинга реальных пользователей (RUM): метрики производительности, логов, исключений, событий и трассировок. Читать описание на сайте Grafana.

Репыч на Гитхабе.

Если пользовались Grafana Faro, расскажите о впечатлениях в комментариях.
🔥7👍1
Observability Concepts you should know

Две статьи с концептами наблюдаемости. Описаны отличия мониторинг и наблюдаемости, SRE Golden Signals, распределенный трейсинг, работа с OpenTelemetry и многое другое.

Observability Concepts you should know (часть 1)

Observability Concepts you should know (часть 2)

❗️Статьи на Медиум, возможно, будет нужен VPN.
🔥5👍2
gprofiler

gProfiler визуализирует то, на что тратит время процессор, отображая трассировку стека всех процессов, запущенных в системе, среди нативных программ (включая Golang), процессов Java и Python, а также процедур ядра.

Репыч на Гитхабе.
👍12
bindplane-op

Это конвейер наблюдаемости с открытым исходным кодом, который дает возможность собирать и отправлять метрики, журналы и трассировки в любое хранилище.

Репыч на Гитхабе.
🔥3
k8spacket

Визуализатор трафика для k8s с открытым исходным кодом.

Репыч на Гитхабе.
🔥7👍2
tracetest

Тестировщик для распределенных приложений на базе OpenTelemetry с открытым исходным кодом.

Репыч на Гитхабе.
🔥2
Effective SRE: SLO Engineering and Error Budget

В этой статье представлен обзор SLO Engineering как одной из ключевых обязанностей SRE. Описаны спецификации SLO/SLI, анализ требований надежности и бюджета ошибок. Читать статью.

❗️Статья на Медиум, возможно, будет нужен VPN.
👍4
pg_activity

Утилита командной строки для мониторинга активности PostgreSQL.

Репыч на Гитхабе

Расскажите в комментариях что используете для мониторинга вашей PostgreSQL.
🔥15
Postmortem, или как разобрать инцидент и ни с кем не разругаться (ну… или почти ни с кем)

Существуют разные подходы, политики, разные культуры и бескультурья составления Postmortem’ов. В этой статье автор кратко рассказывает о наиболее распространённых практиках и о самых популярных граблях. Читать дальше.
👍8
Работа с процессами в Linux

Управление процессами является неотъемлемой частью администрирования серверных систем под управлением ОС Linux. В этой практической статье рассмотрены примеры решения различных задач по управлению процессами. Читать дальше.
👍41🔥1
Zabbix-мониторинг устройств IoT метеостанции с помощью Repka Pi

Эта статья посвящена Zabbix-мониторингу устройств IoT простой метеостанции, подключенных через порт GPIO к микрокомпьютеру отечественной сборки Repka Pi 3 производства НПО Рэйнбовсофт (Rainbowsoft). Здесь будут представлены скрипты мониторинга, измеряющие температуру, давление, влажность, освещенность, а также контролирующие наличие воды (затопление). Читать дальше.
👍61🔥1
Почему SRE приносит пользу командам и клиентам

SRE объединяет группы разработчиков программного обеспечения и эксплуатации, которые помогают создавать надежные, отказоустойчивые и масштабируемые системы. В этой статье-переводе некоторые подробности этой методологии. Читать дальше.
👍41🔥1