Мониторим ИТ
8.09K subscribers
214 photos
2 files
1.54K links
Канал о наблюдаемости (Monitoring & Observability): логи, трейсы, метрики.

Реклама: @gals_ad_bot
Вопросы: @antoniusfirst

@usr_bin_linux — Linux, Kubernetes, Docker, Terraform, etc.

@zabbix_ru — только Zabbix

@elasticstack_ru — ElasticSearch/OpenSearch
Download Telegram
Key Kubernetes Metrics and Resources to Monitor for Peak Cluster Performance

Показатели здоровья Kubernetes делятся на две категории:

Метрики о самом кластере Kubernetes, его состоянии и узлах в кластере
Метрики развернутых приложений и подов в Kubernetes

В этой статье мы расскажем о ключевых метриках Kubernetes, которые вы можете собрать, и о том, как их интерпретировать. Читать далее.
Вакансия!

Мы компания Комс – продуктовая компания, создающая собственную систему мониторинга и эксплуатации ИТ инфраструктуры. Мы ищем в команду инженера мониторинга.

У тебя будет возможность:
• Работать над клиентскими проектами для крупнейших b2b и b2g заказчиков на российском рынке;
• Работать со сложной развитой инфраструктурой (как собственной, так и клиентской);
•Решать большие и интересные задачи.

Что предстоит делать:
• Участвовать в роли инженера мониторинга в проектной деятельности компании;
• Сопровождать существующие и внедрять новые инструменты мониторинга;
• Участвовать в разборе сложных кейсов во время аварийных ситуаций;
• Принимать участие в проработке архитектуры мониторинга;
• Заниматься построением триггеров, графиков, реализацией сложных цепочек зависимостей оповещений.

Мы ожидаем:
• Опыт работы инженером мониторинга;
• Знание Linux на уровне системного администратора;
• Хорошие знания Zabbix, в том числе умение использовать препроцессинг (XMLPath, JSONPath, регулярные выражения);
• Опыт работы с Grafana - подключение источников данных, настройка дашбордов;
• Опыт работы с Kibana - просмотр логов, настройка фильтров, дашбордов;
• Опыт написания скриптов на python/bash;
• Умение работать с API (SOAP, REST, JSON-RPC) для получения различной статистики по работе веб-приложений или устройств;
• Опыт мониторинга сетевых устройств и серверного оборудования (мониторинг через SNMP, IPMI).

Будет большим плюсом:
• Понимание принципов построения мониторинга сервисов с использованием Prometheus/ VictoriaMetrics;
• Опыт мониторинга большой разветвленной инфраструктуры;
• Опыт мониторинга высоконагруженной инфраструктуры;
• Опыт работы с Ansible.

Мы предлагаем:
• Гибкий график работы;
• Офис в центре Москвы (гибридный формат);
• Повышение квалификации за счет компании;
• Компенсация ДМС, фитнеса и дополнительного образования;
• Команда профессионалов;
• Система наставничества.

Контакты для связи: @ekaterina_arimova
How to build your monitoring dashboards?

Несколько полезных рекомендаций по дашбордостроению. Читать дальше.
VictoriaMetrics: PromQL compliance

MetricsQL — это язык запросов, основанный на PromQL. Он используется в качестве основного языка запросов в VictoriaMetrics, базе данных временных рядов для мониторинга. MetricsQL обратно совместим с PromQL. Читать далее.
Good and Bad Monitoring

Плохой и хороший мониторинг. Несколько советов по организации эффективного мониторинга. Читать дальше.
How to pick the best observability solution for your organization

Инженерам и разработчикам доступно множество решений для мониторинга, так как же выбрать наиболее подходящее? Часто бывает так, что ни самое дорогое, ни самое дешевое решение для мониторинга не является ответом, когда вы начинаете свой путь к наблюдаемости, поэтому давайте рассмотрим основные решения, которые вам необходимо принять при выборе решения для мониторинга. Читать дальше.
Kubermetrics

Kubermetrics — это инструмент с открытым исходным кодом, который обеспечивает мониторинг кластера Kubernetes, а также визуализацию данных в простом и понятном пользовательском интерфейсе. Kubermetrics объединяет Prometheus и Grafana Dashboards в одном интерфейсе.

Репыч на Гитхабе.
Мониторинг Ceph

Как не пропустить падения и взлёты в жизни кластеров ceph с помощью prometheus или victoriametrics. Теория и практика мониторинга распределенного хранилища. Читать далее.
Key Kubernetes Metrics and Resources to Monitor for Peak Cluster Performance

Метрики Kubernetes, которые наиболее полно скажут о здоровье кластера. Читать дальше.
Grafana Loki and MinIO: A Perfect Match!

Grafana Loki становится одним из фактических стандартов для агрегации журналов в рабочих нагрузках Kubernetes, в этой статье мы покажем, как можно использовать Grafana Loki вместе с MinIO. Читать дальше.
Configure Grafana to Use Remote Database for HA

В этой статье мы настроим Grafana с удаленной базой данных, чтобы затем её масштабировать ее до N экземпляров.

База данных SQLite по умолчанию не будет работать при масштабировании более 1 экземпляра, поскольку база данных SQLite3 встроена в Grafana. Читать дальше.
A beginner’s guide to Jaeger

Эта статься — начало серии из 5 частей. В этой части руководство для начинающих по Jaeger. Читать дальше.
A beginner’s guide to OpenTelemetry

В этой статье основы работы с популярным инструментом для трассировки вызовов распределенных приложений — OpenTelemetry. Читать дальше.
How to set up monitoring tools for Java application

В этой вы узнаете, как настроить два инструмента мониторинга, которые широко используются для Java-приложений — Java Flight Recorder с JDK Mission Control и Prometheus с Grafana. Читать дальше.
Service Status Monitoring Using WhatsApp, Notion, and Python

В этой статье вы узнаете, как настроить автоматический мониторинг сервисов и получать уведомления WhatsApp при изменении их статуса. Будем использовать Notion для базы данных, WhatsApp Business API Twilio для получения уведомлений, GitHub Actions для выполнения задач по расписанию. Читать дальше.
Top PostgreSQL monitoring metrics for Prometheus – Includes cheat sheet

В этой статье ключевые метрики, которые вы можете собирать с PostgreSQL в Prometheus. Читать дальше.
Top PostgreSQL monitoring metrics for Prometheus – Includes cheat sheet

В этой статье вы узнаете о 10 основных метриках мониторинга PostgreSQL с примерами алертов как для экземпляров PostgreSQL в Kubernetes, так и для экземпляров AWS RDS PostgreSQL. Читать дальше.
NGINX Monitoring: Best Tools and Key Metrics You Should Know About

В этой статье вы узнаете об основных метриках NGINX, которые нужно измерять, и о инструментах мониторинга, которые могут помочь повысить производительность веб-сервера. Читать дальше.
End-to-end tracing with OpenTelemetry

Мониторинг — это только начало пути. Когда запросы или вызовы начинают массово отказывать, вам нужно агрегированное представление по всем компонентам. Это называется отслеживанием и является одним из столпов наблюдаемости; два других — это метрики и логи.

В этом посте я сосредоточусь исключительно на трассировках и опишу, как вы можете начать свой путь к наблюдаемости. Читать дальше.
Monika

Моника, моника, поиграем в слоника. Monika — это утилита, работающая из командной строки, для синтетического мониторинга с помощью простого файла конфигурации JSON. Репыч на Гитхабе.

Monika можно подключить к Prometheus. Статья на Медиум.
Uptime Kuma

Аптайм-мониторинг веб-страниц и веб-приложений, написанный на NodeJs. Репыч на Гитхабе.

Описание и принцип работы на Медиум.