Мониторим ИТ – Telegram

Мониторим ИТ

8.07K subscribers

200 photos

2 files

1.52K links

Канал о наблюдаемости (Monitoring & Observability): логи, трейсы, метрики.

Реклама: @gals_ad_bot
Вопросы: @antoniusfirst

@usr_bin_linux — Linux, Kubernetes, Docker, Terraform, etc.

@zabbix_ru — только Zabbix

@elasticstack_ru — ElasticSearch/OpenSearch

Download Telegram

About

Blog

Apps

Platform

Мониторим ИТ

8.07K subscribers

Мониторим ИТ

Это не реклама, но я случайно наткнулся на пост на Хабре, что у издательства Питер распродажа до 22 сентября (50% на электрокниги, 30% на бумагу). По запросу «Site Reliability» на их сайте выдаются две книги и вы уже, думаю, догадываетесь какие. Неплохой шанс все-таки их прочитать, если на английском не очень-то и хотелось читать.

Купон на бумагу — Бумажная книга, купон на электрокниги — Электронная книга. Да, вот так вот незатейливо.

1.72K views04:00

Мониторим ИТ

# zabbix_get -s my.prod.host -k system.run["rm -rf /var/log/applog/"]

Эту команду и не только её можно выполнить удаленно на Linux сервере, отправив запрос через Zabbix-агент. Но т.к. на Linux агент выполняется без прав суперпользователя, это еще не так страшно, но с Windows дело может принять совсем другой оборот.

В этой статье на Хабре Тихон Усков, Инженер интеграции Zabbix, рассказывает о работе с черными и белыми списками для метрик на стороне агента. Советую прочитать, особенно, если используете активные проверки. Мониторинг — это хорошо, а безопасный мониторинг — ещё лучше.

2.79K views06:35

👍 6 👎👀 1

Открыть комментарии

Мониторим ИТ

Creating Monitoring Dashboards

Недавно наши команды в Hotels.com, входящей в Expedia Group, начали переходить с Graphite на платформу внутренних показателей, основанную на Prometheus. Мы увидели в этом возможность улучшить нашу наблюдаемость и, среди прочего, предоставили набор простых рекомендаций, которые помогут с миграцией. Читать на Медиуме.

Creating Monitoring Dashboards

Guidelines for developers

4K views06:52

Мониторим ИТ

Grafana 7 Arrives with Percona Monitoring and Management 2.10.0

Блог Percona

Percona Database Performance Blog

Grafana 7 Arrives with Percona Monitoring and Management 2.10.0 - Percona Database Performance Blog

We've just released Percona Monitoring and Management 2.10 and the biggest change is the upgrade to Grafana 7.

1.57K views07:46

Мониторим ИТ

Monitoring memory usage of a running Python program

В Survata мы обрабатываем много данных, используя Python и его библиотеки pandas и scikit-learn. Это означает, что мы используем большое количество облачных ресурсов и, в результате, наш ежемесячный счет за хостинг может быть огромным.

Один из способов сократить расходы на облачные ресурсы — убедиться, что мы не используем большее ресурсов, чем фактически необходимо. Облачные провайдеры позволяют легко развернуть сервер с несколькими ГБ ОЗУ, но если фактический рабочий процесс использует только часть этой памяти, вы тратите ресурсы и деньги впустую. Читать дальше на Медиуме.

2.66K views06:56

Мониторим ИТ

Новые шаблоны в Zabbix — IPMI, Mikrotik, MSSQL

В этой статье на Хабре расшифровка доклада Максима Чудинова с Zabbix Meetup, который был 28 августа 2020 года.

1.79K views12:08

Мониторим ИТ

Вернуть пропавший скутер, или история одного IoT мониторинга

Интересная статья о подборе системы мониторинга для электроскутеров (остановились в итоге на TICK) и история о пропавшем скутере. Читайте на Хабре.

1.86K views17:14

Мониторим ИТ

How I'm using Grafana and Prometheus to monitor my 3D printing

Читайте в блоге Grafana

How I'm using Grafana and Prometheus to monitor my 3D printing | Grafana Labs

In this guest blog post, Jonathan Stines shares his journey down the rabbit hole of monitoring dashboards for his 3D printer.

1.61K views09:59

Мониторим ИТ

Hammering nails into Kapacitor coffin

Георгий Шуклин в своём блоге на Медиуме рассказывает об отрицательном опыте работы с Kapacitor.

Hammering nails into Kapacitor coffin

2.49K views15:00

Мониторим ИТ

Forwarded from /usr/bin

Introducing kubectl flame: Effortless Profiling on Kubernetes

Profiling is the act of analyzing the performance of applications in order to improve poorly performing sections of code.
One of the most popular ways to visualize a profile and quickly identifying performance issues is by generating a Flame Graph. Читать дальше.

1.4K views18:08

Мониторим ИТ

О централизации журналов Docker

1.47K views07:09

Мониторим ИТ

Forwarded from /usr/bin

Centralize Your Docker Logging With Syslog

During one of the projects that I worked on in recent years, I had the task of integrating a centralized logging system with the applications stack we use (following a microservice architecture). Читать дальше.

Centralize Your Docker Logging With Syslog

The best way to understand our systems and their successes or failures is through great logging

1.5K views07:09

Мониторим ИТ

Семь «НЕ» мониторинга ИТ-инфраструктуры

Пару недель назад у этой статьи был двухлетний юбилей. А она как была актуальной так и остаётся. Автор, можно сказать, писал на века.

📌1. НЕ внедряйте инструмент мониторинга
📌2. Интегратор НЕ сделает за вас всей работы
📌3. НЕ путайте мониторинг и администрирование ИТ-инфраструктуры
📌4. НЕ рассчитывайте, что ваши подчиненные будут использовать мониторинг, если вы сами этого не делаете
📌5. НЕ заставляйте сотрудников работать с системой мониторинга
📌6. НЕ концентрируйтесь на проверке функциональности системы мониторинга во время ее испытаний
📌7. Мониторинг НЕ начнет приносить пользу, пока вы не начнете работать с ним и адаптировать его под свои потребности

2.67K views08:00

Мониторим ИТ

Мониторим ИТ pinned Deleted message

12:00

Мониторим ИТ

Кто занимается Zabbix, знает про его возможности обнаружения сетевых устройств. В Zabbix, обнаружение сетевых устройств возможно с Zabbix-сервера или Zabbix-прокси.

Вот вам реальный кейс. Есть сеть из нескольких сотен магазинов (а может быть аптек или заправок или кафе) со своими серыми внутренними IP-адресами и 1 белым, через который во внешний мир выглядывает маршрутизатор. Внутри каждого такого объекта к маршрутизатору подключена одна-две рабочих станции (на борту 1С с локальным PostgreSQL) и еще десяток устройств: веб-камеры, принтер и другое оборудование. Всё внутри работает через DHCP.

Самое логичное решение — установка на рабочие станции активного Zabbix-агента и сбор шаблонами метрик производительности рабочих станций, 1С, PostgreSQL и может какая-то базовая инвентаризация по железу или ПО. Агент ходит к Zabbix-серверу и запрашивает для себя проверки. Подключения, разумеется, через сертификат или PSK. Но есть вопрос: как обнаружить всё сетевое окружение рабочей и поставить его на мониторинг хотя бы по пингу, если установка Zabbix-прокси на и так загруженные рабочие станции полнейший оверкилл?

Решение такой задачи (не то, чтобы уж очень изящное): чтение ARP-таблиц рабочих станций (см. прикрепленный скриншот), дальнейшее обнаружение из нее новых узлов и включение пинговалки. Если немного усложнить решение, можно зафильтровать служебные адреса и автоматические добавлять в мониторинг только заранее заданный пул адресов.

Как вам такое решение? В комментариях можно поделиться мнением или рассказать о своих интересных задачах. Если у вас есть вопрос или нужен консалтинг по Zabbix, напишите в личные сообщения.

👍 — интересный подход, может пригодиться.

👎 — я знаю лучше. Расскажите в комментариях пжл.

👀 — у меня связная сеть и таких кейсов нет

1.7K views04:00

👍 23 👎 4 👀 4

Открыть комментарии

Мониторим ИТ

Prometheus High Availability and Fault Tolerance strategy, long term storage with VictoriaMetrics

Статья на Медиуме.

2.61K views12:00

Мониторим ИТ

Feed Prometheus with Locust: performance tests as a metrics’ source

Представленная здесь идея использует результаты нагрузочного теста Locust в качестве источника метрик Prometheus для построения графика результатов нагрузочного теста относительно потребления ресурсов кластера в Grafana. На Медиум!

Feed Prometheus with Locust: performance tests as a metrics’ source

How to use load test results as a Prometheus metrics’ source and graph them against cluster resource consumption in Grafana.

2.61K views04:00

Мониторим ИТ

Forwarded from /usr/bin

Centralized Monitoring System for Automated Tests with Elasticsearch and Kibana

В этом посте я хочу дать вам некоторую практическую информацию о системе мониторинга автоматических тестов. Я коснусь следующих тем:

⚡️ Зачем нужна система мониторинга для автоматизированных тестов

⚡️ Каковы потенциальные преимущества системы мониторинга

⚡️ Простой подход с использованием следующих технологий: Elasticsearch, Kibana, Firebase test lab, gcloud и gsutil, XCTest и Espresso.

Читать дальше на Медиуме.

1.52K views06:17

Мониторим ИТ

Zabbix HTTP Agent in use

Любопытная статья о мониторинге потребления CPU сервисом PythonAnywhere

Zabbix HTTP Agent in use

Monitor PythonAnywhere CPU usage

1.62K views08:00

Мониторим ИТ

Вчера на канале Дмитрия Ламберта, инженера из Zabbix, вышло видео об использовании и настройке throttling в Zabbix. Напомню, это подход, при котором дропаются одинаковые значения, что в итоге приводит к заметной экономии дисковых ресурсов под БД Zabbix. Выше публиковал об этом пост.

1.66K views12:55

Мониторим ИТ

Free SSL Certificates With Let’s Encrypt for Grafana & Prometheus-Operator Helm Charts

Если хотите обезопасить Grafana и Prom

Free SSL Certificates With Let’s Encrypt for Grafana & Prometheus-Operator Helm Charts

How to setup Free SSL certs with automated renewals using cert-manager and Let’s Encrypt for Grafana deployed on Kubernetes using Helm.

1.62K views15:00