Мониторим ИТ
8.1K subscribers
215 photos
2 files
1.54K links
Канал о наблюдаемости (Monitoring & Observability): логи, трейсы, метрики.

Реклама: @gals_ad_bot
Вопросы: @antoniusfirst

@usr_bin_linux — Linux, Kubernetes, Docker, Terraform, etc.

@zabbix_ru — только Zabbix

@elasticstack_ru — ElasticSearch/OpenSearch
Download Telegram
Airflow Tutorial — Monitoring Prometheus, StatsD and Grafana

В Airflow есть предустановленный демон под названием statsd. Statsd отправляет метрики на указанный порт, и эти метрики используются для мониторинга. Читать дальше.
SRE cheat sheet

Инструменты для полной проверки работоспособности системы, администрирования баз данных, тестов производительности и ссылки на соответствующую документацию. Читать дальше.
A Quick Introduction to Top Metrics & Tools to Track the Kubernetes Observability

Ключевые метрики доступности и производительности Kubernetes. Читать дальше.
Grafana alerts as code: Get started with Terraform and Grafana Alerting

Провайдер Terraform для Grafana Alerting. Статья в блоге Grafana.
Enable Istio stats monitoring with Grafana & Prometheus

В этом посте о том, как использовать инструменты для сбора метрик istio в Prometheus и визуализировать в Grafana. Читать дальше.
Top 20 Observability Tools Every Startup Should Know About in 2022

Облачные и on-prem решения. Читать дальше.
How to Forward Kubernetes Logs to Elasticsearch (ELK) using Fluent-bit and visualize it by kibana

В этой статье рассматривается настройка сбора логов Kubernetes в Elasticsearch. Читать дальше.
Distributed Tracing for Kafka with OpenTelemetry in Python

В этой статье об Apache Kafka, OpenTelemetry и о том, как они работают вместе с практическими примерами на Python.

Вы узнаете, как включить трассировку OpenTelemetry в Python для создания наборов данных для визуализации трассировок для Kafka. Читать дальше.
MariaDB: настройка и мониторинг с помощью Zabbix

От правильной настройки и надежной работы сервера СУБД зависит работоспособность и быстродействие интернет-магазинов, работающих на сервисе SAAS. То же самое относится к любым сайтам, если им нужна база данных.

Очень часто в качестве СУБД используется MySQL или MariaDB.

Из этой статьи вы узнаете, как установить сервер MariaDB в ОС Debian 11, как оптимизировать его параметры сразу после установки и как контролировать работу MariaDB вручную и с помощью Zabbix. Читать дальше.
Репликация MySQL и MariaDB: мониторинг с помощью Zabbix

Когда к отказоустойчивости интернет-магазина или другого сервиса с базами данных предъявляются повышенные требования, не обойтись без репликации серверов СУБД и файлов. Репликация совместно с другими технологиями отказоустойчивости помогает полностью защититься от сбоя оборудования, например, от выхода из строя отдельных серверов.

Из этой статьи вы узнаете, как настроить и проверить репликацию Master-Slave для MySQL и MariaDB, а также как контролировать ее работу с помощью Zabbix. Читать дальше.
What does “ — “ (double-dash) mean in the bash shell? And the difference between arguments and options

В этой статье об использовании двойного тире «- -» в оболочке. Но перед этим давайте разберемся с проблемой, с которой я столкнулся, и как она была решена с помощью «- -». Читать дальше.
How To Monitor Your Machine With One Spectacular CLI Tool — Btop

Вы когда-нибудь задумывались, почему ваш компьютер тормозит? Btop может не дать полного ответа, но он наверняка покажет вам возможные причины. Возможно, один процесс занимает много циклов процессора, или ваш раздел подкачки заполнен. Для этого вы можете использовать такие инструменты, как ps, df или swapon, или просто использовать btop и получить все на блюдечке с голубой каемочкой. Читать дальше.
Чем заменить New Relic: 11 альтернатив и наш выбор

Skyeng рассказывает чем они заменяли NewRelic (спойлер: Elastic APM). Elastic на сегодняшний день, наверное, самый лучший выбор для пользователей из России. Тем более бесплатно. Читать дальше.
Пять инструментов Site Reliability Engineering

⚡️Observability

⚡️Reliability architecture patterns

⚡️Proactive stability testing

⚡️Smart delivery of changes

⚡️Incident management

Читать дальше.
Is OpenTelemetry Mature Enough for Production? + The 4 Pillars of Observability Teams

Ответы на важные вопросы по инструменту для наблюдаемости OpenTelemetry. Читать дальше.
Как следить за кластером Kubernetes: 6 главных метрик, на которые нужно обращать внимание

Загвоздка с Kubernetes в том, что это не единая система, как, например, Redis RabbitMQ или PostgreSQL, а комбинация нескольких компонентов Control Plane: etcd, API-сервера и других. С помощью виртуальных машин или серверов они помогают контролировать пользовательские нагрузки, и от всех поступают огромные потоки метрик, в которых очень легко запутаться. Читать дальше.
Backups to the rescue!

В этой статье блога Zabbix вы узнаете, как настроить резервное копирование среды Zabbix. Есть множество различных вариантов этого процесса, поэтом остро стоит вопрос выбора правильного варианта. Читать дальше.
Introducing programmable pipelines with Grafana Agent Flow

Команда Grafana анонсировала новую возможность в релизе v0.28.0 Grafana Agent. Flow состоит из блоков, которые можно переиспользовать при сборе различной телеметрии. Читать дальше.
10+ Best MongoDB Monitoring Tools and Services [2022 Comparison]

Узнать, что за инструменты такие.
A Complete Guide to Tomcat Monitoring: How to, Metrics & Choosing the Best Tools

В этой статье ключевые показатели Tomcat, за которыми нужно наблюдать и несколько инструментов мониторинга. Читать дальше.