Мониторим ИТ – Telegram

Мониторим ИТ

8.13K subscribers

228 photos

1 video

2 files

1.56K links

Канал о наблюдаемости (Monitoring & Observability): логи, трейсы, метрики.

Реклама: @gals_ad_bot
Вопросы: @antoniusfirst

@usr_bin_linux — Linux, Kubernetes, Docker, Terraform, etc.

@zabbix_ru — только Zabbix

@elasticstack_ru — ElasticSearch/OpenSearch

Download Telegram

About

Blog

Apps

Platform

Мониторим ИТ

8.13K subscribers

Мониторим ИТ

Tracing and Observability

Небольшая, но достаточно подробная статья о том, как устроены tracing и observability.

1.44K views17:15

Мониторим ИТ

Для обеспечения высокой доступности мы используем два кластера K8s. Графики ниже показывают эти кластеры: region-1 и region-2. Это создает дополнительную сложность, когда речь идет об автомасштабировании, поскольку кластеры полностью разделены и не имеют общих метрик. Наш веб-сайт работает в режиме active-active и сбалансирован по нагрузке на оба региона.

Из-за проблемы в приложении инженеры по инфраструктуре перевели все запросы к приложению в один регион. Зеленая линия показывает общее количество запросов, которые обслуживает служба, а две другие относятся к каждому региону. Сразу после 16:20 произошло аварийное переключение: оранжевая линия соединилась с зеленой линией, а синяя линия, идущая в ноле, начала расти.

В этой статье об изменении подходов компании к алертингу после максимального масштабирования сервиса из-за нештатной ситуации.

Kubernetes Lessons in Alerting

Live issues are a great opportunity to learn and improve. Here’s what happened to us

2.38K views04:30

Мониторим ИТ

ElasticSearch On Steroids With Avro Schemas

https://towardsdatascience.com/elasticsearch-on-steroids-with-avro-schemas-3bfc483e3b30

1.43K views10:40

Мониторим ИТ

Увлекательная 4-серийная сага «Practical Monitoring with Prometheus & Grafana».

Часть 1: Installing Prometheus + Grafana via Helm in 5 Minutes

Часть 2: Using Prometheus blackbox exporter for free uptime checks

Часть 3: Applying simple statistics for anomaly detection using Prometheus

Часть 4: Securing Grafana with Identity-Award Proxy

3.52K viewsedited 12:00

👍 7 👎👀

Открыть комментарии

Мониторим ИТ

А в этом репозитории одна штука, чтобы генерить дашборды Grafana из Python-скриптов. Полезно? Не то слово!

1.65K views14:00

Мониторим ИТ

Lessons learned about monitoring the JVM in the era of containers

В этой статье об опыте использования бесплатных профилировщиков JVM VisualVM и Universal GC Log Analyzer.

1.46K views06:00

Мониторим ИТ

How we scaled Graphite to 100,000 writes per second

В этой статье о вертикальном масштабировании вычислений до 100 000 операций записи в секунду.

А кто-то использует Graphite в своём стеке мониторинга?

👍 — использую

👎 — не использую

👀 — карандаши как-то не очень, обычно ручкой пользуюсь

1.4K views09:00

👍 7 👎 52 👀 3

Мониторим ИТ

Forwarded from /usr/bin

В этой статье несколько слов о мониторинге контейнеров Docker при помощи docker stats и cAdvisor.

591 views09:51

Мониторим ИТ

How the cortex and thanos projects collaborate to make scaling prometheus better for all

Коллаборация Cortex и Thanos для масштабирования Prometheus (в блоге Grafana)

А ещё есть запись выступления «Two Households, Both Alike in Dignity: Cortex and Thanos» с PromCon 2019 (выступают сооснователи Cortex и Thanos Tom Wilkie и Bartek Plotka соответственно)

How the Cortex and Thanos projects collaborate to make scaling Prometheus better for all | Grafana Labs

At PromCon Online, Marco Pracucci and Bartek Plotka talked about how Cortex and Thanos started to learn from and even influence each other – thanks to open source.

1.59K viewsedited 07:40

Мониторим ИТ

Monitoring Application Metrics With Nutanix Karbon

Пошаговое руководство по настройке кластера Karbon для мониторинга кластера и приложений и настройка представлений в Grafana.

1.57K views04:00

Мониторим ИТ

Instana сделала 6-минутный ролик с описанием работы их инструмента для APM-мониторинга распределённых приложений. Внимание! Внутри ролика мемасики.

Если вам интересно посмотреть Instana у себя — напишите в личку.

1.46K views05:34

Мониторим ИТ

Подписчик попросил разместить ролик с рассказом о предпосылках и внедрении APM-мониторинга Appdynamics в банке Санкт-Петербург (БСПБ). Рассказывает Алексей Тутуков — начальник управления мониторинга и реагирования БСПБ.

Забавно, что ребята взяли да и вставили в презентацию мою картинку с Мо шестилетней давности. Жаль, что даже лайков не отсыпали. А та картинка была в статье на Хабре о принципах мониторинга бизнес-приложений.

1.57K views06:00

Мониторим ИТ

NetXMS — как Solarwinds для желающих получить кое-что бесплатно. Это бесплатная система мониторинга с автоматическим дискаверингом L2 и L3, собирает метрики ОС, Oracle, MySQL, PostgreSQL, MongoDB, DB2, Tuxedo и другие. Система вроде как развивается, последний релиз был 16 июня 2020 года.

Вот тут прошлогодняя статья на Хабре.

2.06K views12:51

Мониторим ИТ

SRE: Анализ производительности. Способ настройки с использованием простого вебсервера на Go

Анализ производительности можно применять для проверки узких мест в программе, применяя научный подход при проверке экспериментов по настройке. Эта статья определяет общий подход к анализу производительности и настройке с использованием в качестве примера вебсервера на Go. Читать дальше на Хабре

1.9K views12:18

Мониторим ИТ

Интересно, Ozon как-то отслеживает такие проблемы на своём сайте? То есть ты готов уже оплатить, но что-то пошло не так. Главное, не пишут что именно. Перезагрузка страницы, переход в режим инкогнито или использование другого браузера не помогает. Не знаю есть ли среди подписчиков кто-то из Ozon, но если вы расскажете как у вас отрабатываются такие проблемы на сайте, думаю всем будет интересно. Пишите мне в личку.

1.41K viewsedited 08:02

Открыть комментарии

Мониторим ИТ

1.45K views08:10

Мониторим ИТ

Fluentd — Splitting Logs

В большинстве инсталляций Kubernetes у нас есть приложения с логированием в stdout различных типов журналов. Хорошим примером являются журналы приложений и журналы контроля доступа, оба содержат очень важную информацию, но мы должны анализировать их по-разному, чтобы сделать это, мы используем возможности fluentd и некоторых его плагинов.

В этом практическом посте мы объясним, как разделить эти журналы на параллельные потоки, чтобы вы могли в дальнейшем их обрабатывать.

Fluentd — Splitting Logs

In most kubernetes deployments we have applications logging into stdout different type of logs. A good example are application logs and…

1.54K views17:50

Мониторим ИТ

Redesigning Observability Logging

Статья — попытка переосмыслить подход к журналированию. Вышла на Медиуме 5 августа.

Redesigning Observability Logging

Bringing Context and Environment back to Event Collection

3.3K views04:00

Мониторим ИТ

Understanding Istio and TCP services

Используя реальный кейс, мы исследуем, как Istio направляет TCP-трафик и как избежать некоторых распространенных ошибок, с которыми мы столкнулись в самом начале пути.

Understanding Istio and TCP services

See how Istio build the Envoy proxy configuration for TCP Services in Kubernetes and how some unrelated resources can induce issues

2.63K views08:00

Мониторим ИТ

Отправка Nginx json логов с помощью Vector в Clickhouse и Elasticsearch

Будучи написанным на языке Rust, он отличается высокой производительностью и низким потреблением оперативной памяти по сравнению с аналогами. Кроме того, большое внимание уделено функциям, связанным с корректностью, в частности, возможностям сохранения неотправленных событий в буфер на диске и ротации файлов. Читать дальше…

2.72K views06:33

Мониторим ИТ

Systems Monitoring with Prometheus and Grafana (статья опубликована в блоге FlightAware — сервиса по отслеживанию полетов в реальном времени)

Hyperfeed — это основная система отслеживания полетов FlightAware. Её функционал используется в самых важных услугах компании: страницах с рейсами на веб-сайте, Firehose, FlightXML и предупреждениях о задержках рейсов. Так что если Hyperfeed перестает работать, то же самое происходит и с FlightAware. Читать дальше…

1.63K views12:30