Мониторим ИТ
8.08K subscribers
201 photos
2 files
1.52K links
Канал о наблюдаемости (Monitoring & Observability): логи, трейсы, метрики.

Реклама: @gals_ad_bot
Вопросы: @antoniusfirst

@usr_bin_linux — Linux, Kubernetes, Docker, Terraform, etc.

@zabbix_ru — только Zabbix

@elasticstack_ru — ElasticSearch/OpenSearch
Download Telegram
Конвейер CI/CD для Java-приложения в Kubernetes + Jenkins

Теория — это хорошо, но подсмотреть чужой опыт на практике — бесценно. Специально для этой цели делимся с вами видео (https://youtu.be/adG0vq5boL8), где инженер за 3 часа строит пайплайн для Java-приложения в Kubernetes с помощью Jenkins. Каждое свое действие он объясняет, так что вопросов быть не должно.

По традиции предлагаем использовать Яндекс Браузер со встроенным синхронным переводчиком, если видео на английском пока даются тяжело 😉

Пользуйтесь и делитесь с коллегами 🤝

#kubernetes #devops #jenkins #nexus #docker #cicd #java

@DevOpsKaz
👍8👎1
Две статьи из блога Zabbix об анализе и трансформации данных внутри Zabbix

Zabbix in: Exploratory Data Analysis Rehearsal – Part 1. В этой статье рассказывают на примере мониторинга Nginx о создании новых метрик, которые помогут быстрее проводить диагностику нештатной работы сервиса.

Zabbix in: Exploratory Data Analysis Rehearsal – Part 2. Здесь разобран более продвинутый анализ метрик: стандартная девиация, персентиль, вариативность и другие.
👍51
Как использовать JMeter для нагрузочного тестирования и тестирования производительности

Apache JMeter — это инструмент для проведения нагрузочного тестирования, представляющий собой десктопное приложение с открытым исходным кодом на базе Java. JMeter позволяет определить, может ли тестируемое веб-приложение удовлетворять требованиям высокой нагрузки или нет. Он также помогает проанализировать работу всего сервера под высокой нагрузкой. Читать статью.
Как и зачем мы сделали свой мониторинг гипервизоров для виртуальных машин

В этой статье рассказано кастомном мониторинге гипервизоров: как его сделали, как он работает и какую пользу приносит. Решение выполнено для Openstack на базе Prometheus/Alertmanager/Grafana. Читать статью.
👍4
Alerting: The Do’s and Don’ts for Effective Observability

Статья об эффективном подходе к алертингу. Читать статью.
1👍1
SRE Evangelist

Несколько советов о том, как быть хорошим SRE. Читать дальше.
👍4
Prometheus Now Supports OpenTelemetry Metrics

Prometheus уже долгое время является основным средством мониторинга Kubernetes и облачных систем. Prometheus предоставляет полный стек, включая сбор метрик, а также бэкенд, включающий базу данных с временными рядами для хранения метрик, пользовательский интерфейс, AlertManager и многое другое.

Затем появился OpenTelemetry, который предлагает унифицированный способ сбора телеметрии наблюдаемости, включая трассировки, журналы и метрики. OpenTelemetry — самый активный проект в CNCF после Kubernetes, и он быстро становится стандартом сбора данных о наблюдаемости.

Но как сочетаются эти два чрезвычайно популярных проекта?
Если люди начинают собирать метрики с помощью OpenTelemetry, смогут ли они продолжать использовать Prometheus в качестве бэкенда для сбора метрик? Ответ на вопрос в статье.

❗️Статья на Медиум, возможно, нужен VPN.
👍4
Preparing your logging stack for a 10x scale using ELK & Kafka on Kubernetes

Urban Company рассказывает о собственном опыте скалирования инфраструктуры логирования. Читать статью.
👍31
Deploying Prometheus and Grafana monitoring stack to Kubernetes the GitOps way using ArgoCD

Деплой мониторинга K8S при помощи ArgoCD. Читать статью.

❗️Статья на Медиум, возможно, нужен VPN.
👍2
Zabbix + OpenStack

Zabbix представил шаблон для мониторинга OpenStack для версии 6.4. Посмотреть шаблон.
👍6👎1🤔1
What is My SLO and How do I Test It?

В этой статье рассказано как при помощи K6 определить SLO для ряда эндпоинтов демонстрационного сервиса K6 и как написать повторяющиеся тесты производительности этих SLO, чтобы следить за работой сервиса. Читать статью.

❗️Статья на Медиум, возможно, нужен VPN.
How to Calculate Reliability and High Availability in SRE!

В этой статье раскрываются технические детали реализации понятий SLO, SLI, SLA и показано, как создавать собственные дашборды, отвечающие специфическим потребностям. Читать статью.

❗️Статья на Медиум, возможно, нужен VPN.
👍2
Python Profiling — Why and Where Your Code is Slow

Сказ о профайлерах, которые помогут выявить недостатки кода на Python. Читать статью.

❗️Статья на Медиум, возможно, нужен VPN.
👍21
Best Practices for Monitoring and Improving Kafka Performance

Несколько советов по улучшению производительности и мониторингу Kafka. Читать статью.

❗️Статья на Медиум, возможно, нужен VPN.
🔥2
How to find unused Prometheus metrics using mimirtool

В этой статье рассказано, как с помощью mimirtool определить, какие метрики используются на платформе, а какие нет. Читать статью.

Prometheus performance and cardinality in practice

В этой статье рассказано об оптимизации производительности Prometheus. Читать статью.
👍5
teletrace

Teletrace — это распределенная система трассировки с открытым исходным кодом, которая помогает разработчикам контролировать и устранять неполадки в сложных распределенных системах, обеспечивая сквозной мониторинг и трассировку транзакций в различных микросервисах. Teletrace опирается OpenTelemetry.

Репыч на Гитхабе.
🔥5
Приемы логирования в Kubernetes

В этой статье на Хабре описаны приемы логирования Kubernetes и практики работы с логами. Читать статью.
👍6
Grafana Tempo 2.2 release: TraceQL structural operators are here!

Главной фишкой нового релиза, безусловно, являются структурные операторы. Структурные операторы позволяют пользователю очень четко и лаконично искать сложные структурные условия в трассировках вызовов. Подробности в статье в блоге Grafana.
👍6
Сага в двух частях:

Наблюдаемость сетевой инфраструктуры Kubernetes. Часть первая

В этой статье рассмотрены инструменты наблюдения за сетевой инфраструктурой Kubernetes и основные составляющие Observability/Наблюдаемости – мониторинг, журналы событий, метрики, распределенная трассировка и оповещения.

Наблюдаемость сетевой инфраструктуры Kubernetes. Часть вторая

В этой статье разобраны инструменты, базирующиеся на ранее озвученных подходах (Service Mesh, eBPF monitoring и Distributed Tracing). Для сравнения решений будет выбран единый сценарий, при развёртывании которого собираются метрики приложения и кластера k8s.
👍3🔥2
What's new in distributed trace visualization in Grafana

В этой рассказано о нескольких усовершенствованиях, которые были недавно внесены в Grafana и которые направлены на облегчение поиска нужной информации и отсеивание ненужной. Читать статью.
Мониторинг Postgres по USE и RED

Есть две методологии перформанс мониторинга: USE (Utilization, Saturation, Errors) Брендана Грегга и RED (Requests, Errors, Durations) от Тома Уилки. В этой статье (она же расшифровка доклада Павла Труханова из Okmeter с PGConf.Russia) рассказано о том, как ориентироваться на эти методологии при реализации мониторинга Postgres. Читать статью.
👍9