Мониторим ИТ
8.1K subscribers
216 photos
2 files
1.55K links
Канал о наблюдаемости (Monitoring & Observability): логи, трейсы, метрики.

Реклама: @gals_ad_bot
Вопросы: @antoniusfirst

@usr_bin_linux — Linux, Kubernetes, Docker, Terraform, etc.

@zabbix_ru — только Zabbix

@elasticstack_ru — ElasticSearch/OpenSearch
Download Telegram
Announcing Grafana Phlare, the open source database for continuous profiling at massive scale

Grafana продолжает удивлять и радовать новыми решениями. На этот раз они анонсировали Phlare — горизонтально масштабируемый, высокодоступный инструмент для долгосрочного хранения данных профилирования. Phlare использует объектное хранилище (Amazon S3, Google Cloud Storage, Azure Blob Storage, OpenStack Swift и любое объектное хранилище, совместимое с S3), поэтому позволяет хранить историю без дополнительных затрат. Подробнее в блоге Grafana (+видео).
Migration from Thanos to Grafana Mimir

Воркшоп по миграции.
Kubernetes IO Problem Investigation

Во время одного из нагрузочных тестов команда столкнулась с проблемой задержки между двумя API, клиентский API получил тайм-ауты при доступе к серверному API, в то время как серверный API не имел большого времени отклика или такого же количества. ошибок. Помимо высокой нагрузки, единственным индикатором было ожидание ввода-вывода и увеличение времени чтения/записи диска. Команда увидела, что приложения достигают ограничений по CPU, которые определены YAML, время ответа ping между двумя IP-адресами было увеличенным, а API на стороне сервера работало нормально. Так что расследование было продолжено с командами инфраструктуры сети и OpenStack. Читать дальше.
Basics of YAML

При помощи YAML описываются конфигурации множества различных приложений, в том числе и мониторинговых. В этой статье необольшой обзор синтаксиса и рекомендаций по оформлению YAML-файлов. Читать дальше.
Собираем систему потоковой аналитики из логов приложений

В этой статье хочу поделиться с вами опытом построения системы мониторинга бизнес показателей в режиме реального времени, которая построена на основе сбора логов. В основе системы лежат события, которые генерируют приложения. События сохраняются в лог (stdout, файл,..). Обработчик (сборщик) логов (в режиме реального времени) распознает в логах события приложений и отправляет их в хранилище (БД). Читать дальше.
Использование Prometheus + Alertmanager + Node Exporter для мониторинга geo-распределенной инфраструктуры компании

В этой статье мы кратко рассмотрим варианты установки федерации Prometheus, Alertmanager и Node Exporter, остановимся на некоторых особенностях и конфигурации. Можно использовать установку из docker-compose файла или же развернуть систему в Kubernetes-кластере. Наша задача — собирать метрики серверов и сервисов инфраструктуры компании, хранить их, реагировать на алерты. Для решения этих задач необходима база данных. Читать дальше.
How to correlate performance testing and distributed tracing to proactively improve reliability

k6 x Tempo
Zabbix 6.4.0beta3

Вышла новая бета Zabbix 6.4. Из нововведений: появился аудит-лог для элементов данных и прототипов элементов данных, поддержка PostgreSQL 15, TSDB 2.8 и много чего другого. Подробнее.
Logging With Docker, Promtail and Grafana Loki

В этом посте описано использование Grafana Promtail для сбора всех журналов и отправки их в Grafana Loki. Читать дальше.
17 DevOps Metrics To Measure Success

Производительность в разработке программного обеспечения всегда было сложно измерить. Процесс разработки уникален тем, что требует разнообразного сочетания технических и коммуникативных навыков, что требует набора специализированных показателей DevOps для отслеживания жизненно важных показателей команды. Читать дальше.
How to configure OpenShift Monitoring/Grafana to monitor 3scale

Воркшоп по настройке.
Backups to the rescue! (Zabbix)

Из этой статьи вы узнаете, как настроить резервное копирование окружения Zabbix. Существует множество различных вариантов, поэтому вопрос резервного копирования сводится к выбору правильного варианта. Читать дальше.
Distributed Task Queue with Celery and Monitoring with Prometheus Metrics

В этой статье рассказывается о том, как использовать Celery и интегрировать его с Prometheus и Grafana. Будет реализован пример приложения Celery, чтобы подробно понять его внутренности. Статья также призвана ответить на вопросы, касающиеся мониторинга кластеров Celery с помощью Prometheus и Grafana. Читать дальше.
A Primer on Distributed Systems Observability

Из этого поста вы узнаете, как могут выглядеть системы наблюдения и мониторинга и шаблоны хорошей платформы наблюдения. Читать дальше.
How To Provisioning Dashboards In Grafana via Kubernetes

Небольшой how-to по созданию дашбордов в Grafana на основе данных из Kubernetes. Читать дальше.
Практическое руководство по реализации Observability в DevOps

В этой статье описан ход развертывания следующего стека инструментов Observability (наблюдаемости) Grafana:

⚡️Loki (логи);
⚡️Promtail (агент логов);
⚡️Tempo (трассировка);
⚡️Prometheus (метрики);
⚡️Cortex и Grafana Mimir (долгосрочное хранилище для данных Prometheus);
⚡️Alertmanager (обработка оповещений Prometheus);
⚡️Grafana (визуализация).

Читать дальше.
Как бесплатно мониторить массивы HP EVA с помощью Zabbix: два варианта решения

В данной статье рассмотрен процесс настройки мониторинга массивов семейства HP EVA (Enterprise Virtual Array) с помощью Zabbix, объясняется, как получать и обрабатывать данные с массива, показано, с какими проблемами можно столкнуться при настройке. Читать дальше.
Observability Solutions with Open Telemetry + OpenSearch

В этой статье описание использования OpenTelemetry и OpenSearch вместе с некоторыми зависимыми инструментами с открытым исходным кодом для создания решений для наблюдаемости. Читать дальше.
Introducing Grafana Faro, an open source project for frontend application observability

Grafana продолжает интегрировать всё новые и новые решения в свой стэк. На конференции ObservabilityCon 2022 был представлен преокт Grafana Faro.

Решение позволяет собирать метрики наблюдаемости с фронтэнд-приложений и имеет гибко настраиваемый веб-SDK. Затем эти телеметрические данные можно сопоставить с внутренними и инфраструктурными данными для беспрепятственного наблюдения за всем стеком. Читать дальше и смотреть видеозапись.
Grafana 9.3 release: что нового

Обновленная
навигация. Несколько основных моментов: страницы в Grafana теперь используют новые макеты, включающие хлебные крошки и боковую панель, что позволяет быстро переходить между страницами. Появился заголовок, который появляется на всех страницах в Grafana, что делает функцию поиска панели инструментов доступной с любой страницы.

Обновленные панели. В Geomap появился новый тип альфа-слоя, называемый фотослоем. Этот слой позволяет визуализировать фотографию в каждой точке данных.

Панель Canvas. Canvas — это новая панель, представленная в Grafana 9.2. Это расширяемые панели, построенные на основе форм, которые позволяют размещать элементы в статических и динамических макетах.

В Grafana 9.3 появилась поддержка сопоставления значений элементов на панели Canvas. Это позволяет динамически устанавливать элемент для отображения на основе ваших данных.

Улучшения в публичных дашбордах. В Grafana 9.3 представлен новый экран, на котором теперь вы можете управлять всеми своими публичными дашбордами в одном месте.

Отображение аннотаций на публичном дашборде. Аннотации теперь поддерживаются в публичных дашбордах, за исключением аннотаций запросов. По умолчанию они отключены, но их можно включить в настройках публичных панелей.

Новые трансформации: Partition by values. Эта новая трансформация может помочь устранить необходимость в нескольких запросах к одному и тому же источнику данных с разными предложениями WHERE при графическом отображении нескольких рядов.

LDAP: улучшение маппинга ролей. Если вы используете каталог LDAP для аутентификации в Grafana, но предпочитаете назначать организации и роли в пользовательском интерфейсе Grafana или через API, теперь вы можете пропустить синхронизацию ролей организации пользователей с вашим каталогом LDAP.

И другие улучшения.
Галс Софтвэр приглашает на вакантные должности специалистов по внедрению решений с открытым исходным кодом:

- ElasticSearch/OpenSearch (направления: логирование, безопасность, поиск, наблюдаемость)
- Zabbix/Grafana
- Prometheus/VictoriaMetrics/OpenTelemetry

У вас должен быть опыт внедрения/проектирования подобных систем в ролях инженера/архитектора. Мы предлагаем частичную занятость и удаленную работу. В перспективе возможны обучение и вендорская сертификация.

Можно откликнуться на hh.ru, либо прислать ваше резюме на hr@gals.software, либо написать нам в телеграм @galssoftware