Мониторим ИТ

Traditional vs Modern Incident Response

Некоторый ликбез о том, как докрутить систему реакции на инциденты до уровня не просто оповестить, а предотвратить в будущем, быстро найти похожее решение и т.д. Читать дальше.

3.66K views12:30

Мониторим ИТ

Monitor your PostgreSQL instances using Monika

Релиз Monika v1.13.3 был выпущен 17 октября 2022 года. В этой версии появилась возможность мониторинга PostgreSQL с использованием конфигураций Monika. Читать дальше.

2.67K views12:32

Мониторим ИТ

How do you keep track of the actual service level objectives?

О формировании различных типов SLO для оценки доступности приложений. Читать дальше.

2.74K views14:30

Мониторим ИТ

Site Reliability Engineering: What is a Toil?

Реактивная работа — тактическое быстрое решение проблемы. Если такая работа часто повторяется — это явные признаки повторяющегося труда (toil). Проактивная работа — это время, инвестированное в улучшения. В этой статье разбираются определения задач из обоих категорий и методы снижения временных затрат на реактивную работу. Читать дальше.

3.77K views06:30

Мониторим ИТ

Observability Mythbusters: Observability Anti-Patterns

Разрушители легенд о наблюдаемости. В этом несколько антипаттернов при использовании практик наблюдаемости. Читать дальше.

2.66K views12:30

Мониторим ИТ

Grafana, Prometheus, and Loki: Exploring Metrics and Logs

Воркшоп на примере демо-приложения. Читать.

3.77K views06:30

Мониторим ИТ

How to Install and Configure Graphite Monitoring System on Ubuntu 22.04

Небольшой воркшоп по установке Graphite. Читать дальше.

2.84K views12:30

Мониторим ИТ

Neo4j Slow Queries Monitor and more

Сбор данных в Prometheus и дальнейшее отображение в Grafana. Читать дальше.

2.9K views10:55

Мониторим ИТ

How to create a Grafana Alert Rule

Пример создания Alert rule в Grafana. Читать дальше.

4.04K views06:30

Мониторим ИТ

Zabbix Handy Tips: Extracting metrics from structured data with Zabbix preprocessing

Свежее видео в блоге Zabbix на Youtube. Рассказывают о том, как извлекать метрики из структурированных данных, таких как CSV, XML, JSON и других структур данных, с помощью предварительной обработки Zabbix. Смотреть.

3K views12:30

Мониторим ИТ

Dependency-Free Kubernetes Cluster Monitoring

Murre — это масштабируемый по запросу источник метрик для K8s.

Murre получает метрики ресурсов процессора и памяти непосредственно из kubelet на каждом узле K8s. Murre также обогащает ресурсы соответствующими запросами и ограничениями K8s из каждого PodSpec. В этой статье подробнее об этом инструменте.

Репыч на Гитхабе.

3.55K views10:22

Мониторим ИТ

А кто-то использует Icinga? В этой статье о безагентном мониторинге при помощи этого инструмента. Читать дальше.

2.61K views14:30

Мониторим ИТ

VaaS — инструмент для мониторинга kubernetes с возможностью интеграции с OpenFaaS.

Статья с описанием решения

Репыч на Гитхабе

2.52K views06:30

Мониторим ИТ

How to integrate grafana in our internal tools/admin panels using Auth proxy?

Когда нужна интеграция Grafana в реверс-прокси. В этой статье о том, как интегрировать grafana с внутренним приложением, используя прокси-модуль аутентификации grafana. Читать дальше.

3.77K views12:30

Мониторим ИТ

Setup Prometheus and Grafana to Monitor the K8s Cluster

Воркшоп про натягивание ~~совы на глобус~~ Prometheus и Grafana на кластер K8s. Читать дальше.

2.72K views06:30

Мониторим ИТ

Logging Bash History via Promtail, Loki and Grafana

В этом посте будет рассмотрена пошаговая настройка одного сервера для отображения всех введенных команд в консоли. Все перечисленные команды лучше всего использовать с автоматической настройкой инфраструктуры, потому что настройка этой функции на каждом сервере занимает очень много времени. Читать дальше.

4.24K views12:30

Мониторим ИТ

Monitoring applications in several Kubernetes clusters with Prometheus, Grafana and Loki

Предположим, что у вас есть 2 отдельных кластера K8S для двух сред. Мы не хотим дополнительной нагрузки на основной кластер, но все равно хотим получать оттуда нужные метрики и логи.

В приведенном ниже решении все части, которые могут создать дополнительную нагрузку, будут храниться в одном кластере [кластер № 1 на диаграмме] и иметь только необходимые инструменты в основном кластере [кластер № 2]. Читать дальше.

2.78K views06:30

Мониторим ИТ

Introducing Zurau: An Open-Source Kafka Monitoring & Notification App

Описание решения на Медиум

Репыч на Гитхабе

2.71K views12:30

Мониторим ИТ

Multi-hop tracing with OpenTelemetry in Golang

Корреляция нескольких событий и журналов критически необходима в распределенных системах (и не только для микросервисной архитектуры). OpenTelemetry поддерживает несколько решений для наблюдения, в этой статье основное внимание уделяется трассировке.

OpenTelemetry — это не только спецификация, это SDK для многих языков программирования (OTel SDK). В этой статье используется библиотека Golang для примера. В библиотеке Golang очень много функций, поэтому не очевидно, как активировать многохоповую трассировку. Более того, могут быть разные возможные решения для достижения целей. Читать дальше.

3.98K views08:00

Мониторим ИТ

22 tools to compute DORA metrics

Вот эти метрики:

⚡️Deployment Frequency — как часто организация успешно выпускает релизы в продуктивную среду.

⚡️Lead Time for Changes — количество времени, которое требуется для коммита в продуктивную среду.

⚡️Change Failure Rate — процент развертываний, вызвавших сбой в работе.

⚡️Time to Restore Service — сколько времени требуется организации для восстановления после сбоя в работе.

Очень часто говорят: «Эти метрики выглядят великолепно, но как мы их вычислим?». У каждой организации могут быть свои особенности, но если вы ищете готовые решения, помогающие вычислять эти показатели, вот список из 22 программных платформ. Подробностей тут не будет, рассматривайте этот пост как отправную точку для исследования.

Читать дальше.

4.25K views06:30

Мониторим ИТ

Announcing Grafana Phlare, the open source database for continuous profiling at massive scale

Grafana продолжает удивлять и радовать новыми решениями. На этот раз они анонсировали Phlare — горизонтально масштабируемый, высокодоступный инструмент для долгосрочного хранения данных профилирования. Phlare использует объектное хранилище (Amazon S3, Google Cloud Storage, Azure Blob Storage, OpenStack Swift и любое объектное хранилище, совместимое с S3), поэтому позволяет хранить историю без дополнительных затрат. Подробнее в блоге Grafana (+видео).

2.63K views06:30

About

Blog

Apps

Platform