Мониторим ИТ – Telegram

Мониторим ИТ

8.09K subscribers

202 photos

2 files

1.53K links

Канал о наблюдаемости (Monitoring & Observability): логи, трейсы, метрики.

Реклама: @gals_ad_bot
Вопросы: @antoniusfirst

@usr_bin_linux — Linux, Kubernetes, Docker, Terraform, etc.

@zabbix_ru — только Zabbix

@elasticstack_ru — ElasticSearch/OpenSearch

Download Telegram

About

Blog

Apps

Platform

Мониторим ИТ

8.09K subscribers

Мониторим ИТ

Observability Concepts you should know

Две статьи с концептами наблюдаемости. Описаны отличия мониторинг и наблюдаемости, SRE Golden Signals, распределенный трейсинг, работа с OpenTelemetry и многое другое.

Observability Concepts you should know (часть 1)

Observability Concepts you should know (часть 2)

❗️Статьи на Медиум, возможно, будет нужен VPN.

🔥5👍2

3.12K views06:30

Мониторим ИТ

gprofiler

gProfiler визуализирует то, на что тратит время процессор, отображая трассировку стека всех процессов, запущенных в системе, среди нативных программ (включая Golang), процессов Java и Python, а также процедур ядра.

Репыч на Гитхабе.

👍12

3.77K views13:00

Мониторим ИТ

bindplane-op

Это конвейер наблюдаемости с открытым исходным кодом, который дает возможность собирать и отправлять метрики, журналы и трассировки в любое хранилище.

Репыч на Гитхабе.

🔥3

2.76K views06:30

Мониторим ИТ

k8spacket

Визуализатор трафика для k8s с открытым исходным кодом.

Репыч на Гитхабе.

🔥7👍2

2.9K views12:00

Мониторим ИТ

tracetest

Тестировщик для распределенных приложений на базе OpenTelemetry с открытым исходным кодом.

Репыч на Гитхабе.

🔥2

2.57K views08:00

Мониторим ИТ

Effective SRE: SLO Engineering and Error Budget

В этой статье представлен обзор SLO Engineering как одной из ключевых обязанностей SRE. Описаны спецификации SLO/SLI, анализ требований надежности и бюджета ошибок. Читать статью.

❗️Статья на Медиум, возможно, будет нужен VPN.

👍4

2.67K views08:00

Мониторим ИТ

pg_activity

Утилита командной строки для мониторинга активности PostgreSQL.

Репыч на Гитхабе

Расскажите в комментариях что используете для мониторинга вашей PostgreSQL.

🔥15

3.01K views06:30

Мониторим ИТ

Postmortem, или как разобрать инцидент и ни с кем не разругаться (ну… или почти ни с кем)

Существуют разные подходы, политики, разные культуры и бескультурья составления Postmortem’ов. В этой статье автор кратко рассказывает о наиболее распространённых практиках и о самых популярных граблях. Читать дальше.

👍8

3.51K views16:23

Мониторим ИТ

Работа с процессами в Linux

Управление процессами является неотъемлемой частью администрирования серверных систем под управлением ОС Linux. В этой практической статье рассмотрены примеры решения различных задач по управлению процессами. Читать дальше.

👍4❤1🔥1

3.39K views06:30

Мониторим ИТ

Zabbix-мониторинг устройств IoT метеостанции с помощью Repka Pi

Эта статья посвящена Zabbix-мониторингу устройств IoT простой метеостанции, подключенных через порт GPIO к микрокомпьютеру отечественной сборки Repka Pi 3 производства НПО Рэйнбовсофт (Rainbowsoft). Здесь будут представлены скрипты мониторинга, измеряющие температуру, давление, влажность, освещенность, а также контролирующие наличие воды (затопление). Читать дальше.

👍6❤1🔥1

2.5K views09:30

Мониторим ИТ

Почему SRE приносит пользу командам и клиентам

SRE объединяет группы разработчиков программного обеспечения и эксплуатации, которые помогают создавать надежные, отказоустойчивые и масштабируемые системы. В этой статье-переводе некоторые подробности этой методологии. Читать дальше.

👍4❤1🔥1

2.65K views13:00

Мониторим ИТ

Логирование в Kubernetes: гайд как сохранить рассудок в море данных

Логирование — один из трех столпов observability в распределенных системах. Мы видим, как растут популярные продукты с открытым исходным кодом (например, ELK-стек) и зрелые коммерческие продукты (например, Splunk) для ведения логирования в больших масштабах. Однако в такой сложной системе, как Kubernetes, логирование остается серьезной проблемой. Она усугубляется с ростом данных и широким внедрением контейнерной системы.

В этой статье рассмотрены различные типы логов Kubernetes, необходимые для observability, а также подходы к сбору, объединению и анализу этих логов в Kubernetes. Затем мы представим решение с открытым исходным кодом, использующее fluentd и fluentbit, чтобы упростить ведение логов. Читать дальше.

🔥3👍2❤1

2.96K views13:00

Мониторим ИТ

Мониторинг активности пользователей OpenVPN при помощи Python

«Был у нас сервер OpenVPN, на котором скриптом собирались логи активности пользователей. Сервер заменили на новый, улучшенный, более безопасный и с несколько другой архитектурой работы. Сначала логи активности пользователей предполагали собирать тем же скриптом, но он наотрез отказался работать в новой инсталляции из-за ряда изменений в конфигурации сервера. Потребовалось новое решение, в пользу которого было и то, что изначальный скрипт формировал данные для отправки в базу InfluxDB, которая также планируется к выводу из эксплуатации. В связи с этим я решил разработать новый механизм, который будет готовить данные для нашей системы мониторинга — Zabbix.» Читать статью.

👍2

3.05K views06:30

Мониторим ИТ

Трейсим .NET микросервисы через OpenTelemetry

В этой статье описано подключение OpenTelemetry в ASP.NET Core проект + некоторые варианты его использования. Читать дальше.

👍2

3.23K views13:00

Мониторим ИТ

Как мы подключали распределенную трассировку через (внезапно) Sentry

Статья будет полезна для тех, кто уже использует Sentry, водится с микросервисами, но еще не пришел к распределенной трассировке, и скорее для небольших, средних или только начинающихся проектов. Если ваш проект уже большой и нагруженный, у вас и так все это настроено и на совсем другом стеке. Читать дальше.

👍3

3.41K views06:30

Мониторим ИТ

promlens

Утилита с веб-интерфейсом для создания запросов, их анализа и визуализации.

Репыч на Гитхабе.

👍6

4.21K views13:00

Мониторим ИТ

Breaking the memory barrier: How Grafana Mimir's store-gateway overcame out-of-memory errors

В этой статье разработчики Mimir рассказывают как оптимизируют утилизацию оперативной памяти на серверах с установленным движком Mimir. Читать дальше.

Также рекомендую другую прошлогоднюю статью: How we improved Grafana Mimir query performance by up to 10x

👍2

3.65K views13:22

Мониторим ИТ

A complete guide to managing Grafana as code: tools, tips, and tricks

В этой статье представлены несколько инструментов, которые можно использовать для декларативного управления ресурсами Grafana, а также советы и рекомендации по их эффективному применению при различных сценариях использования. Будут рассмотрены: Terraform, Ansible, Grafonnet для дашбордов, Grizzly, Grafana APIs с GitHub Actions и Crossplane. Читать дальше.

👍10🤔1

3.96K views06:00

Мониторим ИТ

cdebug — нож швейцарской армии для дебага контейнеров

При помощи этого инструмента вы можете:

⚡️Траблшутить неполадки в контейнерах, для которых нет оболочки и/или инструментов отладки
⚡️Перенаправлять неопубликованные или даже локальные порты на хост-систему
⚡️Открывать конечные точки из хост-системы для контейнеров и сетей Kubernetes
⚡️Удобно экспортировать файловую систему образа и/или контейнера в локальные папки
⚡️и многое другое

Репыч на Гитхабе.

Расскажите в комментариях как дебажите контейнеры.

🔥10👍2❤1

2.93K views13:00

Мониторим ИТ

How we tried using VictoriaMetrics and Thanos at the same time

В этой статье разобраны несколько способов оптимизации систем хранения для Prometheus. Читать дальше.

❗️Статья на Медиум, возможно, нужен VPN.

👍1

2.58K views06:00

Мониторим ИТ

How to Monitor Kubernetes API Server

В этой статье будут разобраны следующие темы:

⚡️Что такое API-сервер Kubernetes?
⚡️Как выполнять мониторинг API-сервера Kubernetes
⚡️Мониторинг API-сервера: Какие метрики следует проверять?
⚡️Заключение

Читать дальше

👍3🔥2

3.64K views13:00