Observability vs Monitoring: за что вы платите?
Интересный разбор того, за что вы платите при выборе системы мониторинга. Кажется, написано от первого лица.
«Мы начинали как стартап с 10 серверами. Поставили Prometheus + Grafana + ELK. Бесплатно! Ну, почти бесплатно — нужны были серверы для запуска. $500 в месяц за инфраструктуру. Красота!
Потом мы выросли до 100 серверов. ELK начал требовать уже 5 нод для нормальной работы. Prometheus нужен был federation для сбора метрик. Появился dedicated инженер, который этим занимался. $5,000 за инфраструктуру + $10,000 за инженера = $15,000 в месяц. Уже не так весело.
На 500 серверах self-hosted решение превратилось в отдельный проект. Три инженера фултайм занимались только поддержкой мониторинга. Апгрейды, траблшутинг, оптимизация. $50,000 в месяц только на зарплаты. Плюс инфраструктура. Плюс то, что эти инженеры не делали продукт.»
Интересный разбор того, за что вы платите при выборе системы мониторинга. Кажется, написано от первого лица.
«Мы начинали как стартап с 10 серверами. Поставили Prometheus + Grafana + ELK. Бесплатно! Ну, почти бесплатно — нужны были серверы для запуска. $500 в месяц за инфраструктуру. Красота!
Потом мы выросли до 100 серверов. ELK начал требовать уже 5 нод для нормальной работы. Prometheus нужен был federation для сбора метрик. Появился dedicated инженер, который этим занимался. $5,000 за инфраструктуру + $10,000 за инженера = $15,000 в месяц. Уже не так весело.
На 500 серверах self-hosted решение превратилось в отдельный проект. Три инженера фултайм занимались только поддержкой мониторинга. Апгрейды, траблшутинг, оптимизация. $50,000 в месяц только на зарплаты. Плюс инфраструктура. Плюс то, что эти инженеры не делали продукт.»
🔥10👍8👎2
Дашборды: между красотой и эффективностью
В современном мире дашборды стали неотъемлемой частью любого бизнеса. Однако часто мы сталкиваемся с тем, что красивые, но бесполезные панели данных не приносят реальной пользы. В этой статье разбираются основные проблемы создания дашбордов и посмотрим, как их решить на практике (на примере Apache Superset).
В современном мире дашборды стали неотъемлемой частью любого бизнеса. Однако часто мы сталкиваемся с тем, что красивые, но бесполезные панели данных не приносят реальной пользы. В этой статье разбираются основные проблемы создания дашбордов и посмотрим, как их решить на практике (на примере Apache Superset).
🔥8👍2
sql-to-logsql
Веб-приложение, предоставляющее пользовательский интерфейс для запросов к данным VictoriaLogs или VictoriaTraces с помощью SQL.
Он позволяет писать SQL-запросы к данным логов и мгновенно преобразовывать их в запросы VictoriaLogs LogsQL. При необходимости он может выполнять полученные запросы LogsQL в VictoriaLogs и управлять представлениями, хранящимися на диске.
Репыч на Гитхаб
@monitorim_it
Веб-приложение, предоставляющее пользовательский интерфейс для запросов к данным VictoriaLogs или VictoriaTraces с помощью SQL.
Он позволяет писать SQL-запросы к данным логов и мгновенно преобразовывать их в запросы VictoriaLogs LogsQL. При необходимости он может выполнять полученные запросы LogsQL в VictoriaLogs и управлять представлениями, хранящимися на диске.
Репыч на Гитхаб
@monitorim_it
🔥13👍5🤔3
This media is not supported in your browser
VIEW IN TELEGRAM
gdg
Grafana Dash-n-Grab (GDG) — простой в использовании интерфейс командной строки (CLI) для взаимодействия с API Grafana, позволяющим создавать резервные копии и восстанавливать дашборды, датасорсы и другие ресурсы.
Репыч на Гитхаб
@monitorim_it
Grafana Dash-n-Grab (GDG) — простой в использовании интерфейс командной строки (CLI) для взаимодействия с API Grafana, позволяющим создавать резервные копии и восстанавливать дашборды, датасорсы и другие ресурсы.
Репыч на Гитхаб
@monitorim_it
🔥15👍8
runtime-radar
Это решение с открытым исходным кодом для мониторинга событий безопасности в контейнерных средах.
Репыч на Гитхаб
@monitorim_it
Это решение с открытым исходным кодом для мониторинга событий безопасности в контейнерных средах.
Репыч на Гитхаб
@monitorim_it
🔥13👍2
🔥6👍2
На этом скриншоте вы видите сервисно-ресурсную модель интернет-магазина. А также пару проблем на фронтэнд и кэш-сервере. Решение нативно встраивается в Zabbix и позволяет отслеживать здоровье компонентов любого сервиса: интернет-банк, интеграции с внешними системами, порталы и т.д. и т.п.
Вам больше не придется искать сторонние решения для визуализации структуры сервисов. Называется оно IntelliTrend Advanced Services. О нём (и не только о нём) расскажет на вебинаре 11 ноября специально приглашенный гость.
А уже завтра, 5 ноября, Галс Софтвэр приглашает вас принять участие в вебинаре Структура базы данных Zabbix: что там под капотом. Начало в 11 мск 5 ноября. Этот вебинар уже анонсирован и регистрация на него открыта. Приходите!
Анонсы всех мероприятий по Zabbix и другую полезную информацию вы можете отслеживать в канале @zabbix_ru. Кстати, вчера там вышел пост со ссылками на 12 переводов статей по работе с Zabbix.
Вам больше не придется искать сторонние решения для визуализации структуры сервисов. Называется оно IntelliTrend Advanced Services. О нём (и не только о нём) расскажет на вебинаре 11 ноября специально приглашенный гость.
А уже завтра, 5 ноября, Галс Софтвэр приглашает вас принять участие в вебинаре Структура базы данных Zabbix: что там под капотом. Начало в 11 мск 5 ноября. Этот вебинар уже анонсирован и регистрация на него открыта. Приходите!
Анонсы всех мероприятий по Zabbix и другую полезную информацию вы можете отслеживать в канале @zabbix_ru. Кстати, вчера там вышел пост со ссылками на 12 переводов статей по работе с Zabbix.
🔥10👍2👎2🤔2
Масштабирование: создание платформы Prometheus + Loki производительностью 100 ТБ/день
Масштабирование окружения для наблюдаемости до 100 ТБ/день требует тщательного планирования и постепенных улучшений. В этой статье рассматриваются десять методов с объяснениями, диаграммами ASCII и фрагментами кода, которые помогут спроектировать, развернуть и эксплуатировать высоконагруженный стек наблюдаемости Prometheus и Loki, обеспечивающий бесперебойную обработку метрик и логов даже при большой нагрузке. Читать дальше.
Масштабирование окружения для наблюдаемости до 100 ТБ/день требует тщательного планирования и постепенных улучшений. В этой статье рассматриваются десять методов с объяснениями, диаграммами ASCII и фрагментами кода, которые помогут спроектировать, развернуть и эксплуатировать высоконагруженный стек наблюдаемости Prometheus и Loki, обеспечивающий бесперебойную обработку метрик и логов даже при большой нагрузке. Читать дальше.
🔥8👍6👎1
Поприветствуйте Observability 3.0
Если вы разработчик, SRE или инженер DevOps, вам интересно, что все это значит и с чего начать, то эта статья станет введением для новичков в эволюцию наблюдаемости — от версии 1.0 до сегодняшнего более интеллектуального, экономически обоснованного выбора.
P.S. В конце статьи приводятся две коммерческие системы, но у них есть вполне себе открыты аналоги.
Если вы разработчик, SRE или инженер DevOps, вам интересно, что все это значит и с чего начать, то эта статья станет введением для новичков в эволюцию наблюдаемости — от версии 1.0 до сегодняшнего более интеллектуального, экономически обоснованного выбора.
P.S. В конце статьи приводятся две коммерческие системы, но у них есть вполне себе открыты аналоги.
👍8🔥7
🔥12👍3
Grafana Mimir 3.0 release: performance improvements, a new query engine, and more
В 2022 году Grafana представила Grafana Mimir — многопользовательскую базу данных временных рядов (TSDB) с открытым исходным кодом, горизонтально масштабируемую и предназначенную для долгосрочного хранения метрик Prometheus и OpenTelemetry. За прошедшие годы Mimir стал популярным бэкендом для работы с метриками в сообществе разработчиков ПО с открытым исходным кодом, насчитывающим 30 разработчиков и более 4,7 тысяч звёзд на GitHub.
Разработка Mimir 3.0 заняла три года, и в этой статье в блоге Grafana рассказывают о нововведениях.
В 2022 году Grafana представила Grafana Mimir — многопользовательскую базу данных временных рядов (TSDB) с открытым исходным кодом, горизонтально масштабируемую и предназначенную для долгосрочного хранения метрик Prometheus и OpenTelemetry. За прошедшие годы Mimir стал популярным бэкендом для работы с метриками в сообществе разработчиков ПО с открытым исходным кодом, насчитывающим 30 разработчиков и более 4,7 тысяч звёзд на GitHub.
Разработка Mimir 3.0 заняла три года, и в этой статье в блоге Grafana рассказывают о нововведениях.
🔥9👍3❤1👎1
9 Logging Best Practices You Should Know
Логи — это не всё, что нужно для наблюдения , но их можно преобразовать из неструктурированных строк, разбросанных по серверам, в полезные сигналы, которые помогут получить ценную информацию. Список рекомендаций из этой статьи поможет вам в этом.
Логи — это не всё, что нужно для наблюдения , но их можно преобразовать из неструктурированных строк, разбросанных по серверам, в полезные сигналы, которые помогут получить ценную информацию. Список рекомендаций из этой статьи поможет вам в этом.
🔥13👍2❤1
What's new in ClickStack. October '25
Напомню, ClickStack — это observability-решение на базе HyperDX (интерфейс) и Clickhouse (хранилище). Каждый месяц они выпускают дайджест с обновлениями. Этот за октябрь 2025.
Уже совсем скоро нас ждет релиз облачной Yandex Observability Platform, которая решает примерно те же самые задачи. И мне было бы очень интересно узнать какое из решений более экономично по эксплуатации в плане хранения/инджеста. Это, наверное, самая большая статья расходов на обслуживание стека мониторинга после оплаты работы инженеров мониторинга по сопровождению платформы.
❗️Если на этот канал подписан кто-то из команды ClickStack, приходите в комментарии или ко мне в личку, договоримся о вебинаре для уважаемых подписчиков этого канала.
❗️Представителей Yandex Observability Platform я тоже приглашаю рассказать о продукте на нашу аудиторию.
Напомню, ClickStack — это observability-решение на базе HyperDX (интерфейс) и Clickhouse (хранилище). Каждый месяц они выпускают дайджест с обновлениями. Этот за октябрь 2025.
Уже совсем скоро нас ждет релиз облачной Yandex Observability Platform, которая решает примерно те же самые задачи. И мне было бы очень интересно узнать какое из решений более экономично по эксплуатации в плане хранения/инджеста. Это, наверное, самая большая статья расходов на обслуживание стека мониторинга после оплаты работы инженеров мониторинга по сопровождению платформы.
❗️Если на этот канал подписан кто-то из команды ClickStack, приходите в комментарии или ко мне в личку, договоримся о вебинаре для уважаемых подписчиков этого канала.
❗️Представителей Yandex Observability Platform я тоже приглашаю рассказать о продукте на нашу аудиторию.
👍8🔥6
Logging Cheat Sheet
Цель этой шпаргалки — предоставить разработчикам рекомендации по созданию механизмов ведения логов приложений, особенно касающихся логов безопасности.
Ведение лога приложений должно быть единообразным в пределах приложения, единообразным во всем портфеле приложений организации и, где это применимо, использовать отраслевые стандарты, чтобы зарегистрированные данные о событиях могли использоваться, сопоставляться, анализироваться и управляться самыми разными системами.
Цель этой шпаргалки — предоставить разработчикам рекомендации по созданию механизмов ведения логов приложений, особенно касающихся логов безопасности.
Ведение лога приложений должно быть единообразным в пределах приложения, единообразным во всем портфеле приложений организации и, где это применимо, использовать отраслевые стандарты, чтобы зарегистрированные данные о событиях могли использоваться, сопоставляться, анализироваться и управляться самыми разными системами.
🔥12👍3❤1👎1
Мониторинг Angie с Prometheus и Grafana
Контроль основных метрик веб‑сервера или балансировщика — основа надежной работы системы. Использование встроенного экспортера Prometheus и визуализация через Grafana дают принципиально другие возможности. В этой статье рассказывают как запустить полноценную систему мониторинга Angie.
Контроль основных метрик веб‑сервера или балансировщика — основа надежной работы системы. Использование встроенного экспортера Prometheus и визуализация через Grafana дают принципиально другие возможности. В этой статье рассказывают как запустить полноценную систему мониторинга Angie.
🔥10👍5
Gals Software и Zabbix приглашают вас на онлайн-митап 3 декабря
На вебинаре о нововведениях 8 версии расскажет СЕО Zabbix Алексей Владышев.
Программа вебинара (все выступления будут на русском языке)
🚀 Welcome Speech & Zabbix 8.0: A New Chapter in Monitoring
Alexei Vladishev, CEO & Founder, Zabbix, Latvia
🚀 Trigger Mastery in Zabbix: Practical Tips and Deep Insights Aleksandrs Petrovs-Gavrilovs, Zabbix Trainer, Zabbix, Latvia
🚀 The Power of Zabbix Tags Anton Kasimov, Zabbix Trainer, Gals Software, Kazakhstan
🚀 Zabbix Use Cases Samir Dzavadov, Head of Partnerships, Zabbix, Latvia
Регистрация
Еще больше анонсов мероприятий и другая полезная информация в канале @zabbix_ru
На вебинаре о нововведениях 8 версии расскажет СЕО Zabbix Алексей Владышев.
Программа вебинара (все выступления будут на русском языке)
🚀 Welcome Speech & Zabbix 8.0: A New Chapter in Monitoring
Alexei Vladishev, CEO & Founder, Zabbix, Latvia
🚀 Trigger Mastery in Zabbix: Practical Tips and Deep Insights Aleksandrs Petrovs-Gavrilovs, Zabbix Trainer, Zabbix, Latvia
🚀 The Power of Zabbix Tags Anton Kasimov, Zabbix Trainer, Gals Software, Kazakhstan
🚀 Zabbix Use Cases Samir Dzavadov, Head of Partnerships, Zabbix, Latvia
Регистрация
Еще больше анонсов мероприятий и другая полезная информация в канале @zabbix_ru
🔥7👍4❤1👎1
OpenTelemetry — не то, чем кажется…
Логи, метрики и трейсы появляются «по остаточному принципу»: что-то добавили при отладке, что-то прилетело из чужой либы, что-то настроили на проде. Итог — инженеры часами разбирают простые инциденты, а продуктовые команды теряют скорость.
В статье автор делится опытом: как они строят наблюдаемость в системах, почему OpenTelemetry — это больше чем идеология принципами которой они руководствуются.
Логи, метрики и трейсы появляются «по остаточному принципу»: что-то добавили при отладке, что-то прилетело из чужой либы, что-то настроили на проде. Итог — инженеры часами разбирают простые инциденты, а продуктовые команды теряют скорость.
В статье автор делится опытом: как они строят наблюдаемость в системах, почему OpenTelemetry — это больше чем идеология принципами которой они руководствуются.
🔥6👍5❤2
Kite
Kite — это лёгкий дашборд для управления и мониторинга кластеров Kubernetes с интуитивно понятным интерфейсом. Он отображает метрики в реальном времени, позволяет управлять ресурсами и поддерживает работу с несколькими кластерами.
Репыч на Гитхаб
@monitorim_it
Kite — это лёгкий дашборд для управления и мониторинга кластеров Kubernetes с интуитивно понятным интерфейсом. Он отображает метрики в реальном времени, позволяет управлять ресурсами и поддерживает работу с несколькими кластерами.
Репыч на Гитхаб
@monitorim_it
🔥8👍6🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
sqlwatch
SQLWATCH — это децентрализованное решение для мониторинга SQL Server в режиме реального или почти реального времени. Оно разработано для комплексного мониторинга прямо из коробки и может служить платформой для мониторинга ваших проектов или приложений. Оно собирает данные о производительности в локальной базе данных с возможностью централизованной отчётности для удобства.
Репыч на Гитхаб
SQLWATCH — это децентрализованное решение для мониторинга SQL Server в режиме реального или почти реального времени. Оно разработано для комплексного мониторинга прямо из коробки и может служить платформой для мониторинга ваших проектов или приложений. Оно собирает данные о производительности в локальной базе данных с возможностью централизованной отчётности для удобства.
Репыч на Гитхаб
🔥11👍3
VictoriaMetrics: взгляд вглубь
«Магия» проекта VictoriaMetrics, обеспечивающая основную функциональность и производительность, в основном происходит в бэкенд-коде Go, а именно в каталоге хранилища. В этой статье разобраны внутренности VM.
«Магия» проекта VictoriaMetrics, обеспечивающая основную функциональность и производительность, в основном происходит в бэкенд-коде Go, а именно в каталоге хранилища. В этой статье разобраны внутренности VM.
🔥4👎1
Экспертное руководство по мониторингу производительности BPF в Linux
Используя BPF, инженеры могут получить глубокий анализ своих систем без дополнительных затрат, связанных с традиционными инструментами мониторинга. Понимание того, как использовать его, — ключ к эффективной доступности и безопасности серверов Linux. Несколько примеров использования в этой статье.
Используя BPF, инженеры могут получить глубокий анализ своих систем без дополнительных затрат, связанных с традиционными инструментами мониторинга. Понимание того, как использовать его, — ключ к эффективной доступности и безопасности серверов Linux. Несколько примеров использования в этой статье.
🔥7👍2