Dev0ps
39 subscribers
219 photos
3 videos
51 files
3.35K links
Download Telegram
Forwarded from /usr/bin
How to Run CIS benchmark in Linux

Центр интернет-безопасности (CIS) — некоммерческая организация, занимающаяся поиском и продвижением передовых политик и стандартов кибербезопасности. Он разрабатывает и продвигает рекомендации по ИТ-безопасности при поддержке сети экспертов по кибербезопасности.

CIS Benchmarks — это стандарты конфигурации для ряда ИТ-технологий и систем. Эти системы, которые могут варьироваться от программного обеспечения для настольных компьютеров до мобильных устройств, являются важной частью каждой современной компании. CIS Benchmarks являются важным компонентом любой стратегии управления ИТ, поскольку они содержат конкретные рекомендации по передовому опыту, разработанные сообществом экспертов.

В этой статье рассказывают как применить эти бенчмарки к вашей среде Linux, чтобы убедиться в безопасности окружения.
Forwarded from Мониторим ИТ
The mathematics behind monitoring

Статья про использование математических функций в Prometheus. Читать дальше.
Forwarded from /usr/bin
Top 25 Nginx Tips and Tricks From Practical Experience

Эта статья удобна для новичков, поскольку данные представлены от простого к сложному. Когда я начинал свою карьеру DevOps-инженера, мне не хватало таких материалов. Я постараюсь рассказать о том, как работает Nginx, а также о некоторых советах и рекомендациях из практического опыта. Читать дальше.
Forwarded from Мониторим ИТ
Multi-site monitoring with HA and dynamic scale using VictoriaMetrics. A Practical guide

Это продолжение предыдущего поста What makes VictoriaMetrics the next leading choice for open-source monitoring. Цель этой статьи — рассказать, как спроектировать и развернуть многосайтовую кластерную архитектуру VictoriaMetrics в Kubernetes, которая работает на узлах Spot и On-demand и обеспечивает высокую доступность, динамическую масштабируемость, высокую производительность и экономию средств. Читать дальше.
Forwarded from /usr/bin
Filtering files and folders in Linux using find and grep

Фильтрация файлов и директорий при помощи пайпов, паттернов, match, find, grep и других инструментов. Читать дальше.
Forwarded from Мониторим ИТ
Karma — единый событийный дашборд для кучи Alertmanager'ов

Агрегация, дедупликация, фильтрация и много других фич в этом полезном в хозяйстве инструменте.

Репыч на Гитхабе.
Forwarded from Мониторим ИТ
Performance testing with Iter8, now with custom metrics

Iter8 — это оптимизатор релизов приложений и моделей машинного обучения, развернутых с помощью Kubernetes, на основе метрик с открытым исходным кодом. Можно использовать Iter8 для проведения экспериментов, которые решают различные задачи, такие как сбор метрик из разных версий сервиса, проверка этих метрик на соответствие SLO, определение наиболее эффективной версии и многое другое. Читать дальше.

Репыч на Гитхабе.
Forwarded from Мониторим ИТ
Creating A Basic Load Test Infrastructure Via Using K6/Grafana/InfluxDB

В этой статье описано создание тестового окружения для тестирования производительности с помощью K6/Grafana/InfluxDB. Читать дальше.
Forwarded from Мониторим ИТ
How to Handle Terabytes of Metrics in Kubernetes Monitoring

Мы использовали Prometheus, Thanos и Grafana для обрабатки около 40 000 метрик, генерируемых каждую секунду. В этом посте наша команда инженеров делится некоторыми мыслями и знаниями о нашем пути по настройке мониторинга. Читать дальше.
Forwarded from Мониторим ИТ
Who monitors the monitoring system? — Is my Prometheus alive at all

Пока система жива и здорова, отправляйте heartbeat. Если мы какое-то время не получаем heartbeat, можно смело считать, что система мертва. Это самый надежный способ получить уведомление о сбое системы. Главный недостаток этого подхода заключается в том, что действительно трудно понять, что вызвало сбой. Читать дальше.
Forwarded from Sysadmin Tools 🇺🇦
Forwarded from /usr/bin
Checkov: Security and Compliance for Infrastructure as Code

Checkov — это инструмент статического анализа кода для сканирования файлов IaC на наличие неправильных конфигураций, которые могут привести к проблемам с безопасностью или соответствию требованиям. Checkov включает более 750 предопределенных политик для проверки распространенных проблем с неправильной настройкой. Checkov также поддерживает создание и добавление пользовательских политик. Читать дальше.

Репыч на Гитхабе.
Forwarded from Мониторим ИТ
Squzy - opensource monitoring, incident and alerting system

Squzy высокопроизводительный открытый инструмент для мониторинга и алертинга, написанный на Golang.

Репыч на Гитхабе.
🛠 External Debugging Tools 1: dtrace and strace - о работе с dtrace и strace, с примерами использования.

https://talktotheduck.dev/external-debugging-tools-dtrace-strace

#strace #dtrace #фидбечат
Forwarded from Мониторим ИТ
How Grafana Mimir helped Pipedrive overcome Prometheus scalability limits

Около восьми месяцев назад мы начали замечать проблемы с Prometheus, который начал падать без видимой причины. Увеличение ресурсов помогло только до 32 vCPU и 256 ГБ памяти, далее это оказалось бесполезным и не решило проблемы. Перезапуск Prometheus занимал до 15 минут, мы не могли позволить себе эти задержки, так как наша стратегия обеспечения наблюдаемости и алертинга зависела от доступности Prometheus.

Для агрегированного экземпляра Prometheus проблемы начались, когда мы достигли ~8 миллионов активных серий, ~20 миллионов чанков и ~200 тысяч пар меток.

Принимая во внимание все функции, которые представил Mimir, такие как высокая производительность запросов, а также наш предыдущий опыт работы с инструментами Grafana, мы решили сразу же внедрить Mimir в наш стек. Читать дальше.
Forwarded from /usr/bin
Exploring the Linux proc file system

Представление каждого объекта операционной системы в виде файла означает, что вы можете найти в файловой системе всевозможные вещи, такие как, например, процессы операционной системы. Запущенные процессы находятся в каталоге /proc, и сегодня мы поговорим о том, что мы можем там найти. Читать дальше.
Forwarded from /usr/bin
Debugging Distributed Trace Gaps

Ранее
в этом году мы заметили странные пробелы примерно в 0,5% трассировок наших распределенных приложений. Эти перерывы длились до нескольких секунд и приводили к ухудшению обслуживания пользователей и почти ежедневным оповещениям в течение нескольких недель. Мы подозревали, что причина этих пробелов лежит вне кода приложения, где-то в сети или еще в слоях программного обеспечения, поверх которых работают наши приложения.

В этом цикле из 3 статей команда Teachers Pay Teachers разбирается с трассировкой вызовов внутри операционной системы.

Debugging Distributed Trace Gaps with tcpdump

Debugging Distributed Trace Gaps with ftrace

Monitoring Linux Audit
🔧 An Incident Command Training Handbook - занятное чтиво для тех, кто сталкивается (или будет сталкиваться) в своей работе с инцидентами, и встаёт у руля в процессе их распространения и решения, становясь так называемым Incident Commander'ом.

#sre #напочитать #incident