Forwarded from HighLoad++
В ВК зарегистрировано полмиллиарда пользователей, а среднесуточная аудитория около 100 млн. Чтобы держать такую нагрузку нужна крепкая архитектура и десятки тысяч серверов. Как организовано взаимодействие между ними, как происходит мониторинг и как решают проблему постоянно ломающихся серверов рассказал Алексей Акулович на HighLoad++ в докладе FAQ по архитектуре и работе ВКонтакте, а Ник Волынкин аккуратно записал в конспект.
https://github.com/NickVolynkin/highload-2018/blob/master/2.1-vk-architecture.md
https://github.com/NickVolynkin/highload-2018/blob/master/2.1-vk-architecture.md
Forwarded from Knowledge and bacon - Управление знаниями в IT
Считанные часы остались до Нового года, настало время поговорить об итогах и планах.
Важный итог - мы с Ontico (Конференции Олега Бунина, организаторы знаменитой конференции Highload++) запустили работу над первой в России конференции про управление знаниями в IT компаниях и командах KnowledgeConf 2019. Она пройдет в Москве в апреле 2019 года. Этот пост - неофициальный старт подачи заявок, этакий тизер, детали и подробности будут впереди.
Не секрет, что знания для технологических компаний - это сила, это касается как знаний об устройстве системы, о принятых технологических решениях, о неформальных процессах, принятых в команде. Мы хотим обсудить кейсы для разных команд и ролей в технологических компаниях - управление разработкой (архитектурная документация, адаптация и обучение новичков), тестированием (хранение тест-кейсов), DevOps и инфраструктурные команды (выученные уроки, управление инцидентами), менеджеры проектов, команды по созданию технической документации (стайлгайды), нам всем определенно есть, чем поделиться друг с другом.
Компании много сил и ресурсов вкладывают в обучение специалистов, поэтому терять знания, хранящиеся в головах инженеров и менеджеров, для них особенно дорого.
Как хранить, передавать знания в IT компаниях, как обучать новых сотрудников и успешно включать их в работу, как анализировать успехи и неудачи, правильно документировать их и хранить - обо всем этом вы сможете рассказать и послушать на KnowledgeConf в апреле 2019 года.
Создали уникальную и крутую на ваш взгляд систему адаптации новичков в компании? А может придумали свой подход к хранению и индексации информации в базе знаний? Изучили современные подходы к обучению и полностью пересмотрели систему передачи знаний в компании? Отказались от документации совсем? Расскажите об этом!
Захотелось выступить? Ссылка на подачу заявки тут.
У нас следующие секции:
- Вовлечение сотрудников в процесс knowledge sharing, создание культуры непрерывного обмена знаниями и опытом в IT-командах и компаниях.
- Оценка эффективности управления знаниями и бизнес-результат.
- Современные технологии и методы обучения.
- Практические кейсы и результаты организации управления знаниями в компаниях: онбординг новичков, организация базы знаний, внутренний университет, обучение на практике.
- Софт и платформы управления знаниями, автоматизация процессов управления знаниями: преимущества, недостатки и проблемы, которые они решают (Wiki-системы, системы онлайн-обучения и т.д.).
- Откуда взять специалиста по КМ? Проблемы подготовки и найма
Если вам кажется, что у вас интересная тема, идея, но она не укладывается в рамки конференции - напишите мне @Lananovikova, вместе придумаем формат.
Репост в профильные сообщества приветствуется. Всех, кому стало интересно - помогите нам сделать конференцию такой, какой вы бы хотели ее видеть, заполните анкету с пожеланиями к контенту и форматам по ссылке.
С наступающим вас Новым годом! Настало время делиться знаниями.
Важный итог - мы с Ontico (Конференции Олега Бунина, организаторы знаменитой конференции Highload++) запустили работу над первой в России конференции про управление знаниями в IT компаниях и командах KnowledgeConf 2019. Она пройдет в Москве в апреле 2019 года. Этот пост - неофициальный старт подачи заявок, этакий тизер, детали и подробности будут впереди.
Не секрет, что знания для технологических компаний - это сила, это касается как знаний об устройстве системы, о принятых технологических решениях, о неформальных процессах, принятых в команде. Мы хотим обсудить кейсы для разных команд и ролей в технологических компаниях - управление разработкой (архитектурная документация, адаптация и обучение новичков), тестированием (хранение тест-кейсов), DevOps и инфраструктурные команды (выученные уроки, управление инцидентами), менеджеры проектов, команды по созданию технической документации (стайлгайды), нам всем определенно есть, чем поделиться друг с другом.
Компании много сил и ресурсов вкладывают в обучение специалистов, поэтому терять знания, хранящиеся в головах инженеров и менеджеров, для них особенно дорого.
Как хранить, передавать знания в IT компаниях, как обучать новых сотрудников и успешно включать их в работу, как анализировать успехи и неудачи, правильно документировать их и хранить - обо всем этом вы сможете рассказать и послушать на KnowledgeConf в апреле 2019 года.
Создали уникальную и крутую на ваш взгляд систему адаптации новичков в компании? А может придумали свой подход к хранению и индексации информации в базе знаний? Изучили современные подходы к обучению и полностью пересмотрели систему передачи знаний в компании? Отказались от документации совсем? Расскажите об этом!
Захотелось выступить? Ссылка на подачу заявки тут.
У нас следующие секции:
- Вовлечение сотрудников в процесс knowledge sharing, создание культуры непрерывного обмена знаниями и опытом в IT-командах и компаниях.
- Оценка эффективности управления знаниями и бизнес-результат.
- Современные технологии и методы обучения.
- Практические кейсы и результаты организации управления знаниями в компаниях: онбординг новичков, организация базы знаний, внутренний университет, обучение на практике.
- Софт и платформы управления знаниями, автоматизация процессов управления знаниями: преимущества, недостатки и проблемы, которые они решают (Wiki-системы, системы онлайн-обучения и т.д.).
- Откуда взять специалиста по КМ? Проблемы подготовки и найма
Если вам кажется, что у вас интересная тема, идея, но она не укладывается в рамки конференции - напишите мне @Lananovikova, вместе придумаем формат.
Репост в профильные сообщества приветствуется. Всех, кому стало интересно - помогите нам сделать конференцию такой, какой вы бы хотели ее видеть, заполните анкету с пожеланиями к контенту и форматам по ссылке.
С наступающим вас Новым годом! Настало время делиться знаниями.
Forwarded from Українська девопсарня via @like
Брендан Грегг опубликовал туториал по eBPF Tracing (extended Berkeley Packet Filter). В туториале рассматривается несколько тулзовин для трейсинга (bcc, bpftrace) для разных уровней сложности (от Beginner до Advanced).
http://www.brendangregg.com/blog/2019-01-01/learn-ebpf-tracing.html
http://www.brendangregg.com/blog/2019-01-01/learn-ebpf-tracing.html
Forwarded from Українська девопсарня
Новый опенсорсный нат от scaleway. Говорят, может до ста гигабит пропускать. https://github.com/scaleway/natasha
GitHub
GitHub - scaleway/natasha: Natasha is a fast and scalable, DPDK powered, stateless NAT44 packet processor
Natasha is a fast and scalable, DPDK powered, stateless NAT44 packet processor - scaleway/natasha
Forwarded from ДевОпс Інженер 🇺🇦 (Oleg Mykolaichenko)
Envoy proxy: отличная тема, даже без кубера 🔥
Envoy - это L4/L7 proxy, раньше был в Lyft, а теперь - CNCF.
https://github.com/envoyproxy/envoy
Он позволяет легко и быстро построить service-to-service, front proxy или double proxy (или даже все в месте). Вот, например, так:
https://www.envoyproxy.io/docs/envoy/latest/intro/deployment_types/double_proxy
Конфигурация кажется немного запутанной, но через пару часов все ясно и понятно - намного проще и быстрее чем HAproxy/nginx, etc.
Пример double proxy конфигурации:
https://github.com/envoyproxy/envoy/blob/master/configs/envoy_double_proxy_v2.template.yaml
Он очень классно интегрируется с Consul (в том числе как communication bus для Consul Connect), и может динамически слушать порты, строить роуты, делать всякую магию, которую в случае с HAproxy/nginx нужно было решать всякими ужасными темплейтами и генерацией конфигурации.
Все вы знаете реализацию Envoy внутри Istio, но кто хочет попроще или не в k8s - можно брать просто Envoy.
Из сомнительных моментов могу упомянуть:
▶️ Если хотите запустить несколько Envoy контейнеров на одной ноде, нужно передавать дополнительный параметр - иначе не будет работать:
https://www.envoyproxy.io/docs/envoy/latest/operations/cli#cmdoption-base-id
▶️ Prometheus exporter встроен прямо в Envoy, но с оговорками. Путь - /stats/prometheus (what?, почему не /metrics, или почему даже редиректа нету?), и второй момент - метрики отдаются через админский интерфейс, а он не защищен. Вот issue:
https://github.com/envoyproxy/envoy/issues/2763 - должны сделать.
Мы сейчас как раз в процессе внедрения, пока что впечатления крайне положительные, могу рекомендовать 🙂
И еще расшарю для вас gist с relabel_configs для prometheus, который берет таргеты из Consul:
https://gist.github.com/Mykolaichenko/9ab505876237999466a6e3b506ef598a
Envoy - это L4/L7 proxy, раньше был в Lyft, а теперь - CNCF.
https://github.com/envoyproxy/envoy
Он позволяет легко и быстро построить service-to-service, front proxy или double proxy (или даже все в месте). Вот, например, так:
https://www.envoyproxy.io/docs/envoy/latest/intro/deployment_types/double_proxy
Конфигурация кажется немного запутанной, но через пару часов все ясно и понятно - намного проще и быстрее чем HAproxy/nginx, etc.
Пример double proxy конфигурации:
https://github.com/envoyproxy/envoy/blob/master/configs/envoy_double_proxy_v2.template.yaml
Он очень классно интегрируется с Consul (в том числе как communication bus для Consul Connect), и может динамически слушать порты, строить роуты, делать всякую магию, которую в случае с HAproxy/nginx нужно было решать всякими ужасными темплейтами и генерацией конфигурации.
Все вы знаете реализацию Envoy внутри Istio, но кто хочет попроще или не в k8s - можно брать просто Envoy.
Из сомнительных моментов могу упомянуть:
▶️ Если хотите запустить несколько Envoy контейнеров на одной ноде, нужно передавать дополнительный параметр - иначе не будет работать:
https://www.envoyproxy.io/docs/envoy/latest/operations/cli#cmdoption-base-id
▶️ Prometheus exporter встроен прямо в Envoy, но с оговорками. Путь - /stats/prometheus (what?, почему не /metrics, или почему даже редиректа нету?), и второй момент - метрики отдаются через админский интерфейс, а он не защищен. Вот issue:
https://github.com/envoyproxy/envoy/issues/2763 - должны сделать.
Мы сейчас как раз в процессе внедрения, пока что впечатления крайне положительные, могу рекомендовать 🙂
И еще расшарю для вас gist с relabel_configs для prometheus, который берет таргеты из Consul:
https://gist.github.com/Mykolaichenko/9ab505876237999466a6e3b506ef598a
GitHub
GitHub - envoyproxy/envoy: Cloud-native high-performance edge/middle/service proxy
Cloud-native high-performance edge/middle/service proxy - envoyproxy/envoy
Forwarded from Sysadmin Tools 🇺🇦
Top 7 Ansible articles from 2018
1. How to use Ansible to patch systems and install applications
Learn how to save time doing updates with the #Ansible IT automation engine.
2. A sysadmin's guide to Ansible: How to simplify tasks
There are many ways to automate common sysadmin tasks with Ansible. Here are several of them.
3. How to manage your workstation configuration with Ansible
Learn how to automate your workstation setup via Ansible, which will allow you to easily restore...
4. How to use Ansible to set up system monitoring with Prometheus
In the third part of this Ansible how-to series, learn how to automate system monitoring.
5. An introduction to Ansible Operators in Kubernetes
The new Operator SDK makes it easy to create a Kubernetes controller to deploy and manage a service or application in a cluster.
6. 4 Ansible playbooks you should try
Streamline and tighten automation processes in complex IT environments with these Ansible playbooks.
7. Manage your workstation with Ansible: Automating
1. How to use Ansible to patch systems and install applications
Learn how to save time doing updates with the #Ansible IT automation engine.
2. A sysadmin's guide to Ansible: How to simplify tasks
There are many ways to automate common sysadmin tasks with Ansible. Here are several of them.
3. How to manage your workstation configuration with Ansible
Learn how to automate your workstation setup via Ansible, which will allow you to easily restore...
4. How to use Ansible to set up system monitoring with Prometheus
In the third part of this Ansible how-to series, learn how to automate system monitoring.
5. An introduction to Ansible Operators in Kubernetes
The new Operator SDK makes it easy to create a Kubernetes controller to deploy and manage a service or application in a cluster.
6. 4 Ansible playbooks you should try
Streamline and tighten automation processes in complex IT environments with these Ansible playbooks.
7. Manage your workstation with Ansible: Automating
Forwarded from Українська девопсарня via @like
VPN не нужен (в некоторых частых случаях). Написал об этом небольшую статью. https://dvps.blog/p/93ec1ff3-b02b-439e-8336-77fc89dd5d7c/
dpvs
Безопасность internal сервисов
Вы не поверите, но это новый пост. Третий раз сажусь за статью и снова её переписываю.Итак, давайте поговорим о безопасности. Не о той, что сложная, а о базовой.Допустим у вас есть облако и в нём есть какие-то инфраструктурные сервисы. Пусть будет графана…
Forwarded from DevOps&SRE Library
Why SRE Documents Matter
Отличная статья про документы, которые необходимы для работы SRE команды.
https://cacm.acm.org/magazines/2018/12/232897-why-sre-documents-matter/fulltext
Отличная статья про документы, которые необходимы для работы SRE команды.
https://cacm.acm.org/magazines/2018/12/232897-why-sre-documents-matter/fulltext
Forwarded from DevOps&SRE Library
Forwarded from CatOps
Тулза — открытие дня (вчерашнего)
truffleHog — инструмент для поиска секретов в git репозитории.
Поиск осуществляется по истории. При чём по-умолчанию тулза ориентируется по энтропии строк (так что в вывод будут залетать всякие
Поскольку поиск происходит по истории (можно задавать глубину), находятся в том числе те ключи, которые были “закоммичены, но оперативно потёрты”
Пока из минусов увидел только два:
- нельзя эксклудить файлы (соответствующий пул реквест висит)
- нельзя отключить подсветку вывода (потом не так удобно парсить вывод дальше)
#toolz #security
truffleHog — инструмент для поиска секретов в git репозитории.
Поиск осуществляется по истории. При чём по-умолчанию тулза ориентируется по энтропии строк (так что в вывод будут залетать всякие
package-lock.json). Однако, можно включить поиск на основании регулярных выражений для уменьшения числа ложных срабатываний (есть готовые, плюс можно скармливать свои).Поскольку поиск происходит по истории (можно задавать глубину), находятся в том числе те ключи, которые были “закоммичены, но оперативно потёрты”
Пока из минусов увидел только два:
- нельзя эксклудить файлы (соответствующий пул реквест висит)
- нельзя отключить подсветку вывода (потом не так удобно парсить вывод дальше)
#toolz #security
GitHub
GitHub - trufflesecurity/trufflehog: Find, verify, and analyze leaked credentials
Find, verify, and analyze leaked credentials. Contribute to trufflesecurity/trufflehog development by creating an account on GitHub.
Forwarded from DevOps&SRE Library
Какие метрики и как стоит замониторить в Nginx.
How to monitor NGINX:
https://www.datadoghq.com/blog/how-to-monitor-nginx
How to collect NGINX metrics:
https://www.datadoghq.com/blog/how-to-collect-nginx-metrics
How to monitor NGINX with Datadog:
https://www.datadoghq.com/blog/how-to-monitor-nginx-with-datadog
How to monitor NGINX:
https://www.datadoghq.com/blog/how-to-monitor-nginx
How to collect NGINX metrics:
https://www.datadoghq.com/blog/how-to-collect-nginx-metrics
How to monitor NGINX with Datadog:
https://www.datadoghq.com/blog/how-to-monitor-nginx-with-datadog
Forwarded from DevOps Deflope News
Очень интересный доклад от Gregory Stark на PGCONF EU 2018 про построение мониторинга PostgreSQL с помощью Prometheus и Grafana. С реальными примерами, графиками и теорией про USE, RED.
P.S. Видео к сожалению пока не нашлось ¯\_(ツ)_/¯
Блог: http://amp.gs/VpF6
Конференция: http://amp.gs/VpXj
Слайды: http://amp.gs/VpXI
#monitoring #prometheus #postgresql
P.S. Видео к сожалению пока не нашлось ¯\_(ツ)_/¯
Блог: http://amp.gs/VpF6
Конференция: http://amp.gs/VpXj
Слайды: http://amp.gs/VpXI
#monitoring #prometheus #postgresql
Blogspot
Monitoring Postgres with Prometheus
I'm glad people found my presentation at Lisbon on monitoring Postgres using Prometheus last October interesting. The slides are now uploade...
Forwarded from DevOps Deflope News
Отличный постмортем от Dan Woods из Target про то, как одно небольшое изменение может ОЧЕНЬ многое каскадно сломать в сложной распределенной инфраструктуре)
http://amp.gs/Vpq2
http://amp.gs/Vpq2
Medium
Response to
At Target, we run a heterogeneous infrastructure in our datacenters (and many other places), where we have multiple different backend…
Forwarded from DevOps&SRE Library
nginx_cookbook_2019.pdf
3.1 MB
NGINX Cookbook
Advanced Recipes for High
Performance Load Balancing
Derek DeJonghe
2019
Advanced Recipes for High
Performance Load Balancing
Derek DeJonghe
2019
Forwarded from DevOps&SRE Library
Automating Datacenter Operations at Dropbox
Отличный пост в техническом блоге Dropbox про то, как они делают провижен свичей и серверов в своих ДЦ.
https://blogs.dropbox.com/tech/2019/01/automating-datacenter-operations-at-dropbox
Отличный пост в техническом блоге Dropbox про то, как они делают провижен свичей и серверов в своих ДЦ.
https://blogs.dropbox.com/tech/2019/01/automating-datacenter-operations-at-dropbox
Forwarded from DevOps&SRE Library
Какие метрики и как стоит замониторить в Nginx.
How to monitor NGINX:
https://www.datadoghq.com/blog/how-to-monitor-nginx
How to collect NGINX metrics:
https://www.datadoghq.com/blog/how-to-collect-nginx-metrics
How to monitor NGINX with Datadog:
https://www.datadoghq.com/blog/how-to-monitor-nginx-with-datadog
How to monitor NGINX:
https://www.datadoghq.com/blog/how-to-monitor-nginx
How to collect NGINX metrics:
https://www.datadoghq.com/blog/how-to-collect-nginx-metrics
How to monitor NGINX with Datadog:
https://www.datadoghq.com/blog/how-to-monitor-nginx-with-datadog
Forwarded from DevOps&SRE Library
Какие метрики и как стоит замониторить в Redis.
How to monitor Redis performance metrics:
https://www.datadoghq.com/blog/how-to-monitor-redis-performance-metrics
How to collect Redis metrics:
https://www.datadoghq.com/blog/how-to-collect-redis-metrics
Monitor Redis using Datadog:
https://www.datadoghq.com/blog/monitor-redis-using-datadog
How to monitor Redis performance metrics:
https://www.datadoghq.com/blog/how-to-monitor-redis-performance-metrics
How to collect Redis metrics:
https://www.datadoghq.com/blog/how-to-collect-redis-metrics
Monitor Redis using Datadog:
https://www.datadoghq.com/blog/monitor-redis-using-datadog
Forwarded from DevOps&SRE Library
Designing resilient systems: Circuit Breakers or Retries?
Серия из 2х постов про важные концепции для построения распределенных отказоустойчивых систем - circuit breakers и retries.
https://engineering.grab.com/designing-resilient-systems-part-1
https://engineering.grab.com/designing-resilient-systems-part-2
Серия из 2х постов про важные концепции для построения распределенных отказоустойчивых систем - circuit breakers и retries.
https://engineering.grab.com/designing-resilient-systems-part-1
https://engineering.grab.com/designing-resilient-systems-part-2
Forwarded from CatOps
Гайдлайн для понимания насколько вы production-ready от JBD — инженера в Google.
Бонусом AWS production-readiness чеклист от Gruntworks (уже было на канале)
- Сам чеклист
Бонусом AWS production-readiness чеклист от Gruntworks (уже было на канале)
- Сам чеклист
Medium
Production Guideline
In the last years, I found myself giving advice to a ton of companies who are on Google Cloud about the basics to consider when going to…