Dev0ps – Telegram

Dev0ps

40 subscribers

211 photos

3 videos

50 files

3.33K links

Download Telegram

About

Blog

Apps

Platform

Forwarded from HighLoad++

В ВК зарегистрировано полмиллиарда пользователей, а среднесуточная аудитория около 100 млн. Чтобы держать такую нагрузку нужна крепкая архитектура и десятки тысяч серверов. Как организовано взаимодействие между ними, как происходит мониторинг и как решают проблему постоянно ломающихся серверов рассказал Алексей Акулович на HighLoad++ в докладе FAQ по архитектуре и работе ВКонтакте, а Ник Волынкин аккуратно записал в конспект.

https://github.com/NickVolynkin/highload-2018/blob/master/2.1-vk-architecture.md

1 view16:22

Forwarded from Knowledge and bacon - Управление знаниями в IT

Считанные часы остались до Нового года, настало время поговорить об итогах и планах.

Важный итог - мы с Ontico (Конференции Олега Бунина, организаторы знаменитой конференции Highload++) запустили работу над первой в России конференции про управление знаниями в IT компаниях и командах KnowledgeConf 2019. Она пройдет в Москве в апреле 2019 года. Этот пост - неофициальный старт подачи заявок, этакий тизер, детали и подробности будут впереди.

Не секрет, что знания для технологических компаний - это сила, это касается как знаний об устройстве системы, о принятых технологических решениях, о неформальных процессах, принятых в команде. Мы хотим обсудить кейсы для разных команд и ролей в технологических компаниях - управление разработкой (архитектурная документация, адаптация и обучение новичков), тестированием (хранение тест-кейсов), DevOps и инфраструктурные команды (выученные уроки, управление инцидентами), менеджеры проектов, команды по созданию технической документации (стайлгайды), нам всем определенно есть, чем поделиться друг с другом.

Компании много сил и ресурсов вкладывают в обучение специалистов, поэтому терять знания, хранящиеся в головах инженеров и менеджеров, для них особенно дорого.

Как хранить, передавать знания в IT компаниях, как обучать новых сотрудников и успешно включать их в работу, как анализировать успехи и неудачи, правильно документировать их и хранить - обо всем этом вы сможете рассказать и послушать на KnowledgeConf в апреле 2019 года.

Создали уникальную и крутую на ваш взгляд систему адаптации новичков в компании? А может придумали свой подход к хранению и индексации информации в базе знаний? Изучили современные подходы к обучению и полностью пересмотрели систему передачи знаний в компании? Отказались от документации совсем? Расскажите об этом!

Захотелось выступить? Ссылка на подачу заявки тут.

У нас следующие секции:

- Вовлечение сотрудников в процесс knowledge sharing, создание культуры непрерывного обмена знаниями и опытом в IT-командах и компаниях.
- Оценка эффективности управления знаниями и бизнес-результат.
- Современные технологии и методы обучения.
- Практические кейсы и результаты организации управления знаниями в компаниях: онбординг новичков, организация базы знаний, внутренний университет, обучение на практике.
- Софт и платформы управления знаниями, автоматизация процессов управления знаниями: преимущества, недостатки и проблемы, которые они решают (Wiki-системы, системы онлайн-обучения и т.д.).
- Откуда взять специалиста по КМ? Проблемы подготовки и найма

Если вам кажется, что у вас интересная тема, идея, но она не укладывается в рамки конференции - напишите мне @Lananovikova, вместе придумаем формат.

Репост в профильные сообщества приветствуется. Всех, кому стало интересно - помогите нам сделать конференцию такой, какой вы бы хотели ее видеть, заполните анкету с пожеланиями к контенту и форматам по ссылке.

С наступающим вас Новым годом! Настало время делиться знаниями.

1 view09:14

Forwarded from Українська девопсарня via @like

Брендан Грегг опубликовал туториал по eBPF Tracing (extended Berkeley Packet Filter). В туториале рассматривается несколько тулзовин для трейсинга (bcc, bpftrace) для разных уровней сложности (от Beginner до Advanced).
http://www.brendangregg.com/blog/2019-01-01/learn-ebpf-tracing.html

1 view15:20

Forwarded from Українська девопсарня

Новый опенсорсный нат от scaleway. Говорят, может до ста гигабит пропускать. https://github.com/scaleway/natasha

GitHub - scaleway/natasha: Natasha is a fast and scalable, DPDK powered, stateless NAT44 packet processor

Natasha is a fast and scalable, DPDK powered, stateless NAT44 packet processor - scaleway/natasha

1 view10:18

Forwarded from ДевОпс Інженер 🇺🇦 (Oleg Mykolaichenko)

Envoy proxy: отличная тема, даже без кубера 🔥

Envoy - это L4/L7 proxy, раньше был в Lyft, а теперь - CNCF.
https://github.com/envoyproxy/envoy

Он позволяет легко и быстро построить service-to-service, front proxy или double proxy (или даже все в месте). Вот, например, так:
https://www.envoyproxy.io/docs/envoy/latest/intro/deployment_types/double_proxy

Конфигурация кажется немного запутанной, но через пару часов все ясно и понятно - намного проще и быстрее чем HAproxy/nginx, etc.

Пример double proxy конфигурации:
https://github.com/envoyproxy/envoy/blob/master/configs/envoy_double_proxy_v2.template.yaml

Он очень классно интегрируется с Consul (в том числе как communication bus для Consul Connect), и может динамически слушать порты, строить роуты, делать всякую магию, которую в случае с HAproxy/nginx нужно было решать всякими ужасными темплейтами и генерацией конфигурации.

Все вы знаете реализацию Envoy внутри Istio, но кто хочет попроще или не в k8s - можно брать просто Envoy.

Из сомнительных моментов могу упомянуть:
▶️ Если хотите запустить несколько Envoy контейнеров на одной ноде, нужно передавать дополнительный параметр - иначе не будет работать:
https://www.envoyproxy.io/docs/envoy/latest/operations/cli#cmdoption-base-id
▶️ Prometheus exporter встроен прямо в Envoy, но с оговорками. Путь - /stats/prometheus (what?, почему не /metrics, или почему даже редиректа нету?), и второй момент - метрики отдаются через админский интерфейс, а он не защищен. Вот issue:
https://github.com/envoyproxy/envoy/issues/2763 - должны сделать.

Мы сейчас как раз в процессе внедрения, пока что впечатления крайне положительные, могу рекомендовать 🙂

И еще расшарю для вас gist с relabel_configs для prometheus, который берет таргеты из Consul:
https://gist.github.com/Mykolaichenko/9ab505876237999466a6e3b506ef598a

GitHub - envoyproxy/envoy: Cloud-native high-performance edge/middle/service proxy

Cloud-native high-performance edge/middle/service proxy - envoyproxy/envoy

1 view17:50

Forwarded from Sysadmin Tools 🇺🇦

Top 7 Ansible articles from 2018

1. How to use Ansible to patch systems and install applications
Learn how to save time doing updates with the #Ansible IT automation engine.

2. A sysadmin's guide to Ansible: How to simplify tasks
There are many ways to automate common sysadmin tasks with Ansible. Here are several of them.

3. How to manage your workstation configuration with Ansible
Learn how to automate your workstation setup via Ansible, which will allow you to easily restore...

4. How to use Ansible to set up system monitoring with Prometheus
In the third part of this Ansible how-to series, learn how to automate system monitoring.

5. An introduction to Ansible Operators in Kubernetes
The new Operator SDK makes it easy to create a Kubernetes controller to deploy and manage a service or application in a cluster.

6. 4 Ansible playbooks you should try
Streamline and tighten automation processes in complex IT environments with these Ansible playbooks.

7. Manage your workstation with Ansible: Automating

1 view17:50

Forwarded from Українська девопсарня via @like

VPN не нужен (в некоторых частых случаях). Написал об этом небольшую статью. https://dvps.blog/p/93ec1ff3-b02b-439e-8336-77fc89dd5d7c/

Безопасность internal сервисов

Вы не поверите, но это новый пост. Третий раз сажусь за статью и снова её переписываю.Итак, давайте поговорим о безопасности. Не о той, что сложная, а о базовой.Допустим у вас есть облако и в нём есть какие-то инфраструктурные сервисы. Пусть будет графана…

1 view08:52

Forwarded from DevOps&SRE Library

Why SRE Documents Matter

Отличная статья про документы, которые необходимы для работы SRE команды.

https://cacm.acm.org/magazines/2018/12/232897-why-sre-documents-matter/fulltext

1 view09:22

Forwarded from DevOps&SRE Library

Неплохая коллекция постмортемов

https://github.com/danluu/post-mortems

1 view14:43

Forwarded from CatOps

Тулза — открытие дня (вчерашнего)

truffleHog — инструмент для поиска секретов в git репозитории.

Поиск осуществляется по истории. При чём по-умолчанию тулза ориентируется по энтропии строк (так что в вывод будут залетать всякие package-lock.json). Однако, можно включить поиск на основании регулярных выражений для уменьшения числа ложных срабатываний (есть готовые, плюс можно скармливать свои).

Поскольку поиск происходит по истории (можно задавать глубину), находятся в том числе те ключи, которые были “закоммичены, но оперативно потёрты”

Пока из минусов увидел только два:
- нельзя эксклудить файлы (соответствующий пул реквест висит)
- нельзя отключить подсветку вывода (потом не так удобно парсить вывод дальше)

#toolz #security

GitHub - trufflesecurity/trufflehog: Find, verify, and analyze leaked credentials

Find, verify, and analyze leaked credentials. Contribute to trufflesecurity/trufflehog development by creating an account on GitHub.

1 view22:06

Forwarded from The Devs

22 SSH examples, practical tips and tunnels.

#tutorial #coding #ssh
@thedevs

https://kutt.it/Xw7141

1 view17:44

Forwarded from DevOps&SRE Library

Какие метрики и как стоит замониторить в Nginx.

How to monitor NGINX:
https://www.datadoghq.com/blog/how-to-monitor-nginx

How to collect NGINX metrics:
https://www.datadoghq.com/blog/how-to-collect-nginx-metrics

How to monitor NGINX with Datadog:
https://www.datadoghq.com/blog/how-to-monitor-nginx-with-datadog

1 view17:45

Forwarded from DevOps Deflope News

Очень интересный доклад от Gregory Stark на PGCONF EU 2018 про построение мониторинга PostgreSQL с помощью Prometheus и Grafana. С реальными примерами, графиками и теорией про USE, RED.
P.S. Видео к сожалению пока не нашлось ¯\_(ツ)_/¯

Блог: http://amp.gs/VpF6
Конференция: http://amp.gs/VpXj
Слайды: http://amp.gs/VpXI
#monitoring #prometheus #postgresql

Monitoring Postgres with Prometheus

I'm glad people found my presentation at Lisbon on monitoring Postgres using Prometheus last October interesting. The slides are now uploade...

1 view12:20

Forwarded from DevOps Deflope News

Отличный постмортем от Dan Woods из Target про то, как одно небольшое изменение может ОЧЕНЬ многое каскадно сломать в сложной распределенной инфраструктуре)

http://amp.gs/Vpq2

At Target, we run a heterogeneous infrastructure in our datacenters (and many other places), where we have multiple different backend…

1 view12:20

Forwarded from DevOps&SRE Library

nginx_cookbook_2019.pdf

NGINX Cookbook
Advanced Recipes for High
Performance Load Balancing

Derek DeJonghe

2019

1 view14:38

Forwarded from DevOps&SRE Library

Automating Datacenter Operations at Dropbox

Отличный пост в техническом блоге Dropbox про то, как они делают провижен свичей и серверов в своих ДЦ.

https://blogs.dropbox.com/tech/2019/01/automating-datacenter-operations-at-dropbox

1 view14:38

Forwarded from DevOps&SRE Library

Какие метрики и как стоит замониторить в Nginx.

How to monitor NGINX:
https://www.datadoghq.com/blog/how-to-monitor-nginx

How to collect NGINX metrics:
https://www.datadoghq.com/blog/how-to-collect-nginx-metrics

How to monitor NGINX with Datadog:
https://www.datadoghq.com/blog/how-to-monitor-nginx-with-datadog

1 view14:38

Forwarded from DevOps&SRE Library

Какие метрики и как стоит замониторить в Redis.

How to monitor Redis performance metrics:
https://www.datadoghq.com/blog/how-to-monitor-redis-performance-metrics

How to collect Redis metrics:
https://www.datadoghq.com/blog/how-to-collect-redis-metrics

Monitor Redis using Datadog:
https://www.datadoghq.com/blog/monitor-redis-using-datadog

1 view14:39

Forwarded from DevOps&SRE Library

Designing resilient systems: Circuit Breakers or Retries?

Серия из 2х постов про важные концепции для построения распределенных отказоустойчивых систем - circuit breakers и retries.

https://engineering.grab.com/designing-resilient-systems-part-1
https://engineering.grab.com/designing-resilient-systems-part-2

1 view14:39

Forwarded from CatOps

Гайдлайн для понимания насколько вы production-ready от JBD — инженера в Google.

Бонусом AWS production-readiness чеклист от Gruntworks (уже было на канале)
- Сам чеклист

Production Guideline

In the last years, I found myself giving advice to a ton of companies who are on Google Cloud about the basics to consider when going to…

1 view12:47