Флант | Специалисты по DevOps и Kubernetes
1.87K subscribers
333 photos
2 videos
1 file
702 links
С 2008 года внедряем практики для автоматизации процессов разработки и управления инфраструктурами: flant.ru
В канале — наши технические статьи, видео, релизы Open Source-проектов и новости компании.

RU-чат: t.me/+_eOEtncbZ1hkZDNi
Download Telegram
Андрей Радыгин видел много инфраструктур и миграций, поэтому неплохо представляет, что обычно идёт не так.

В статье по мотивам доклада с DevOpsConf он разбирает, что важно учесть при переезде в облака или на on-prem: от расчёта полной стоимости миграции и нематериальных рисков до особенностей managed-сервисов и архитектуры отказоустойчивых систем.

Заглядывайте на Хабр за формулами подробным разбором того, о чём стоит подумать заранее.
🔥14
В высоконагруженных финтех-сервисах шардирование — это путь к масштабированию без потери SLA.

ЕДИНЫЙ ЦУПИС — это высоконагруженный финтех-проект. За год совместной работы система получила геораспределённую отказоустойчивую архитектуру: шардировали платёжную логику, инфраструктуру и мониторинг, четыре кластера объединили в единый service mesh, два из них — на площадке с PCI DSS. Было непросто, зато теперь там живёт масштабируемая система без просадки по надёжности. Сейчас платформа справляется с 30 релизами в сутки, суммарное SLA мультиЦОД-инсталляции превышает 99,99%.

Сегодня на митапе у коллег разберём, как в таких высоконагруженных проектах устроена наблюдаемость.

Владимир Гурьянов, технический директор продукта Deckhouse Observability Platform, покажет, как устроен мониторинг, который переваривает свыше 100 млн метрик, почему классические подходы не подходят под такую нагрузку и как решаются вопросы с хранением и шардированием метрик в мультитенантной архитектуре.

Многие знают, как репликация и шардирование реализованы в классических, реляционных базах данных. Доклад позволит иначе взглянуть на привычные задачи, и вы сможете использовать эти подходы в своих проектах, даже если они не связаны с метриками.

9 декабря, 18:30, Санкт-Петербург. Подробности →
👍111
Когда GitLab CI начинает запускать задачи с задержкой по 10 минут и сжигать деньги на «вечно живущие» EC2‑инстансы, приходится что‑то менять. 

Мы настроили масштабируемые GitLab Runner’ы через Fleeting и Autoscaler и в итоге заметно сократили затраты на CI‑инфраструктуру в AWS. В этой статье делимся конфигурациями, схемой и пошаговым гайдом, чтобы вы могли повторить этот подход у себя.
👍6🔥6
В новой статье — лучшие практики по конфигурациям в Kubernetes, которые спасут вас от нерабочих подов после обновления API, багов в CI и хаоса в проде. Лайфхаки от тех, кто каждый день работает с кластерами.
🔥11👍5
Команда Deckhouse Storage рассказала о поддерживаемых в наших платформах CSI — как о вариантах с использованием реализаций от вендора, так и о разработанном нами универсальном модуле, который поддерживает интеграцию с практически любым СХД.
5
Вышла новая версия Kubernetes — 1.35. Собрали подробный обзор всех нововведений на русском языке.

Из важного: отслеживание здоровья устройств при DRA, асинхронная обработка API-вызовов и новая разновидность YAML для описания конфигураций — эти и другие фичи и изменения появились в Kubernetes 1.34.

Приятного изучения →
🔥11👍41
Асинхронная репликация + failover = риск потери данных. Но вот не все знают, что даже если все транзакции уже ушли на реплику, можно потерять данные при переключении. Особенно если есть логическая репликация и настроен nofailover: true.

При ручном failover Patroni не синхронизирует логические слоты заранее. И если логическая реплика отстаёт — часть данных может исчезнуть навсегда.

Рассказали, почему так происходит и как это исправить.
🔥7
Флант большую часть своей истории занимается DevOps-сопровождением проектов. Со временем мы стали продуктовой компанией, появилась экосистема Deckhouse, случилось слияние с Экспресс 42.

Это расширило возможности направления DevOps as a Service— собственные инструменты и продукты обеспечивают круглосуточное сопровождение с реакцией на инциденты с SLA в пять минут.

DevOps as a Service — это когда команда экспертов берёт на себя задачи SRE, построение и сопровождение DevOps-цикла, помогает с архитектурой приложений. Работаем 24/7 с гарантией реакции 5 минут по SLA.

Помогает, когда продукту не хватает ресурсов на DevOps-задачи, когда команда вместо создания продукта тушит пожары на инфраструктуре, когда CTO устал просыпаться по ночам из-за упавшего прода.

Для тех, кто сталкивался с подобными задачами и хочет попробовать, как это работает, мы подготовили специальное предложение. Подробности →
🔥124👍1
Да кто такой этот ваш «после праздников»?

Мы продолжаем работать, и вот, как это выглядит в последние рабочие дни декабря.

А как этот пост нашёл вас? Делитесь в комментариях.
🔥13🥰12👍2😁1
Устали? Пусть на каникулах технологии не отвлекают от отдыха.
16🔥9🥰2👏1
Они не брутфорсили. Не использовали 0-day. Не ломали пароли.

Просто позвонили, отправили Excel и подделали страницу входа.

И всё.

Полный контроль над инфраструктурой — за три шага и без хакерских инструментов.

Читайте один из лучших кейсов по социнжинирингу.
👍9🔥21
А что, если бы вы смогли зайти в дата-центр банка… просто пристроившись к группе человек с улицы?

Нет, это не фильм. Это реальный пентест — без взлома, без помощи изнутри, но с Wi-Fi-жучком за принтером и поддельным письмом от техподдержки. Кейс: как проникнуть в сеть финансового гиганта, используя дыры в доверии, а не в файрволах.

Если думаете, что у вас «всё закрыто» — прочитайте. Просто на всякий случай 😉
🔥71👍1