CORTEL
4.13K subscribers
1.86K photos
158 videos
156 files
1.58K links
Помогаем ИТ-директорам, DevOps и системным инженерам снижать TCO и поднимать SLA. Кейсы, инструменты и гайды.

Сайт:
https://cortel.cloud

Cотрудничество:
@ivan_cmo
Download Telegram
🖥 Файловая система Linux

Наглядная схема от ByteByteGo, которая поможет быстро разобраться, где лежат нужные файлы.

#полезное #красивое
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16🔥72
Чек-лист ТГ Канал CORTEL_.pdf
19.8 MB
↗️ С чего начинается ИТ

Собрали простой чек-лист, который поможет быстро оценить ИТ-департамент по шести направлениям:
— стратегия,
— процессы,
— технологии,
— команда,
— культура и результаты.

🐈 Небольшой спойлер

Самое ценное — не итоговая цифра, а разница между тем, как ИТ работает сейчас и как вы хотели бы, чтобы оно работало.

⚠️ Не заменяет полноценный аудит

Он помогает трезво оценить исходную точку — без самокритики и с пониманием, куда двигаться дальше.

📎 Бонус: подборка статей из блога, которые помогут проработать стратегию

— Как разработать ИТ-стратегию
— ИТ-стратегия для достижения бизнес-целей
— Как построить ИТ-стратегию и учесть риски
— Примеры ИТ-стратегий. Как провести ИТ-аудит бизнеса?

#гайды
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥3👏21👎1
📕 Настоящий CTO: думай как технический директор

Практическое руководство для тех, кто хочет мыслить и действовать как технический директор, находя баланс между бизнес-целями и быстро меняющимся миром технологий.

🔎 Рассматривается:
— формирование эффективных ИТ-команд,
— построение успешных технологических платформ,
— выбор и внедрение ПО,
— проведение собеседований и performance review,
— работа CTO в топ-менеджменте.

Автор:
Алан Уильямсон
Издательство: Питер, 2024
Серия «Библиотека программиста»

#полезное #книги
Please open Telegram to view this post
VIEW IN TELEGRAM
👍63🔥3👏1
💻 Как запускать Sidecar раньше основного приложения в Kubernetes

В продолжение темы многоконтейнерных подов и паттерна Sidecar, в блоге Kubernetes вышла новая статья,о том, как гарантировать запуск Sidecar-контейнера до основного приложения. Это важно, если ваше приложение зависит от того, что Sidecar будет не просто запущен, а действительно готов к работе.

Sidecar-контейнеры берут на себя задачи логирования, прокси или подготовки конфигурации. Но если такой контейнер запустится позже, основное приложение может упасть с ошибкой.

🚗 До недавнего времени порядок запуска приходилось решать обходными путями. С выходом Kubernetes 1.29 появилась экспериментальная возможность описывать Sidecar как initContainer с restartPolicy: Always.
Начиная с версии 1.33 эта функциональность стала стабильной. Теперь Sidecar можно запускать как initContainer, который не завершается, а работает на протяжении всего жизненного цикла пода.

➡️ Однако просто запустить sidecar-контейнер недостаточно.

Необходимо убедиться, что он полностью готов к работе и способен выполнять свои функции. Для этого используется startupProbe.
🩺Она проверяет работоспособность контейнера, например, отправляя HTTP(S)-запрос или выполняя команду внутри контейнера. Контейнер считается успешно запущенным (и startupProbe возвращает статус "Успех") только когда эта проверка завершается положительно (например, сервер отвечает кодом 2xx/3xx или исполняемая команда возвращает exit code 0).

Основной контейнер приложения не будет запущен до тех пор, пока startupProbe для sidecar-контейнера не вернет успешный статус.

💬 Два ключевых механизма:

🟢Sidecar как initContainer с restartPolicy: Always — превращает initContainer в постоянного спутника пода.

🟢startupProbe для Sidecar — гарантирует, что контейнер прошел проверку готовности перед запуском основного приложения.

💬 Где это особенно важно?

🟢Если приложение напрямую зависит от Sidecar (например, без прокси или логгера оно сразу падает).
🟢Для критически важных сервисов, где порядок запуска влияет на надежность.
🟢В сценариях с логированием (Fluentd), сетевыми прокси (Istio/Envoy) или контейнерами для загрузки конфигурации.

В результате Kubernetes 1.33 дает возможность не только запускать Sidecar раньше основного приложения, но и быть уверенным в его готовности. Это делает систему более предсказуемой и снижает риск ошибок при запуске.

#заметкиИнженера
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥5👏21
🟡 kubespy — компактный CLI-инструмент для отслеживания работы ресурсов Kubernetes в реальном времени. Помогает быстро разобраться, что происходит с подами, сервисами и деплойментами.

Основной функционал:

📍Наблюдение за изменениями объектов в режиме реального времени с выводом всех внесенных модификаций в виде различий JSON
📍Подробный просмотр состояния ресурсов (status, changes, trace, record)
📍Поддержка стандартных и пользовательских ресурсов (CRD)
📍Наглядное отслеживание изменений состояния ресурсов Kubernetes (Deployment, Service, Pod и др.) в реальном времени
📍Можно использовать как отдельную утилиту или как плагин kubectl (kubectl spy)

👉 Git
#полезное
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥3👏2
🤵 Публичные выступления в ИТ: зачем и как?
(часть 1)

Доклад (эфир/подкаст) помогает превратить экспертизу во влияние: вы проверяете идеи и делитесь опытом с живой аудиторией. Получаете узнаваемость, вес в решениях и позиционирование компании (или своей личной экспертизы).

Для ИТ-специалиста сцена всегда чужая среда: аудитория реагирует непредсказуемо, задаёт вопросы в лоб и мгновенно чувствует сомнение.

Выход на сцену вызывает стресс и ощущение уязвимости.

Чтобы доклад сработал на вас, стоит готовиться.

🎧 Шаг за шагом

📍Определите цель

— Зачем вы идёте на сцену: решить проблему, показать подход, поделиться опытом, запустить дискуссию?..
— Польза доклада должна быть очевидна.

📍Уточните время и место в программе

— На доклад обычно 15–20 минут — примерно столько же держится внимание аудитории.
— Если выступаете первым — начните с цепляющего начала, чтобы сразу включить зал.
— Если последним — говорите короче и живее: слушатели уже устали.

📍Разберитесь с аудиторией

— Узнайте, кто будет в зале: безопасники, разработчики, тестировщики, менеджеры.
— Даже если событие «чисто для разработчиков», уточните профиль. Это разные уровни подготовки и интересов.
— Если уточняете прямо в начале доклада — сразу свяжите это с материалом.

📍Соберите структуру

— Простая схема: вступление → основная часть → вывод.
— Свяжите блоки между собой, чтобы получился единый рассказ.
— Продумайте последнюю фразу: именно её слушатели запомнят.

📍Проверьте факты и термины

— В ИТ много спорных слов и англицизмов. Объясняйте, что именно имеете в виду.
— Перепроверьте текст, цифры, диаграммы. Ошибка на слайде сразу бьёт по доверию.

📍Готовьте слайды после плана

— Сначала составьте текстовый план доклада.
— Слайд должен помогать, а не заменять рассказ: минимум текста, крупный шрифт, понятные картинки.
— Смотрите, чтобы всё было читаемо с последних рядов зала.

📍Репетируйте

— Прогоните доклад в полный хронометраж с таймером.
— Прочтите коллегам/друзьям: они заметят, где непонятно.
— Если есть доступ к залу, протестируйте там. Если нет — хотя бы представьте сцену, чтобы снизить стресс.

👍 Подготовка доклада — это только старт.
Дальше предстоит работа с голосом, умение справляться с волнением и привычка звучать естественно в микрофон.

Об этом — во второй части 😐

#MentalDebug
Please open Telegram to view this post
VIEW IN TELEGRAM
👍86🔥4👏2
😎 Как SLI, SLO и SLA делают сервис надёжным, а бизнес — предсказуемым

Друзья, в опросе о том, про какие метрики вам было бы интересно почитать, с ощутимым отрывом победили три заветные аббревиатуры.

С чувством, с толком, с расстановкой, на примере сервиса доставки еды рассказали, что это такое, чем отличаются, как посчитать и как установить цену на ошибки

👉
в новом материале
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥74👍4
👀Их невозможно купить. Только выиграть

Предпоследняя пятница августа. Самое время войти в осень красиво — и действовать.

Напомним: мы хотим разобраться, что реально происходит с облаками в России. Что бесит, что радует, кто работает стабильно, а кто падает раз в неделю. Нам важно слышать именно ваш опыт.

Что дальше?
🔵 Заполняете анкету — это 5–7 минут, но можно и расписать ситуации на полстраницы (нам такое нравится 👀).
🔵 Авторы самых подробных и честных ответов получают толстовки.
🔵 А мы сделаем открытый разбор — статистику и конкретные кейсы.

👉 Вот анкета. Действуйте.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥52👏2
🎙️ За неделю

✉️ К 2032 году российский ИТ-рынок вырастет до 6,5 трлн руб, главным драйвером станут облака и ПО.

✉️ С 1 сентября Max станет обязательным для предустановки на новые устройства в России.

✉️ Минцифры разработало концепцию регулирования ИИ до 2030 года, чтобы обеспечить безопасное применение технологий и ответственность за их злоупотребления.

✉️ Конец эпохи SaaS к 2030 году — бизнес-приложения заменят интеллектуальные ИИ-агенты.

✉️ Злоумышленники запустили фишинговые копии сайтов Минобрнауки и электронных дневников для кражи данных пользователей Госуслуг.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥1
💻 Шпаргалка по экосистеме Kubernetes

Must-have для DevOps и SRE, а также для платформенных инженеров и архитекторов, которые хотят иметь под рукой полную картину экосистемы инструментов.

by: ByteByteGo
#полезное #красивое
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍5👏3
This media is not supported in your browser
VIEW IN TELEGRAM
🌏 DR-план работает только в тестах?

Средний простой критичных систем стоит 2 млн ₽.

Мы уже разбирали, как составить DR-план, но важно помнить: сам документ не гарантирует защиты.

⚠️ Его нужно проверять на практике.

🏓 Как проверять?

Настольный тест — команда собирается и пошагово обсуждает действия при сбое: кто за что отвечает, какие процессы запускаются.
«Нам не хватало экспертизы в миграции и формализации. Коллеги из Cortel провели консультации, обучили сотрудников, подготовили документацию (DR-план, runbook и др.) и внедрили кластерное решение AlwaysOn»
— заместитель ИТ-директора крупного ритейлера в Сибирском ФО.


Техническая симуляция — проверяется, поднимаются ли сервисы с резервных копий, работает ли репликация, насколько корректно идут переключения.

«Тестировали развёртывание резерва на разных площадках: основная ERP DBDAX не запустилась на HDD. Коллеги предложили перевести на SSD — заработало», — замдиректора по ИТ.


Полное учение — моделируется аварийная ситуация, команда выполняет все шаги «вживую».

🏓 Как часто?

Раз в год — полноценное тестирование с имитацией инцидента.

После любых значимых изменений в инфраструктуре или бизнес-процессах.

Для систем с высокой динамикой — дополнительно, раз в квартал или чаще.


🟢Эффективность DR-плана определяется не его наличием, а реальной применимостью.

«Мы рассматриваем Cortel как четвёртую линию — экспертизу. Обращаемся при любых внутренних сложностях и оперативно получаем практико-ориентированные советы, которые сразу внедряем», — замдиректора по ИТ.


#гайды
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥73👍2
🖥 Горячие клавиши для управления процессами в Linux-терминале

Работа в Linux-терминале — это про скорость и эффективность, а горячие клавиши помогают мгновенно управлять процессами и сессиями.

⌨️ Подборка из 7 полезных комбинаций для прерывания и управления процессами.

Ctrl + C (SIGINT) — Прерывает выполнение текущего процесса, отправляя сигнал SIGINT. Например, если вы запустили tail -f или бесконечный цикл, Ctrl + C завершит его.

Ctrl + D (EOF) — Отправляет сигнал конца ввода (End of File). В контексте SSH-сессии или терминала закрывает текущую сессию, эквивалентно команде exit. Если ввести в пустой строке, завершает ввод для программ, ожидающих данные (например, cat > file.txt).

Ctrl + Z (SIGTSTP) — Приостанавливает выполнение процесса, отправляя сигнал SIGTSTP, и переводит его в фоновый режим. Чтобы вернуть процесс, используйте fg (в передний план) или bg (в фон). Пример: приостановите top и вернитесь к нему позже.

Ctrl + S (XOFF) — Приостанавливает вывод в терминал (например, для длинных логов). Полезно, чтобы временно "заморозить" поток данных.

Ctrl + Q (XON) — Возобновляет вывод, остановленный Ctrl + S. Если терминал "завис" после Ctrl + S, это спасение.

Ctrl + L — Полная очистка терминала (clear)

Ctrl + R — Поиск по истории команд

Горячие клавиши вроде Ctrl + C, Ctrl + Z и Ctrl + D — must-have для эффективной работы в терминале. Они экономят время и помогают управлять процессами без лишних команд

#заметкиИнженера
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13🔥31👏1😁1
🖥 Командная строка Linux

Практическое руководство по работе в командной строке Linux для администраторов, программистов и опытных пользователей.

🔎 Рассматривается:
— работа в консоли и настройка системы,
— особенности файловой системы Linux,
— команды для работы с текстом, сетью и Интернетом,
— инструменты системного администратора,
— написание скриптов на bash и tcsh,
— перенаправление ввода-вывода, маски, псевдонимы и запуск программ.

Автор:
Д. Н. Колисниченко
Издательство: БХВ-Петербург, 2023

#книги
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥2
🔈 Сентябрьские изменения в 152-ФЗ: что нужно сделать

С 1 сентября вступают в силу новые правила обработки персональных данных.

➡️ Что именно меняется:

➡️ Согласие на обработку данных — отдельный документ.
Больше нельзя прятать согласие внутри договора или пользовательского соглашения. У человека должен быть отдельный текст, где ясно сказано, какие данные собираются и зачем.

➡️ Обезличивание по методам.
Простая замена имени на «Х» больше не работает. Теперь должна быть формальная процедура: метод описан во внутреннем документе, исходные и обезличенные массивы хранятся раздельно, доступ к ним ограничен.

➡️ Жёсткая локализация.
С июля уже действует запрет на сбор и обработку данных россиян через базы за рубежом. Сентябрь лишь усиливает требования. Даже сторонний сервис аналитики или CDN может стать нарушением, если он обрабатывает ПДн за пределами РФ.

➡️ Что делать

➡️ Провести аудит.
Составьте карту, где именно собираются, хранятся и передаются данные. Важно проверить сторонние сервисы: облака, CRM, платёжные системы, маркетинговые платформы.

➡️ Обновить формы согласия.
Все новые согласия — только отдельными документами. Старые действуют, но при следующем обновлении или переподписании используйте новый формат.

➡️ Утвердить порядок обезличивания.
Пропишите методику, назначьте ответственных, разделите хранение. Это должно быть отражено во внутренних актах.

➡️ Перепроверить инфраструктуру.
Убедитесь, что данные не уходят за границу: ни напрямую, ни через вспомогательные сервисы.

➡️ Подготовить ОРД.
Политики, инструкции, регламенты — всё должно быть оформлено и актуально. При проверке у компании должен быть «набор доказательств» соответствия.

⚠️ Эти изменения — не формальность.
Регуляторы теперь имеют понятные критерии, по которым будут проверять операторов. Компании, которые успеют подготовиться, смогут избежать не только штрафов, но и риска остановки процессов.

#ИТиЗАКОН
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍3😱1
📍Трансграничная передача персональных данных в 2025: вопрос-ответ по ПДн

🔵 Что относится к трансграничной передаче?
🔵 Как быть компаниям, которые работают с иностранцами?
🔵 И о других конкретных кейсах

👉 Рассказала Вероника Нечаева
Please open Telegram to view this post
VIEW IN TELEGRAM
👍63🔥2
😎 Про речку, рыбалку и «идеальную точку»

Сидим на созвоне, ждём всех участников. Длинный проект с тяжёлой инфрой. ДИТ, только вышедший из отпуска, рассказывает историю, чтобы скоротать время…

Последняя пятница перед отпуском. Чувствую, что я уже медиум-рейр. Дедлайн поджимает, таски в джире горят, пайплайн крутится, билды в очереди, а я в огне.

Звонит друг: «Бросай свои комплюхтеры и поехали на рыбалку, место знаю хорошее!»

Вместо того чтобы закончить пораньше и послушать друга, я закрыл всё только к вечеру, и выехали мы после заката.

Ориентир был — «мостик с перилами и сразу вниз к воде». Пока искали, проехали несколько рек, где спокойно можно было бы остановиться, но друг упрямо тянулся к той самой «идеальной точке», и мы выбрали «бороться и искать».

Спустя пару часов, наконец-то мостик, перила, съезжаем на обочину, спускаемся вниз к воде. Перед нами — широкая гладь, тот берег даже фонарём не пробьёшь. Красота! Камышей нет, место и правда идеальное.

Закинули снасти, чуть перекусили, для храбрости… и незаметно отключились.

Проснулись на рассвете от гудков машин и криков. Смотрим вверх: водители сигналят и машут руками.
Собралась толпа, нас снимают и ржут в голос.

Мы оглядываемся, а у нас вместо реки — огромная лужа и бескрайнее поле люцерны, откуда торчат одинокие удочки…

Мы тогда собрались и уехали днём на «ту самую точку», но история как будто даже важнее улова.


Созвон прошёл, ДИТ поблагодарил всех и спросил, как у нас дела, и мы поделились последними новостями:

👀 Расширили проектный офис, чтобы курьёзные истории с рыбалкой возникали у вас чаще, чем истории с инфрой.
👀 Реализовали большой проект по миграции: перенесли мультисервисную инфраструктуру — дедики под БД и с GPU, огромный монолит в привате, и всё это — с отказоустойчивой, резервируемой сетевой связностью между ЦОДами клиента… Осенью расскажем подробно, как вы любите ❤️
👀 Каждому пользователю облака дали доступ к биллинговой системе с автоматизированными расчётами.
👀 Провели 4 полноценных ИБ-аудита по 152-ФЗ: в образовании, гостиничном комплексе, банке и производственной сфере.

Каждый месяц вас всё больше, и мы рады быть для вас полезными. Лето почти прошло, но самые интересные истории — впереди. Спасибо, что вы с нами 🩵

#ЛетоДосвидания
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥91👏1😁1
Этот день настал😘

Друзья, по уже сложившейся небольшой традиции, в пятницу дружески напоминаем вам о том, что если вы пользуетесь российскими облачными экосистемами — то практически выиграли нашу фирменную толстовку.

Тёплую, модную, объёмную, говорящую😎

А всего-то надо уделить 5 минут времени и коротко рассказать, где что отваливалось, чего не хватает, а что нравится в российских облаках👇

👉 Заполняю анкету и забираю толстовку

P.S. 3 толстовки 3 авторам самых подробных ответов
P.P.S. Первому автору-победителю напишем уже в понедельник!
P.P.P.S. Вдохновиться историями коллег можно в постах #подслушано

👉 Ну ладно, иду заполнять!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥32
🎙️ За неделю

✉️ Искусственный интеллект станет главным направлением, проекты с ним будут получать поддержку государства в первую очередь.

✉️ DDoS-атаки на фармкомпании в России резко выросли: с начала августа их стало на 82 % больше.

✉️ Российские производители предложили усложнить госзакупки иностранной электроники.

✉️ Главная угроза электросетям — скачки энергопотребления от ИИ-систем, которые могут физически повредить инфраструктуру.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥3
⚖️ Законы для ИТ и связи: что изменилось с 01.09.2025

👀 Персональные данные: отдельное согласие, обезличивание и передача в НСУД
Закон: 233-ФЗ (08.08.2024) , ПП №702 (22.05.2025) , №740 (28.05.2025 ), №961 (26.06.2025) , Приказ РКН №140 (19.06.2025).

Что изменилось:
📍Согласие на обработку ПДн теперь оформляется отдельным документом — нельзя прятать в договор или анкету.
📍По запросу Минцифры компании должны передавать обезличенные данные в гос­платформу (НСУД).
📍Данные нужно хранить раздельно: исходные и обезличенные. Требуются внутренние правила (локальные акты) по обезличиванию.

👀 Экстремизм и VPN: ответственность за умышленный поиск + запрет рекламы VPN
Закон: 281-ФЗ, 332-ФЗ (31.07.2025)

Что изменилось:
📍Появилась ответственность за умышленный поиск и доступ к экстремистским материалам (в т.ч. через VPN).
📍Рекламу VPN и сервисов обхода блокировок размещать нельзя.

👀 Абонентские номера и учётные записи: запрет длительной передачи третьим лицам
Закон: 281-ФЗ (31.07.2025); ПП №1050 (12.07.2025)

Что изменилось:

📍Нельзя надолго передавать свой номер (SIM) третьим лицам.
📍Нельзя передавать чужие логины/пароли без ведома владельца.
📍Краткая личная передача и передача близким/из перечня — допустима.

👀 Реклама на ресурсах нежелательных/заблокированных организаций — под запретом
Закон: 72-ФЗ (07.04.2025).

Что изменилось:
📍Запрещено размещать рекламу на сайтах/в приложениях нежелательных или экстремистских организаций, а также на ресурсах с ограниченным доступом в РФ.

👀 Предустановка ПО: MAX в перечне, RuStore обязателен (включая iOS/HyperOS)
Закон/акты: 194-ФЗ (07.07.2025); Распоряжение Правительства №2240-р (19.08.2025).

Что изменилось:

📍В перечень предустановки включили MAX (вместо VK Messenger).
📍RuStore обязателен на Android, HarmonyOS, iOS и HyperOS.
📍Нельзя ограничивать установку, использование и оплату приложений через RuStore. Иначе — товар считается с недостатком.

#ИТиЗАКОН
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥5👏2👎1
🎚 Управляемая деградация

Недавно, обсуждая оперативную устойчивость, зацепили тему управляемой деградации.

Наш инженер вспомнил, как на заре своей карьеры попал в такое “боевое крещение”:
«Мы пилили один интернет-сервис. Предпраздничные дни, нагрузка выросла в 4 раза и сервера начали гудеть, как старый трактор. Главный архитектор сказал: «Всё, режем жир». Выключили аналитику, убрали тяжёлые картинки, закрыли пару второстепенных API — и дожили до вечера без падения. Клиент платил, корзина работала, авторизация держалась. Остальное вернули позже — по плану.»


Управляемая деградация это отличный инструмент, но в нем есть подводные камни и преимущества

➡️ Минусы

🔴Надо знать, что резать.
Если рубанёшь не то, то вместо мягкой посадки получится эпичный краш. Нужно заранее иметь «список жертвенных функций».

🔴Пользователь всё равно что-то заметит.
Да, он останется в системе, но может выказать недовольства. Особенно, если отключили то, к чему он привык.

🔴Соблазн оставить всё как есть.
Иногда после аварии всё чинить лень, и «режим урезанной функциональности» живёт годами. А это уже не управляемая деградация, а технический долг.

➡️ Плюсы

🟢Выживание.
Главное — система остаётся на ногах, даже если хромает. Это спасает репутацию и деньги ( SLI/SLO/SLA).

🟢Гибкость.
Можно быстро адаптироваться под нагрузку, экономить ресурсы и отложить катастрофу.

🟢Хороший тест для архитектуры.
Если можно отключить второстепенные части и сервис при этом не падает — значит, архитектура живая.

➡️ Как готовиться и действовать:

🟡 Шаг 1 — подготовка
— Задать пороги включения деградации: что именно и при каких метриках выключаем.
— Составить матрицу приоритетов A/B/C и согласовать список «жертвенных».
— Внедрить переключатели фич, лимитирование трафика, автоматические “отсекатели” и брокер очередей.
— Потренировать переключения на учениях.

🟡 Шаг 2 — Отключение
— Отключать по приоритетам: сначала C, затем B; A — неприкасаемые (авторизация, корзина, оплата).
— Решения фиксировать: кто, что, когда отключил и на какой срок.
— Коротко сообщить пользователю: статус-страница или баннер «часть функций временно недоступна».

🟡Шаг 3 — Возврат
— Определить критерии отката: возвращаем функциональность, когда метрики стабильно в зелёной зоне.
— Восстанавливать в обратном порядке: B → C, с мониторингом.
— Короткий разбор: что сработало, что улучшить; обновить пороги и список «жертвенных».

🤔 Когда может пригодиться:

Праздники, распродажи и прочие «дни хаоса», резкий хайп, аварии, экономия бюджета, учебные тревоги.

Управляемая деградация — как режим энергосбережения для сервиса и часть общей операционной устойчивости: вместе с DR-планом и регулярными учениями.

#гайды
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥65
⭐️ Загадка зависшего Temporal UI. Часть 1 — расследование

Развернули Temporal (оркестратор workflow) в Docker и подключили две PostgreSQL-базы (основная и visibility).

Всё шло гладко. Через какое-то время от разработчиков прилетел запрос: «UI Temporal отдаёт 200 ОК, но ничего не грузит. Страница открывается, но данные не появляются.»

📍Проверили:
— Нагрузка на ноды в норме
— CPU/память без пиков, диски не забиты
— Алерты молчат.

Пробовали масштабировать Temporal и облегчить «тяжёлые» воркфлоу — без эффекта.
Подключили детальный мониторинг БД — и словили сюрприз: задержка отдельных запросов доходила до ~8 минут.

Копнули глубже: очередь соединений росла, а PgBouncer упирался в лимиты пула.
Это и оказался корень проблемы.

📍Что такое PgBouncer
— это лёгкий прокси для PostgreSQL, который управляет пулом соединений. Он ограничивает число одновременных коннектов от приложений, чтобы не положить базу. Когда пул переполнен, новые запросы встают в очередь и ждут свободного «слота». В этот момент UI кажется «зависшим»: страница уже вернула 200 ОК, но данных нет — запросы стоят в очереди на соединение.

Простая метафора
Запросы — пассажиры на остановке.
Пул соединений — парк автобусов с фиксированным числом машин(например 50).
База — конечная точка пути.
Пока все автобусы заняты, новые пассажиры стоят в очереди. Чем длиннее очередь, тем дольше UI «ничего не показывает».

Как это выглядит в архитектуре:
[Приложение / Temporal UI] → запросы → [PgBouncer] → очередь → [PostgreSQL]


📍Как мы подтвердили узкое место
— На дашбордах выросло время ответа БД и число «висящих» запросов
— В PgBouncer cl_active упёрся в лимит пула, а cl_waiting начал расти

Во второй части разберем:
— Подробный разбор: max_client_conn, default_pool_size, reserve_pool_size
— Что это такое и как работает — на аналогии с «автопарком» и очередью
— Как подобрать значения под вашу нагрузку и ограничения Postgres.

#заметкиИнженера
Please open Telegram to view this post
VIEW IN TELEGRAM
👍126🔥5😱1