Базы данных & SQL
7.4K subscribers
89 photos
1.15K links
Канал для тех, кому интересна сфера баз данных (СУБД, SQL, NoSQL). Выкладываем обучающие материалы, статьи, опросы, как для новичков, так и для профессионалов.

Вопросы и предложения: @Ev_S_Lit
Download Telegram
​​От скриншота до PostgreSQL: парсим банковские операции через Claude Vision

"Это первая статья из цикла о построении CDC-пайплайна в домашней лаборатории.
Полный путь: Telegram → PostgreSQL → Debezium → Kafka → HDFS → DWH.
Но любой пайплайн начинается с данных — и эта статья про их получение."

Читать статью
👍5
​​PostgreSQL и 1С: как построить систему поиска «тихих убийц» производительности

Эта статья — не академическое исследование внутреннего устройства СУБД, а описание универсального инженерного подхода к контролю качества кода и нагрузки на базу. Авторы покажут, как с помощью бесплатного инструмента pgBadger организовать регулярный аудит запросов и почему этот метод критически важен для любой OLTP‑системы — он помогает купировать риски падений во время пиковых нагрузок. Методика проиллюстрирована на реальном примере из практики.

Читать статью
Как мы сократили объем данных в 10 раз, не повредив пользовательскому опыту, или переезд Postgres → ClickHouse

Автор - Алексей Леонтьев, я техлид и архитектор на проекте Smartbot в компании KTS:
"Smartbot — это nocode-платформа для настройки сценариев чат-ботов, которые могут работать в нескольких соцсетях и мессенджерах одновременно.

Мы храним информацию о событиях, которые обрабатывает наша платформа. Подробнее о них я расскажу ниже, сейчас важно указать, что все эти события формируют статистику, доступную пользователям. И данные для этой статистики, собранные за год, уже занимают у нас под 2 ТБ дискового пространства, что дорого само по себе, не говоря уже о том, что некоторые запросы в базу стали выполняться заметно дольше ожидаемого."

Читать статью
Как один индекс на created_at сократил время ответа API с 12 секунд до 40 мс

Читать статью
👍5
​​25 железных правил проектирования баз данных в PostgreSQL

В статье приведены 25 правил, которые Автор собрал из опыта работы с высоконагруженными системами. Это не теория из учебника — это грабли, на которые уже наступили до вас. Каждое правило сопровождается примером «как надо» и «как не надо», чтобы разница была наглядной.

Читать статью
👍5😢2
​​SQL для ритейла: пример 5 задач, которые я решала как аналитик ассортимента

В статье на примере пяти реальных задач из ритейла показывается, как аналитик ассортимента использует SQL для работы. Автор делится опытом, как с нуля (без технического бэкграунда) освоила язык для решения практических вопросов: анализа товаров, категорий, продаж и поставок. Статья доказывает, что SQL — логичный и мощный инструмент для извлечения данных, а не просто абстрактный навык из требований вакансий.

Читать статью
👍31
Виды моделирования данных. Полный гайд

"Спроси любого уважаемого аналитика или инженера данных о том, какие бывают способы моделирования данных, тебе ответят: звезда, 3NF и DataVault. Спроси ИИ, получишь примерно такой же ответ. Придешь на какой-нибудь проект в компанию, также скорее всего встретишь там кого-нибудь из этих друзей. В 90% материалах про методологии моделирования освещаются только эти трое. Как будто других методологий не существует.

Да, эта троица, наверное, самая популярная и подходящая под большую часть задач, но в мире есть еще уйма других не менее интересных способов как организовать свои данные. И сегодня мы постараемся целиком их рассмотреть. Если какие-то упустил, пишите в комментах, интересно будет почитать."

Читать статью
Ускоряем вставку данных в PostgreSQL

Это текстовая версия доклада с Java Rock Star Meetup, с которым выступал Дмитрий Фатов, руководитель разработки Газпромбанка:
"В докладе разберём, как ускорить вставку данных в PostgreSQL:

- От обычных insert до кастомных методов PostgreSQL и сколько профита они дают по производительности.
- Распараллеливание процесса вставки с сохранением атомарности всей операции.
- Как ускорить обновление данных в PostgreSQL и сделать эту вставку атомарной.
- Важное примечание. Все примеры в статье будут написаны без использования ORM. Только JDBC, только хардор)"

Читать статью
​​Почему VACUUM не спасает от раздувания индексов в PostgreSQL

"Есть одно распространённое заблуждение, которое мешает многим разработчикам, работающим с PostgreSQL: достаточно настроить VACUUM или просто запускать VACUUM, и база данных будет оставаться в хорошем состоянии. Мёртвые кортежи будут удаляться. Идентификаторы транзакций — переиспользоваться, а пространство — освобождаться. И база данных будет счастливо жить дальше.

Но здесь есть пара неприятных моментов, о которых многие не знают. Первый из них заключается в том, что VACUUM вводит вас в заблуждение, когда дело касается индексов."

Читать статью
👍3
​​Книга «PostgreSQL 16. Оптимизация запросов»: учимся читать мысли планировщика

"Планировщик запросов PostgreSQL — это интеллект, принимающий тысячи решений в секунду, и именно его понимание отличает хорошего разработчика от великолепного. Книга Павла Толмачёва «PostgreSQL 16. Оптимизация запросов» — компактный, но ёмкий путеводитель по внутренней кухне планировщика: как устроена его логика, как читать планы выполнения запросов и как исправить его, когда он ошибается."

Читать статью
👍4