Data Science. SQL hub
36K subscribers
1.01K photos
63 videos
37 files
1.05K links
По всем вопросам- @workakkk

@itchannels_telegram - 🔥лучшие ит-каналы

@ai_machinelearning_big_data - Machine learning

@pythonl - Python

@pythonlbooks- python книги📚

@datascienceiot - ml книги📚

РКН: https://vk.cc/cIi9vo
Download Telegram
Microsoft запустила VibeVoice Realtime на Hugging Face - лёгкую стриминговую text-to-speech модель, которая начинает озвучивать текст примерно за 300 миллисекунд.

Идеально для живых данных и разговоров с LLM.

huggingface.co/microsoft/VibeVoice-Realtime-0.5B
7👍3👎1
🐘 Postgres использует архитектуру «отдельный процесс на каждое подключение», поэтому в большинстве случаев вам нужен connection pooler.

Пул соединений вставляется между приложением и базой: он держит набор постоянных подключений и динамически назначает их входящим запросам. Самый распространённый инструмент - PgBouncer, у которого есть три режима работы.

1) Session pooling - каждое приложение-подключение закрепляется за одним pooled-соединением.
2) Transaction pooling - каждую транзакцию привязывают к pooled-соединению и освобождают сразу после завершения.
3) Statement pooling - каждое выражение получает соединение, но нет поддержки многозапросных транзакций, что сильно ограничивает кейсы.

Режим 1 плохо решает проблемы высокой конкуренции Postgres, поэтому обычно не подходит при большом числе подключений. Режим 3 слишком ограничивающий, так как многозапросные транзакции нужны многим приложениям. В итоге режим 2 даёт лучший баланс возможностей и контроля над соединениями.

Именно transaction pooling, тот режим, который PlanetScale применяет для всех своих PgBouncer-инстансов.

@sqlhub
👍7🔥42
📦 Распределенная база данных FoundationDB 🚀

FoundationDB — это распределенная база данных, оптимизированная для обработки больших объемов структурированных данных. Она использует упорядоченное хранилище ключ-значение и поддерживает ACID-транзакции, обеспечивая высокую производительность как для чтения, так и для записи.

🚀Основные моменты:
- Поддержка ACID-транзакций для надежности данных.
- Высокая производительность для рабочих нагрузок с частыми записями.
- Гибкая архитектура для масштабирования на кластерах серверов.
- API для взаимодействия на различных языках программирования.

📌 GitHub: https://github.com/apple/foundationdb

@sqlhub
This media is not supported in your browser
VIEW IN TELEGRAM
Полезная шпаргалка по консольным командам Git 👍

В Git полно команд, и если ты часто их забываешь, эта шпаргалка специально для тебя. В репозитории можно быстро почитать об основных командах и концепциях, а затем одним вальяжным нажатием на Ctrl+C скопировать их.

Приятный бонус — всё написано на русском. Так что сохраняем!

#git #шпаргалка
Please open Telegram to view this post
VIEW IN TELEGRAM
👍51🥰1
Вы играли в детстве в «Героев меча и магии»? А что, если в них добавить немного дата-аналитики и технологий работы с данными?

Yandex Cloud вместе с Forbes запустили мини-игру, отчасти вдохновленную «Героями».

⚔️ В этой игре ты становишься «Героем данных и киберпанка», а привычные инструменты — PostgreSQL, ClickHouse, Trino, DataLens и другие — превращаются в артефакты с уникальными свойствами. Их можно получить у хранителей или создать в кибер-кузнице.

🐉 В проекте можно найти отсылки к классической игре, например, «Аналитики объявили месяц Чистых Логов. Время поиска багов уменьшилось втрое».

🎯 Игроки выбирают героя и помогают ему решить задачи из финтеха, ритейла или промышленности. Для победы нужно собрать нужный набор артефактов и справиться с «дата-хаосом».

🖥 Игра доступна на десктопе и мобильных устройствах.

📊 В дополнение к игровому опыту на лендинге есть реальные примеры, как компании используют решения Yandex Cloud для аналитики и обработки данных в бизнесе.

👉 Подробнее и поиграть можно здесь.
7👎1
⚙️ Context-async-sqlalchemy: простой способ подружить ASGI и async SQLAlchemy

Эта библиотека упрощает интеграцию асинхронного SQLAlchemy в любые ASGI-приложения.

Что она делает:
• управляет жизненным циклом engine и сессий
• даёт удобные утилиты для работы с БД
• ускоряет разработку — без лишней магии и ограничений

Идея простая: меньше шаблонного кода, больше внимания логике приложения.

https://github.com/krylosov-aa/context-async-sqlalchemy
3🔥1
🚀 Новый продвинутый планировщик заданий для PostgreSQL - лучше, чем cron

Если устал от cron и временных триггеров, обрати внимание на pg_timetable:

Сильный: гибкий, надёжный, с богатым функционалом
Легко настраивается, понятен и прозрачен
Позволяет:
• запускать SQL-задачи по расписанию
• отслеживать их статус и history
• обеспечивать graceful restart и защиту от сбоев

Идеален для рабочих баз, сложной логики задач и критичных приложений.

📦 Репозиторий: https://github.com/cybertec-postgresql/pg_timetable

#golang #postgresql #devops #golang
👍114🔥2
🖥 GophrQL - GraphQL toolkit for Go

Что это:
GophrQL — это простая и мощная библиотека на Go, которая помогает строить GraphQL API быстро и с минимальной болью. Она стремится быть легковесной, понятной и удобной для разработчиков, работающих с Go + GraphQL.

Основные фишки:
- Чистый Go-фэйс для описания схемы и резолверов
- Минимум магии и зависимостей
- Явная интеграция с Go-типами
- Хорошо подходит для микросервисов и сервисов с высокими требованиями к производительности

Почему это полезно:
Если вы пишете API на Go и хотите GraphQL без тяжеловесных фреймворков, GophrQL даёт:
✔️ строгую типизацию
✔️ контроль над схемой
✔️ простую и понятную структуру кода
✔️ меньше boilerplate-кода по сравнению с другими Go GraphQL решениями

Кому подойдёт:
- Go-разработчикам, которым нужен GraphQL API
- Командам, ищущим лёгкую альтернативу тяжёлым GraphQL-фреймворкам
- Проектам, где важна производительность и явное управление схемой

🔗 Репозиторий: github.com/maxpert/gophrql
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥3👍2
✔️ Tencent представила диффузионную языковую модель: в 6 раз быстрее классических LLM

WeDLM-8B Instruct использует не авторегрессию, как обычные LLM,
а диффузионный способ генерации текста.

Что это даёт?
🚀 В задачах математического рассуждения модель работает в 3–6 раз быстрее,
чем Qwen3-8B даже с оптимизациями vLLM - при сохранении качества.

Этот релиз ломает старый миф, что «диффузионные модели не подходят для точных текстовых задач».

На практике WeDLM показывает, что такой подход может конкурировать
и даже обходить трансформеры по скорости инференса.

Модель открыта и доступна под лицензией Apache 2.0:

🔗 https://wedlm.github.io

🔗 https://huggingface.co/tencent/WeDLM-8B-Instruct
8👍7🥰1
🖥 XiYan-SQL - инструмент для интерактивной работы с SQL, основанный на LLM

XiYan-SQL - это open-source решение, позволяющее генерировать, анализировать и выполнять SQL-запросы с использованием больших языковых моделей. Инструмент ориентирован на ускорение исследования данных и автоматизацию рутинных операций, связанных с запросами к базе.

Ключевые возможности:
- Генерация SQL из естественного языка -пользователь формулирует задачу обычными словами, а система преобразует её в корректный SQL-запрос.
- Интерактивная работа с базой данных - запросы можно оперативно уточнять, редактировать и выполнять, получая быстрый цикл обратной связи.
- Поддержка нескольких СУБД - PostgreSQL, MySQL, SQLite и другие.
- 🛠️ Минимальная конфигурация - подходит для анализа данных, прототипирования и облегчения доступа к базе без сложной инфраструктуры.

Преимущества использования:
- Существенно снижает трудоёмкость написания сложных SQL-запросов.
- Упрощает работу аналитикам и разработчикам, которым важно быстро получать корректные результаты.
- Может выступать в роли интерактивного помощника для изучения структуры базы и построения отчётов.

🔗 Репозиторий: github.com/XGenerationLab/XiYan-SQL

@ai_machinelearning_big_data


#sql #llm #ai #opensource #database #datatools #postgresql
Please open Telegram to view this post
VIEW IN TELEGRAM
👍106👎6🥰1
🔐 Postgresus 2.0 - новая версия self-hosted инструмента для резервного копирования и мониторинга PostgreSQL баз данных, написанный на Go

🔥 Возможности:
- создание бекапов по расписанию для PostgreSQL 12-18;
- хранение бекапов локально, в S3, CloudFlare R2, NAS или Google Drive;
- health check базы данных раз в минуту;
- уведомления в Telegram, Slack, MS Teams, Discord, по почте и в кастомизируемый вебхук, если бекап сломался или база недоступна;
- разделение баз на проекты с контролем доступа и аудит логами (для DBA и DevOps команд);
- улучшенная защита: шифрование резервных копий и read-only пользователь для их создания;
- запуск через скрипт, Docker, Docker Compose и Kubernetes Helm

Запуск через Docker:

docker run -d \
--name postgresus \
-p 4005:4005 \
-v ./postgresus-data:/postgresus-data \
--restart unless-stopped \
rostislavdugin/postgresus:latest


📌 GitHub

@sqlhub
👍115🔥3😁1
🎉 PostgreSQL playground прямо в браузере через WASM!

Открыл для себя интересный проект: полностью работающий PostgreSQL в браузере с помощью WebAssembly!

Теперь можно запускать и экспериментировать с PostgreSQL прямо в браузере — без установки, настроек и локальных серверов. Отлично подходит для:
- обучения SQL
- быстрых прототипов
- демонстраций
- тестирования запросов

🚀 PostgreSQL everywhere — даже в браузере!

🔗 https://github.com/datawan-labs/pg/
👍7🔥42🥰1
🖥 На Stepik вышел курс, который учит работать с Docker на реальных проектах.

Владение Docker - навык, который отличает новичка от профи,

Сегодня почти всё разворачивается в контейнерах.

Если ты не умеешь работать с Docker, ты медленнее, зависим от чужих настроек и постоянно ловишь баги «у меня локально работает».

• как упаковывать проекты в контейнеры
• как поднимать целые системы за минуты
• как избегать типичных ошибок в продакшене
• как делать стабильные и повторяемые окружения
•в нем разобраны все возможные ошибки

Только практика и реальные кейсы от авторов Docker Академии- с нуля до уверенного уровня.

🎁 Скидка 40 процентов действует 48 часов


👉 Записывайся и сделай Docker своим настоящим рабочим инструментом.
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Навязчивый контроль

@sqlhub
12😁8👍2🔥1
🔥 Хочешь прокачаться в аналитике, но не просто читать теорию, а решать реальные задачи?

Мы запустили полностью бесплатный телеграм-тренажёр 👇

Тебя ждут сценарии, с которыми сталкиваются аналитики каждый день: от простых запросов до задач уровня собеседований.

Что внутри:

живые кейсы из реальной практики
удобный симулятор - как работа в компании, только бесплатно
разбор ошибок — понимаешь не только «как», но и «почему»
добавляем задачи с интервью и улучшаем бот вместе с сообществом

Начни тренироваться сегодня — и почувствуй уверенность в работе с данными.

t.me/Analitics_databot
🔥8👍52