Аналитика данных / Data Study
9.45K subscribers
557 photos
53 videos
25 files
423 links
Помогаю аналитикам расти в профессии и доходе

Курс по продвинутому SQL и автоматизации потоков данных https://datastudy.ru/

По всем вопросам: @daniildzheparov

Моя жизнь, опыт, аналитика и инженерия данных
Download Telegram
Кто не работает последние дни также с пляжа, тот плохо работал весь год 😁🧑‍💻

с наступающими)
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20🎉11👀62🫡1
This media is not supported in your browser
VIEW IN TELEGRAM
Поздравляю всех с наступающим Новым Годом!!! 🎄

Хочу сказать вам спасибо просто за то, что вы читаете сейчас этот пост и канал) В Новом Году буду дальше продолжать делиться полезными материалами, проводить обучение и просто показывать часть своей жизни.

Желаю всем крепкого здоровья, любви и огромного счастья, всех обнял 🤗
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉368👀1
Привет!

Всех с прошедшими праздниками и началом рабочих будней)

Этот Новый Год впервые встретили необычно для себя в новом месте, даже больше - в новой стране. Открыли для себя Египет 🇪🇬

🔹посетили Луксор, где погуляли и познакомились с древними дворцами, построенными 5 ТЫСЯЧ ЛЕТ НАЗАД 😯
🔹съездили на Сафари в пустыню, покатались на верблюдах, багги и квадроциклах, попробовали хлеб от местных бедуинов
🔹снорклили и дайвили в Красном море, где увидели красивейший подводный мир рыб и кораллов
🔹устраивали праздничный ужин в разных ресторанах отеля с Шведским столом
🔹танцевали в удовольствие с animation team и восхищались вечерними танцевальными шоу
🔹созерцали красоту природы и красивейших закатов
🔹делали много кадров на память

Эти праздники действительно удалось на 1000% отключиться от бытовых дел, работы, контента

Москва 🛫 Хургада 🛬 Москва 🚗 Краснодар

Первую рабочую неделю проведу в Краснодаре, вчера еще было +12, сегодня на удивление -2 и выпало много снега 😃

P.S. кто хочет буду рад вас видеть в "нельзяграм", там больше фоток и сторис с поездок и других активностей, не связанных с работой) - мой аккаунт
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥18👍94👀1
В начале года на работе занимаюсь 2-мя вещами

1. Планирование
2. Чистка всего неактуального

Вчера актуализировал список аналитических витрин. У нашей команды их больше 100 штук, часть со временем становятся неактуальными, вот чтобы лишний раз не тратить время на их поддержку и обновление - архивируем или делаем данные статичными.

Сегодня чистил задачи в Jira и обсуждали плановые задачи на квартал.

Чтобы найти ресурсы для нового нужно подчистить старое)

Что такое витрина данных
👍16🔥42👏1
Цель на этот год - просто кайфовать от своего дела


📍Моё дело - анализировать и обучать этому других 😉

В этом году делаю фокус на то чем мне нравится заниматься
1️⃣ работать с данными самому
2️⃣обучать работе с данными всех заинтересованных

Поэтому уже 2 февраля стартует обучение "Продвинутый SQL и автоматизация витрин данных"

🔹6 недель активного обучения решать задачи анализа "под ключ" с инженерной составляющей
🔹SQL, Python, Airflow, Cloud Functions, Github - набор сильного аналитика-инженера

Заполняй форму, пообщаемся про твой опыт и подходит ли тебе обучение, расскажу про курс и покажу его изнутри 👇

Предзапись в группу
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥71
Новая роль в компании

С понедельника включаюсь в другой проект компании и его задачи. В первую очередь погружаюсь в
📍 бизнес составляющую направления. Какие бизнес-процессы работают и как аналитика в них участвует
📍состав команды и коллег. Кто чем занимается и за что отвечает, а также как взаимодействует с аналитикой
📍 источники данных. Откуда берем данные
📍 потоки данных до конечных пользователей. Витрины данных, джобы автоматизации, отчеты, алерты
📍 доступы. Запрашиваю постепенно доступы ко всем нужных ресурсам которые в прошлых пунктах нашлись

Сейчас главная задача погрузиться во все процессы и текущие активности (их много), чтобы на встречах понимать о чем идет речь и с чем это связано, а не просто умные слова слышать 😄
🔥19🎉8👍7
SQL + Python = универсальная связка для работы с данными

Если умеешь правильно работать в связке с SQL и Python, то можешь решать сразу широкий спектр задач ⤵️

🔜 собирать аналитические таблицы для отчетов и обновлять в них данные автоматически

🔜 посчитать метрики и отправить сообщение в любой мессенджер

🔜 переложить данные из одной системы или базы в другую автоматически

🔜 проверять автоматически качество ваших данных в любой системе перед тем как им верить и принимать решения

🔜 интегрировать AI в ваши бизнес-процессы, а готовить и предоставлять данные для него автоматически с помощью SQL+Python

...и много других примеров

Поэтому если хочешь иметь востребованные навыки на рынке и расти как аналитик-инженер, жду тебя на обучении "Продвинутый SQL и автоматизация витрин данных" 👨‍💻

Освоишь на продвинутом уровне следующий стек:
- PostgreSQL
- Apache Airflow
- Cloud Functions
- Github

Выходи на новый уровень в профессии и работы с данными!

Предзапись в группу или оплата на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
👍104
Как не выгорать на работе

📍Четко раздели рабочее время и отдых (особенно важно для удаленщиков) 

📍Обучайся всегда новому, это дает мозгу позитив и возможность менять/расширять свою деятельность

📍Старайся менять задачи или подход к их решению. Так избавишься от рутины

📍Следи за здоровьем. Причина выгорания не всегда связана с работой, это признак ментальной и физической усталости

📍Найди и выдели время на хобби - то что реально приносит удовольствие

Лично мне помогает смена обстановки в виде поездок, мини-путешествий, прогулок по городу и вечера детокса от всех гаджетов
🔥2110👍4
Конструкция фильтрация для функций агрегации

Хочу рассказать про удобную конструкцию, про которую знают далеко не все. Часто возникают ситуации, когда при агрегации нужно учесть не все строки данных, а только подходящие под определенные условия.

Конструкция такая:
функция агрегации FILTER (WHERE условие фильтрации данных для учета в этой метрике)


Например, нам нужно посчитать несколько метрик
- кол-во всех клиентов по customer_id
- кол-во клиентов, у которых источник регистрации будет один из этих: direct, form, vk

Пишем запрос
SELECT 
COUNT(DISTINCT customer_id),
COUNT(DISTINCT customer_id) FILTER (WHERE reg_source IN ('direct', 'form', 'vk')
FROM customers


Можно конечно писать через CASE, но конструкция с фильтром более наглядная, емкая и эффективная в плане оптимизации
SELECT 
COUNT(DISTINCT customer_id),
COUNT(DISTINCT
CASE
WHEN reg_source IN ('direct', 'form', 'vk') THEN customer_id
ELSE NULL
END)
FROM customers


Еще больше фишек SQL на продвинутом курсе, запись в группу
🔥16🤓13👍31
Иногда в выходные буду делиться рекомендацией фильмов и сериалов (не всегда про IT), но сегодня начнем с классики, наверняка многие не смотрели

Сериал "Силиконовая долина"

Комедийный сериал о группе программистов, которые создают стартап в Кремниевой долине. Главный герой Ричард Хендрикс случайно разрабатывает революционный алгоритм сжатия данных, который привлекает внимание крупных IT-корпораций. Сериал показывает внутреннюю кухню стартапов: технические задачи, поиск инвесторов, офисные интриги и конкуренцию на рынке.

#рекомендация_фильмы
12👍6🔥3
PostgreSQL + Airflow + Github - как устроена инфраструктура на курсе

В рамках обучения ученики будут работать в построенной инфраструктуры, которую описал на схеме.

PostgreSQL - используется как аналитическое хранилище, в котором данные разделены по слоям хранения.
RAW - сырые данные, которые динамически обновляются
CORE - общие преобразованные данные в чистые таблицы
MART - слой витрин, который каждый ученик будет разрабатывать в рамках практики

Apache Airflow - автоматизирует процесс сборки таблиц и витрин через DAGи. что это и как писать разбираем в теории и практике.

GitHub - у каждого есть свой рабочий репозиторий, который играет 2 задачи
- хранение скриптов со всей логикой сборки данных
- создание и деплой DAG в Airflow для написания автоматизации
Если не было раньше практики с git, не проблема, на курсе все разбирается

Такая практика и погружение в реальные инструменты позволяет максимально прокачать твои харды! 🔥

Чтобы у тебя даже в мыслях не было сказать
- "я не уверен в своих знаниях"
- "я не силен в технических навыках"
- "я могу решать только простые задачи"

Если что-то непонятно, пишешь вопросы, я веду группу учеников лично

Предзапись на курс
🔥84🤓2
Многие аналитики привыкли решать задачи в виде разовых запросов. Ну например к вам пришел менеджер и спросил
Какую выручку заработали за вчера?

И ты идешь собираешь информацию по разным таблицам или выполняешь свой "шаблонный" запрос на этот случай, потому что посчитанных готовых метрик под рукой просто нет. Знакомо?

А если таких вопросов будет много или каждый такой вопрос от бизнеса будет более комплексным? Такие запросы буду съедать все твое время и задачи превратятся в рутину(

В таком случае удобно создавать витрины данных

Витрина данных - таблица с достаточными, очищенными, преобразованными данными для решения конкретной задачи.


Данные перед витриной проходят нужные шаги сборки и обработки: объединяются, фильтруются, чистятся, агрегируются, считаются нужные метрики.

Дальше витрина данных становится основным источником правды для всех ответов на вопросы от бизнеса и может быть использована
- в BI отчетах
- для рассылки метрик в мессенджеры
- для обычных выгрузок в excel
- для отправок по другим каналам связи типа email

На обучении "Продвинутый SQL и автоматизация витрин данных" за 1.5 месяца научишься создавать качественные витрины данных под любые задачи

Записаться в группу
👍74🔥3