Аналитика данных / Data Study
9.45K subscribers
557 photos
53 videos
25 files
423 links
Помогаю аналитикам расти в профессии и доходе

Курс по продвинутому SQL и автоматизации потоков данных https://datastudy.ru/

По всем вопросам: @daniildzheparov

Моя жизнь, опыт, аналитика и инженерия данных
Download Telegram
Привет!

Всех с прошедшими праздниками и началом рабочих будней)

Этот Новый Год впервые встретили необычно для себя в новом месте, даже больше - в новой стране. Открыли для себя Египет 🇪🇬

🔹посетили Луксор, где погуляли и познакомились с древними дворцами, построенными 5 ТЫСЯЧ ЛЕТ НАЗАД 😯
🔹съездили на Сафари в пустыню, покатались на верблюдах, багги и квадроциклах, попробовали хлеб от местных бедуинов
🔹снорклили и дайвили в Красном море, где увидели красивейший подводный мир рыб и кораллов
🔹устраивали праздничный ужин в разных ресторанах отеля с Шведским столом
🔹танцевали в удовольствие с animation team и восхищались вечерними танцевальными шоу
🔹созерцали красоту природы и красивейших закатов
🔹делали много кадров на память

Эти праздники действительно удалось на 1000% отключиться от бытовых дел, работы, контента

Москва 🛫 Хургада 🛬 Москва 🚗 Краснодар

Первую рабочую неделю проведу в Краснодаре, вчера еще было +12, сегодня на удивление -2 и выпало много снега 😃

P.S. кто хочет буду рад вас видеть в "нельзяграм", там больше фоток и сторис с поездок и других активностей, не связанных с работой) - мой аккаунт
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥18👍94👀1
В начале года на работе занимаюсь 2-мя вещами

1. Планирование
2. Чистка всего неактуального

Вчера актуализировал список аналитических витрин. У нашей команды их больше 100 штук, часть со временем становятся неактуальными, вот чтобы лишний раз не тратить время на их поддержку и обновление - архивируем или делаем данные статичными.

Сегодня чистил задачи в Jira и обсуждали плановые задачи на квартал.

Чтобы найти ресурсы для нового нужно подчистить старое)

Что такое витрина данных
👍16🔥42👏1
Цель на этот год - просто кайфовать от своего дела


📍Моё дело - анализировать и обучать этому других 😉

В этом году делаю фокус на то чем мне нравится заниматься
1️⃣ работать с данными самому
2️⃣обучать работе с данными всех заинтересованных

Поэтому уже 2 февраля стартует обучение "Продвинутый SQL и автоматизация витрин данных"

🔹6 недель активного обучения решать задачи анализа "под ключ" с инженерной составляющей
🔹SQL, Python, Airflow, Cloud Functions, Github - набор сильного аналитика-инженера

Заполняй форму, пообщаемся про твой опыт и подходит ли тебе обучение, расскажу про курс и покажу его изнутри 👇

Предзапись в группу
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥71
Новая роль в компании

С понедельника включаюсь в другой проект компании и его задачи. В первую очередь погружаюсь в
📍 бизнес составляющую направления. Какие бизнес-процессы работают и как аналитика в них участвует
📍состав команды и коллег. Кто чем занимается и за что отвечает, а также как взаимодействует с аналитикой
📍 источники данных. Откуда берем данные
📍 потоки данных до конечных пользователей. Витрины данных, джобы автоматизации, отчеты, алерты
📍 доступы. Запрашиваю постепенно доступы ко всем нужных ресурсам которые в прошлых пунктах нашлись

Сейчас главная задача погрузиться во все процессы и текущие активности (их много), чтобы на встречах понимать о чем идет речь и с чем это связано, а не просто умные слова слышать 😄
🔥19🎉8👍7
SQL + Python = универсальная связка для работы с данными

Если умеешь правильно работать в связке с SQL и Python, то можешь решать сразу широкий спектр задач ⤵️

🔜 собирать аналитические таблицы для отчетов и обновлять в них данные автоматически

🔜 посчитать метрики и отправить сообщение в любой мессенджер

🔜 переложить данные из одной системы или базы в другую автоматически

🔜 проверять автоматически качество ваших данных в любой системе перед тем как им верить и принимать решения

🔜 интегрировать AI в ваши бизнес-процессы, а готовить и предоставлять данные для него автоматически с помощью SQL+Python

...и много других примеров

Поэтому если хочешь иметь востребованные навыки на рынке и расти как аналитик-инженер, жду тебя на обучении "Продвинутый SQL и автоматизация витрин данных" 👨‍💻

Освоишь на продвинутом уровне следующий стек:
- PostgreSQL
- Apache Airflow
- Cloud Functions
- Github

Выходи на новый уровень в профессии и работы с данными!

Предзапись в группу или оплата на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
👍104
Как не выгорать на работе

📍Четко раздели рабочее время и отдых (особенно важно для удаленщиков) 

📍Обучайся всегда новому, это дает мозгу позитив и возможность менять/расширять свою деятельность

📍Старайся менять задачи или подход к их решению. Так избавишься от рутины

📍Следи за здоровьем. Причина выгорания не всегда связана с работой, это признак ментальной и физической усталости

📍Найди и выдели время на хобби - то что реально приносит удовольствие

Лично мне помогает смена обстановки в виде поездок, мини-путешествий, прогулок по городу и вечера детокса от всех гаджетов
🔥2110👍4
Конструкция фильтрация для функций агрегации

Хочу рассказать про удобную конструкцию, про которую знают далеко не все. Часто возникают ситуации, когда при агрегации нужно учесть не все строки данных, а только подходящие под определенные условия.

Конструкция такая:
функция агрегации FILTER (WHERE условие фильтрации данных для учета в этой метрике)


Например, нам нужно посчитать несколько метрик
- кол-во всех клиентов по customer_id
- кол-во клиентов, у которых источник регистрации будет один из этих: direct, form, vk

Пишем запрос
SELECT 
COUNT(DISTINCT customer_id),
COUNT(DISTINCT customer_id) FILTER (WHERE reg_source IN ('direct', 'form', 'vk')
FROM customers


Можно конечно писать через CASE, но конструкция с фильтром более наглядная, емкая и эффективная в плане оптимизации
SELECT 
COUNT(DISTINCT customer_id),
COUNT(DISTINCT
CASE
WHEN reg_source IN ('direct', 'form', 'vk') THEN customer_id
ELSE NULL
END)
FROM customers


Еще больше фишек SQL на продвинутом курсе, запись в группу
🔥16🤓13👍31
Иногда в выходные буду делиться рекомендацией фильмов и сериалов (не всегда про IT), но сегодня начнем с классики, наверняка многие не смотрели

Сериал "Силиконовая долина"

Комедийный сериал о группе программистов, которые создают стартап в Кремниевой долине. Главный герой Ричард Хендрикс случайно разрабатывает революционный алгоритм сжатия данных, который привлекает внимание крупных IT-корпораций. Сериал показывает внутреннюю кухню стартапов: технические задачи, поиск инвесторов, офисные интриги и конкуренцию на рынке.

#рекомендация_фильмы
12👍6🔥3
PostgreSQL + Airflow + Github - как устроена инфраструктура на курсе

В рамках обучения ученики будут работать в построенной инфраструктуры, которую описал на схеме.

PostgreSQL - используется как аналитическое хранилище, в котором данные разделены по слоям хранения.
RAW - сырые данные, которые динамически обновляются
CORE - общие преобразованные данные в чистые таблицы
MART - слой витрин, который каждый ученик будет разрабатывать в рамках практики

Apache Airflow - автоматизирует процесс сборки таблиц и витрин через DAGи. что это и как писать разбираем в теории и практике.

GitHub - у каждого есть свой рабочий репозиторий, который играет 2 задачи
- хранение скриптов со всей логикой сборки данных
- создание и деплой DAG в Airflow для написания автоматизации
Если не было раньше практики с git, не проблема, на курсе все разбирается

Такая практика и погружение в реальные инструменты позволяет максимально прокачать твои харды! 🔥

Чтобы у тебя даже в мыслях не было сказать
- "я не уверен в своих знаниях"
- "я не силен в технических навыках"
- "я могу решать только простые задачи"

Если что-то непонятно, пишешь вопросы, я веду группу учеников лично

Предзапись на курс
🔥84🤓2
Многие аналитики привыкли решать задачи в виде разовых запросов. Ну например к вам пришел менеджер и спросил
Какую выручку заработали за вчера?

И ты идешь собираешь информацию по разным таблицам или выполняешь свой "шаблонный" запрос на этот случай, потому что посчитанных готовых метрик под рукой просто нет. Знакомо?

А если таких вопросов будет много или каждый такой вопрос от бизнеса будет более комплексным? Такие запросы буду съедать все твое время и задачи превратятся в рутину(

В таком случае удобно создавать витрины данных

Витрина данных - таблица с достаточными, очищенными, преобразованными данными для решения конкретной задачи.


Данные перед витриной проходят нужные шаги сборки и обработки: объединяются, фильтруются, чистятся, агрегируются, считаются нужные метрики.

Дальше витрина данных становится основным источником правды для всех ответов на вопросы от бизнеса и может быть использована
- в BI отчетах
- для рассылки метрик в мессенджеры
- для обычных выгрузок в excel
- для отправок по другим каналам связи типа email

На обучении "Продвинутый SQL и автоматизация витрин данных" за 1.5 месяца научишься создавать качественные витрины данных под любые задачи

Записаться в группу
👍74🔥3
На каком ты уровне?
Anonymous Poll
11%
1
2%
2
11%
3
11%
4
29%
5
15%
6
8%
7
4%
8
10%
не знаю SQL
👍32
Хочешь быстро проверить, насколько хорошо разбираешься в аналитических витринах данных и автоматизации?

Предлагаю пройти короткий тест из 10 вопросов — за 3-5 минут оценишь свой уровень в SQL, Airflow, Git и облачных сервисах.

А после теста получишь развёрнутые пояснения к техническим вопросам и рекомендации

Пройти тест
👍81
Текущая ситуация на рынке IT

Сейчас рынок работодателя:
🔹 соискателей больше чем вакансий
🔹деньги дорогие как для нас, так и для компаний, поэтому новых проектов или глобальных расширений проектов нет
🔹с этим связаны оптимизации костов и как следствие сокращения

Буквально сам знаю историю, что человек сейчас готов перейти в другую компанию с понижением грейда и существенно просесть в ЗП после сокращения в одном бигтехе. И это к сожалению не единичные случаи.

Что это значит для нас - аналитиков, инженеров и других спецов

🚩 Сегодня основная цель - это закрепиться на рынке. Компании оставляют сильных и эффективных сотрудников, умеющих решать сложные задачи.

Всю рутинную работу стараются автоматизировать, а если не получается - то вообще избавиться от нее или перераспределить по другим людям. Нет сейчас бюджетов держать отдельного сотрудника на довольно узкий спектр задач.

Поэтому усиление своих hard навыков сейчас не потребность для увеличения ЗП, а способ удержаться на кризисном рынке.

Я лично всегда придерживался позиции быть многофункциональным: сегодня могу отчет в BI собрать, а завтра закопаться в бизнес-процесс и найти способ его автоматизировать на python, чтобы руками меньше делать приходилось.

Поэтому дерзай и усиливай свои прикладные навыки вместе со мной https://datastudy.ru/ (ближайшее уже 2 февраля)

Запись на старт обучения
👍16🔥7