Data Nature 🕊
6.11K subscribers
400 photos
7 videos
3 files
208 links
Канал о жизни BI аналитики и инфо-дизайна в корп реалиях с фокусом на работающих практиках управления.
Веду как летопись полезного для себя и людей с такими же неврозами.

александр бараков @alexbarakov
datanature.ru
data-nature.com

(рекламу не размещаю)
Download Telegram
🎙 Наговорил мыслей в подкаст Data Heroes уважаемого Николая Valiotti (aka LEFTJOIN) о ведении telegram каналов. В выпуске также BI-интеллектуал @rbunin, поэтому мне ничего не оставалось как выступить с маргинально-юмористической позицией для баланса 🤌😁

Надо ли уточнять что контент получился топовый. Спасибо хостам за приглашение.
Больше телеграм каналов - богу телеграм каналов 👹

C
сылки на выпуск на всех подкаст платформах для прослушивания в посте у ребят: https://xn--r1a.website/leftjoin/987
Отлично проработанный Data Maturity Self Assessment Framework опубликован в паблик с удобными, понятными экселями для самооценки. Авторы - Британцы - UK Government Data Quality Hub разработали для своего правительства как страновой стандарт, на базе консалтингового продукта компании Data Orchard.. Не суть. Важно что модель хороша. не перегруженная и не поверхностная: 10 топиков, 97 критериев.

🔗 Описание в PDF
🔗
Self-assessment excel
🔗 Excel с описанием критериев (зачем то отдельно, удобнее все в один сложить)
🔗 Статья на Medium

🔥 Самое ценное - смысловое описание 5 градаций выраженности каждого критерия - в результате гайд задает понятные направления работы.

Мне понравились:
🔹 Критерий - Making data available to those who need it
Level 5: 'Data can be accessed and directly shared appropriately by all users who need it. All internal and external users can access data they need when they need it, without specialist support.'
🔹Критерий - Linking decisions that affect organisational outcomes to data
Level 5: 'Consistently links decisions that affect all critical and important organisational outcomes to data. Takes a customer-focused approach, incorporating the value that the organisation’s data has to its users into decision making.'
🔹Критерий - Collecting data with user needs in mind
Level 5: 'Has a clear understanding of the needs of the user providing data, and of user-centred design and methods in all relevant areas of the organisation. Fully embeds application of this understanding in product design and development from beginning to end.'

Прям чувствую, что не зря в команде выносим себе мозг, рисуя Analytics usecases maps и information demand matrices. 🤯
Капец какие же мы мачурные 😎

Тул будет полезен enterprise проектам с системным и массовым подходом в работе с данными. Которые при этом могут найти сейчас время для стратегического анализа 😅

Фреймворк может неплохо сочетаться с упражнением по разработке / обновлению data стратегии компании.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🌐 Вместе с @mac_seem, BI team lead из Exness планирую оказаться на Data Innovation Summit 2023 в Стокгольме в Четверг - Пятницу этой недели.
Незнакомое мероприятие, но зато вендор-агностик подход, кажется без налета старперства Gartner и регилиозности конференций Tableau. Короче ожидания оптимистичные.🤔

📌 Кому интересно - посмотрите с нами агенду👇 и напишите на какие выступления надо попасть, на ваш взгляд.
Будем стараться учесть предложения, отпишу впечатления по итогу.

И да, кто (волею судеб) будет тоже на данном ивенте - пишите, блекджек и нетворкинг здесь самое главное. Время смутное, нужна взаимная поддержка. Как было у классиков "... у меня есть бутылка Шеридана, нам же надо как-то плыть ... "🍷
Please open Telegram to view this post
VIEW IN TELEGRAM
(Осторожно, в посте нет ни одного эмоджи)

Помните мы сделали Прожарку HR дашбордов с @rbunin? Мы решили, что справедливо будет критикуя предлагать.
В итоге каждый из нас сделал свой заход на редизайн одного из отчетов. Ну и накидали лукошко критики друг другу.

Далее покритикую версию Ромы и потом поясню за свою. Зеркальный пост ищите в канале Романа

Комментарии к версии Ромы
Линка на tableau public
1️⃣
Можно было бы подумать что за год работы с DataLens Рома растерял табло скилл и скатился в примитив, но тут возможно другое: Автор решил не заполнять спейс в панели метрик справа просто ради красивой картинки - наглый ход, черта уверенного в себе дашбордиста. Я такое еще себе не позволяю )
2️⃣ В результате у борда чище видится его юзкейс - анализ структуры headcount и текучести в разрезах. «расческа» из вертикальных баров способствует. Однообразие здесь плюс. В сочетании с кросс-кликабельностью это решение более чем оправдано.
3️⃣ Метрик я бы все таки добавил. Для красоты Для широты контекста. Тема текучести не раскрыта, прям хочется динамики. Видно что Рома поленился делать воркэраунды с сорсом для этого.
4️⃣ По закону жанра должен накинуть на пайчарт бублик, но он тут вроде уместен, разве что выбор цвета не понял. Брать желтый и зеленый не имея при этом оценочного умысла странно, тем более рядом в барах красный работает для хайлайта негатива. Детская ошибка, Ром)

Больше и подробнее на доске в Miro.
Комментарии к моей версии
Линка на tableau public

1️⃣ Почему мы посчитали исходный дашборд плохим - мы как могли рассказали тут. Собственно часть этих проблем я и устранял, не буду повторять пункты. Мы договорились при этом остаться в стилистике автора - поэтому палитры, шрифты, иконки не менял.

2️⃣ Основная идея была сделать дашборд более подчиненным бизнес идее - анализу структуры хедкаунта и текучести. При этом убрать не имеющие логики метрики, неоднородность визуального ряда, «поджать» картинку

3️⃣ Пришлось доработать источник - была сделана и добавлена в модель табличка с искусственным таймлайном - где по каждому сотруднику строка в каждый месяц где он работал на базе дат найма и увольнения. Без этого никакой анализ движения персонала невозможен

4️⃣ Добавил несколько неочевидных решений - типа выдвигающихся фильтров справа (нужно быть немного неидеальным). Забыл сделать легенду для цвета бара по attrition и некоторые другие неаккуратности пропустил, заметил когда отдал Роме на критику. Точно заметит и ткнет)

Больше и подробнее на доске в Miro.
9 умных мыслей, которые я вынес из Data Innovation Summit 2023, прошедшего в Стокгольме, полезных для применения в нашей команде

(Часть 1)

1️⃣ Появилось сомнение, что нужно гнать с пилотированием своих решений с ChatGPT для BI, что даже с реализацией сценария data консультанта в корп-мессенждере мы среднесрочно получим значительный импакт на BI адопшн. Новые версии дадут новые решения, другие более крупные команды зашарят свои результаты. Пока играемся и следим. Переключаемся на гигиенические задачи качества дата платформы: заниматься полнотой метадаты, инвестируем в семантический слой метрик, делаем связанный с дата моделью глоссарий, повышаем покрытие каталога и качаем на него трафик.

2️⃣ Понял, что нужно освободить дедикейтед людей на data/BI operations проекты. Как бы текущие бизнес проекты не тянули на себя ресурс. Сейчас мы драйвим их как проектные "инициативы", размывая среди BI аналитиков в команде. BI команда нужно делить на доменные экспертные группы и core работающие с развитием bi operations. А DWH team должны быстрее переключаться на работу с платформой и core моделью и отказываться от работы по инжинирингу datamart задач. Мысль не нова, но осознанна заново.

3️⃣Много смотрели стенд Thoughtspot их GPT-based решение. Интригует. Хочется ввязаться в пилот, но не потянем по ресурсу в этому году. Интересовала механика лейблинга источников - звучат убедительно. Но имеет смысл раскатывать только с семантическим слоем - они прямо рекомендуют dbt. Еще говорят - отлично сочетаемся с классическим BI (Tableau для дашбордов, Thoughtspot чат для self-service data exploration).
Модная ценовая политика по query usage немного мутная - такое не спланировать, только через поэтапные замеры в процессе.
Отличие Thoughtspot в видении с Tableau Pulse сильные. Их подход с фокусом на метриках и алертенге их поведения тоже кажется неплохим. Но тут совсем мало инфы. Вангую, tableau pulse будет только на табло Cloud, с отдельным прайсингом - тоже по запросам и ресурсным юнитам

Часть 2 | Часть 3 | Часть 4
Please open Telegram to view this post
VIEW IN TELEGRAM
9 умных мыслей, которые я вынес из Data Innovation Summit 2023, прошедшего в Стокгольме, полезных для применения в нашей команде

(Часть 2. Продолжение)

4️⃣ По датакаталогам было много отличных бесед на стендах с экспертами их ataccama, data galaxy, alation. Забавно как отличаются их взгляды в деталях на совмещение core и второстепенных фич.
🔹Мы сошлись на том что Atacсama имеет пожалуй лучший интерфейс (оч важно) в упором data quality модуль (шикарный), топовый встроенный lineage от Manta в который круто врисованы DQ индикаторы, и умеренный ценник.
🔹От ребят из Alation был инсайт о том, что too much automation is also bad применительно в генерации описаний и классификаций в каталоге за человека. data stewards, data product owners теряют чувство своей ответственности и принудительная часть все равно важна. А я наивный думал иначе.
Понравился в Alation их круто проработанный модуль по процессингу балковых изменений в каталоге (тот же линкинг терминов и полей по условиям) - см фото. Также решение по процессингу запросов на доступ через интеграцию с Jira (с предзаполнением полей заявки) - см фото. Жаль стоит тул как чугунный мост.
🔹Французский DataGalaxy представлял на стенде мощный Laurent Dresse. Их экстеншен для браузеров позволяет проваливаться из любого BI тула а каталог, оставаясь в одном экране и это киллерфича - см фото. Также показали функционал а-ля Miro для рисования верхеуровневых схем связывания data и бизнес объектов, мы такое делаем в миро, крайне удобно говорить о проектах с менеджментом

Часть 1 | Часть 3 | Часть 4
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
9 умных мыслей, которые я вынес из Data Innovation Summit 2023, прошедшего в Стокгольме, полезных для применения в нашей команде

(Часть 3. Продолжение)

5️⃣Еще был инсайт о ловушке опенсорса в которой оказались (вынуждено) многие в России, а также технологические компании, которые любят все делать сами. Идея доработки DataHub своими силами кажется рабочей - вы имеете гибкость и вроде экономию, но игнорируйте важнейший фактор успеха каталога - качество UI, которое требует больших инвестиций и экспертизы. Типа главное линедж, а остальное приложится. Только сейчас мы начали понимать что "уродливые" датакаталоги с плохим UI (а у DataHub она именно такая) не адоптятся. Это уже факт. Они вызывают в итоге скуку и безразличие как у аналитиков из бизнеса, так и у data людей. В итоге вы инвестируйте ресурс дальше и копите продуктовый легаси с тяжелой поддержкой, который уже жалко и обидно бросить. И едете уже до конца. Такой синдром упущенных возможностей.
При этом использование качественно сделанного коммерческого продукта даже с нехваткой отдельных фич будет давать ценность сразу и ресурс перейдет на внедрение процессов, а не разработку функционала. Скоро AI фичи будут сильно менять продукты и их адаптивность, а в самодельных дата каталогах внедрить их будет оч сложно (тут бы в бизнесе что нибудь ML-ное в прод бы вывести нормально). Не хочу толкать очевидное, вопрос сложный щас в этом сегменте у всех. @sgromych нужен круг по обзору российских data catalogs, а также логична совместная разработка community версии Datahub+, от тех крупных команд, кто его облагораживает сейчас...

6️⃣Был полезный доклад про Data Contracts - contract as a code решение как компонент open source стандарта описания data products в data mesh парадигме - см фото. Гитхаб этих ребят из Италии https://dpds.opendatamesh.org

Часть 1 | Часть 2 | Часть 4
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
9 умных мыслей, которые я вынес из Data Innovation Summit 2023, прошедшего в Стокгольме, полезных для применения в нашей команде

(Часть 4. Продолжение)

7️⃣Неожиданные встречи
🔹Была приятная встреча с шикарно одетым @trumassive из Toloka.ai, пробирались через толпу поклонников и поклонниц, но руку пожали - см фото
🔹Datavault builder - Фото из разряда как подбесить свою DWH команду)
🔹 kubicle.com - ребята из Ирландии делают свой портал курсов c фокусом на BI/DataPrep скилах. Есть у нас (как у многих) такая проблема - поддерживать свою систему курсов по Tableau и SQL чтобы регулярно онбордить и апскилить людей в команде. А тут готовое решение за 500 евро в год за юзера, еще и говорят можете аккаунт передавать. Посмотрели 3 learning-paths - по табло/sql/python - см фото. Для jun-reg отличный вариант, seniors почти ничего нет, попросили сделать. Затестим.

8️⃣ Впечатление от самой конференции: Саммит заслуживает похвалы за то что люди ввязались и сделали.
… увы выступления не дали нам (и никому из тех, с кем я общался) никаких инсайтов, все инсайты были в общении на стендах с техлидами и нетворкинге между собой. Что безусловно тоже часть формата.

Темы выступлений были звонкими, но сам контент кошмарным:
⁃ банальные тезисы - почти никто не шарил самобытных практик и фреймворков
⁃ много вендорского сейла без обсуждения сложных вопросов
⁃ спикеры подготовлены слабо, видимо ревью контента не было. мелкий нечитабельный шрифт слайдов сначала веселил потом раздражал. не было градации сложности выступлений - по уровню подготовки, может что то и было толковое, но мы пропустили.

9️⃣ Ну и главный инсайт - Стокгольм это заградительно дорого для барного туризма. Наш торфяной виски был соленым от наших слез. Все равно славно потусили кросс-компанейской группой, пока нас не разделил жесткий арабский фейсконтроль какого-то клуба).

Осталось унять тревогу что нужно много всего делать, а вы не успеваете, обновить карту инноваций нашего BI проекта и спокойно херачить к ускользающему совершенству.

Часть 1 | Часть 2 | Часть 3
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM