Data Nature 🕊
6K subscribers
385 photos
6 videos
3 files
197 links
Канал о жизни BI аналитики и инфо-дизайна в корп реалиях с фокусом на работающих практиках управления.
Веду как летопись полезного для себя и людей с такими же неврозами.

александр бараков @alexbarakov
datanature.ru
data-nature.com

(рекламу не размещаю)
Download Telegram
Новый продукт, новый повод понудеть про новую эру в BI

Databricks по-тихому выпустил свой BI. Но не простой. Назвали AI/BI Genie. Продукт умеет и в дашборды, но интересен в нём именно Generative AI.
Databricks, пожалуй, самая мощная в мире cloud дата-платформа, теперь закрывает BI пробел.
В основе лежит экспертиза Mosaic AI (куплен год назад за 1,3 млрд долларов).

Попытался понять, что уникального в этом релизе Databricks. Вот мысли:

Когда традиционные BI-вендоры создают Conversational BI в чатах, они часто делают это красиво, но не интероперабельно. Они опираются на свой дата-слой, который в BI всегда слабый. Семантический слой, как правило, отсутствует или выполнен поверхностно (исключение - Looker). Взаимодействие с внешним слоем метрик и метаданными хранилища у таких решений также поверхностное. Вот ThoughtSpot + dbt обещали что-то супернативное, но пока затихли.

Databricks, имея всё необходимое у себя — Lakehouse, Unity Catalog (дефолтный метадатастор и админка), свою трансформацию и семантический слой (yaml-файлы, определяющие метрики и связывающие физические и логические метаданные), имеет все, чтобы сделать наиболее качественный путь text->SQL->text->Viz.
Условно не нужно будет ничего, если все компоненты платформы настроены.

Главная проблема семантических моделей в том, что их нужно кому-то строить. Инженеры не умеют в бизнес-логику, а бизнес-аналитиков трудно принудить. В итоге настоящий семантический слой живет в сотнях голов разработчиков, а все попытки его зафиксировать отстают.
AI Databricks, как я понимаю, сам создаёт собственную доработанную семантическую модель, опираясь на действия пользователей и их фидбек поверх метаданных и метрик, взятых из платформы данных. Интересно, что AI просит тебя рассказать о метрике, если сам её не знает. (Кто-то точно будет над ним издеваться или неумышленно давать просто неверные знания)

Эту модель можно обучать, предзаписывая в неё промты и запросы в отношении конкретных доменов.

Идеальный путь, к которому это идёт — AI будет работать как аналитик, самостоятельно строить семантический слой и уточнять у команды: "я правильно понимаю, эта метрика определяется таким кодом и текущим значением?", а "эта её вариация — вот этим?", а дата-команда будет ему говорить: "да, да, нет, нет".

Другой плюс — сквозная безопасность на уровне Unity позволяет AI-BI давать ответы исходя из доступов пользователя, исключая необходимость доп настроек. То есть если согласован сам Databricks, дальше уже к безопасникам ходить не надо.

Лицензий отдельных вроде как нет. Но есть требования к компонентам.

Как итог, в таком сетапе - Databricks наверняка будет иметь все для самого цельного на рынке решения.

Однако остаётся вопрос: станет ли в итоге BI чат-бот (даже в идеальном свом воплощении) дополнением к производству и потреблению привычных отчётов, или дашборды останутся придатком к мейнстримному интерфейсу чат-бота?

Что думаете?
Я уже писал про плюсы и минусы Self-Service и Centralized моделей в аналитике.

Еще одна мысль пришла в проекте. Вслед.
Такая занудная мысль, что большинство ее не дочитают.

Вот она.

Есть соблазн - считать что тренды идут друг за другом и им просто нужно следовать.
Но вернее будет сказать, что одновременно есть разнонаправленные тренды в компании.
И их сила меняется в процессе эволюции дата культуры этой конкретной компании. Так происходит в нашем любимом вопросе Self-Service vs Centralized.

Пример.

Любая компания обнаруживает себя в определенный момент перед вакуумом ответственности за данные.

Встает вопрос - возложить ответственность за управление
▪️ на бизнес домены, создавая в них инженерно-аналитические команды
▪️ на дата платформу, наращивая экспертизу в центральных DWH и BI командах

Оба решения можно принять с повернуть в одну и другую сторону.

Но есть нюанс, наблюдаемый в физическом мире:

Успешная децентрализация происходит только после качественной централизации.

Компании часто пропускают этот шаг, в итоге домены, получая автономию, не играют по правилам.
Общий гавернанс не формируются или отторгается.

Создавая сначала цельные процессы управления жизненным циклом данных, настраивая сервисы, найм и обучение, и проч - ты используешь все это как базу для децентрализации, хотя вернее сказать федерализации.

Поэтому возникает парадокс. Перед любым дата мешем имеет смысл минимум 3 года заниматься хардовой централизацией. А потом уже думать нужен будет вам дата меш, и в какой степени.

(датамэш или датамеш, мем или мэм 🤔)

🅿️ Эти и другие мысли по теме паркую тут:
https://miro.com/app/board/o9J_lha8MnM=/
Please open Telegram to view this post
VIEW IN TELEGRAM
Когда долго смотришь на джазовый оркестр - выходишь на аналогию с аналитической командой.

Джаз хорош как аналогия еще и потому, что джем неповторим, но подготовлен как удачный аналитический проект. И там и там есть и строгая базовая часть и импровизация.
И там и там есть синьоры берущие сложные партии.
Ударные, гитара и контрабас дают основу как дата инженеры. Тромбоны, трубы и саксофоны дают форму как BI разрабы.

В джазе нет дирижера, есть аранжировщик/бэндлидер. Отличное определение. Сергей на видео дает драйв как бодрый тимлид на сонном планинге в понедельник.

Как вы поняли - я не шарю за джаз. Но я в отпуске.
А на видео - Mussorgsky Jazz Orchestra п/у Сергея Богданова.

С кем еще не выпил в Питере за неделю - напишите.
Всем среды!
БиАйГрафия - серия коротких интервью с BI лидерами

Я люблю общение в профессии.
За барной стойкой или в онлайне на курсе.
Много креативных людей/команд сейчас делают топовые вещи, делятся и вдохновляют других.
Так работает здоровая коммуникация в сообществе.
Так я узнал, что наш BI проект не самый крутой в мире, а только один из самых крутых.

И вот ощутил я еле уловимый позыв к журналистике.
Конечно есть
- много статей на хабре и vc
- хорошие корпоративные каналы, где выделяются - авито, тинек.
- каналы-конференции, которые часть выступлений дают в паблик - например smartdata, матемаркетинг.
- еще и подкасты - вот ребята из datacoffee и karpov.courses фигачат инсайты как не в себя.
Везде много хорошего - только успевай слушать.

Мне же тут хочется показать BI в лицах, в виде коротких историй о мощных дата аналитических менеджерах - как активных спикерах так и непубличных людях, тихо мастерящих крутые BI проекты.
Дать ощущение, что несмотря на то, что все разные - есть единство проблем и много идей по их решению. Показать "как бывает у других" и "что не боги горшки обжигают".. вот это вот все, и как итог - вдохновить людей на развитие и обмен практиками.

Никакой рекламы или иных задач кроме озвученных выше.

Встречайте серию коротких интервью с BI лидерами по тегу #БиАйГрафия:

Выпуск #1 - Ринат Хабибрахманов (Лемана ПРО - Леруа Мерлен)
Выпуск #2 - Максим Иванов (Finyard)
Выпуск #3 - Антон Клюге (Лига Ставок)
Выпуск #4 - Наталья Любимова (T-Bank)
Выпуск #5 - Настя Кузнецова (Semrush)
...
Продолжение следует
#БиАйГрафия - Серия коротких интервью с BI лидерами, подробнее

Выпуск #1 - Ринат Хабибрахманов

🏠Компания: Лемана ПРО (Леруа Мерлен)
📍Локация: Самара
👤Должность: Руководитель практики BI
💬Контакт: телега, linkedin
Стек:
⚡️Power BI - Основной
⚡️Tableau, 10% отчетов, без перспектив масштабирования
⚡️Самописный сервис grafana+clickhouse с историей по продажам
⚡️К началу 2025 + Российский BI тул

Ответы на 6 вопросов ➡️
Please open Telegram to view this post
VIEW IN TELEGRAM
(Ринат Хабибрахманов - Часть 1)

Какие 1 - 3 главные проблемы - боли есть у вашего BI проекта сейчас?


1. Все проблемы, присущие негативной стороне self service подхода:
shadow data -> игнорирование норм и стандартов -> бардак в проде -> дубли отчетов, отсутствие единой точки правды, низкое качество отчетов, влияющее на производительность BI сервиса -> недовольство пользователей, нет ясности каким отчетам можно верить.
Лечим так:
- уже запустили процесс ревью отчетов версии 1, в процессе - ревью отчетов 2.0, где часть проверок будет автоматизирована;
- есть навигатор отчетов, позволяющий ориентироваться в массе всех созданных инструментов;
- в процессе запуска - сертификация отчетов - знак качества, показывающий что отчету можно доверять.

2. Низкая производительность сервиса + отсутствие поддержки.
Лечим так:
- менеджер сервиса в процессе постоянной оптимизации сервиса, но скоро уткнемся в предел, который потребует полностью пересмотреть архитектуру и подходы к публикации отчетов;
- входящее ревью, которое помогает исключать отчеты содержащие классические антипаттерны, съедающие ресурсы;
- поиск нового сервиса, который в перспективе либо заменит текущий сервис, либо заберет на себя часть нагрузки.

3. Пользователи, которые продолжают выгружать все в Excel😂

Что тебе нравится в работе ? Что дает тебе силы продолжать двигаться вперед и вести за собой ?

Изначально мне нравится создавать инструменты, помогающие быть эффективным и быстро принимать верные решения. Сейчас, когда я уже не создаю сам аналитические инструменты, вдохновляюсь людьми, которые на моих глазах растут в компетенциях, которые помимо своей работы находят возможность участвовать в мета-проектах, делающих наш BI ландшафт лучше, которые меняют вместе c нами наш маленький BI мир и делают его более комфортным и правильным, помогая нашему бизнесу двигаться вперед.
Ну и, конечно же, результаты, c каждым завершенным проектом, c каждой новой благодарностью за улучшение наших сервисов хочется сделать что-то ещё, чтобы быть лучше.

Что самое крутое ты и твоя команда сделали за последнее время?
Опиши коротко суть


Школа BI. Написали программу подготовки "с нуля до джуна BI", нашли 9 ребят из бизнеса, кто наиболее продвинут и перспективен в работе c данными, c командой наставников провели их через нашу программу (из 9 до конца дошли 6). Сейчас эти ребята в кадровом резерве, они понимают бизнес + обладают базовыми hard skills (бизнес-анализ, SQL, Power BI, датавиз, наши внутренние нормы и стандарты). На них уже есть запрос, так как периодически нам нужны джуны: кого-то мы уже устроили, кто-то ещё ждёт своего часа.

Какие 1-3 инициативы развития вы сейчас драйвите в команде?

1. Сертификация отчетов.
2. Приложение RepApp – сервис, который объединит заказчиков и разработчиков в одном месте. Там планируется широкий функционал, но из основного это:
- любой бизнес пользователь может через приложение сообщить о потребностях в аналитических инструментах,
- дата-партнер будет перенаправлять запросы в соответствующую команду,
- вопрос либо будет закрываться, так как, скорее всего, инструмент уже есть и пользователь просто его не нашел, либо будет падать в бэклог,
- разработчик в этом приложении будет идти четко по процессу разработки, некий микс трекера и вики
- и много чего ещё, но это целая отдельная история☺️
3. Поиск решения для конструктора отчетов – сервис, в котором пользователь сможет самостоятельно собрать нужные ему данные.

——- Формальные вопросы для бенчмарков ——-

Каков размер BI практики в вашей компании?
Сейчас 40 профессиональных bi-щиков.
+ около 90 прочих сотрудников, кто делает отчёты разного уровня, в том числе продвинутые бизнес пользователи.

Сколько бизнес-пользователей у Вашей BI системы ? Какой процент из них заходит в BI как минимум раз в месяц?

Потенциально мы ожидаем, что все наши 45 000 сотрудников будут пользоваться отчетами, показывающими результаты из их области ответственности.
Но по факту уникальных пользователей за последние 30 дней примерно 16 тысяч, за последние 90 дней - 20 тысяч.


Круто. Спасибо, Ринат, что поделился!

#БиАйГрафия
Бодрое утро у людей:
Еще один плюс работы в Табло клауде, "пришел" ты на работу, а тут такое, и все что ты можешь сделать - это налить себе кофе и расслабиться :) Максим Иванов (@mac_seem)

🔽
❗️Сбой в работе облачной платформы для хранения данных Microsoft Azure стал причиной отмены как минимум 130 и задержки более 200 рейсов американских авиакомпаний, сообщил телеканал CNN.

🔽
Таблошники пишут такое в инциденте - Initial investigations suggest that the issue is due to a third-party vendor’s issue. The team is coordinating with the vendor to investigate further. Максим Иванов (@mac_seem)


Да.. Облака - белогривые лошадки.
Такое похоже у большинства клауд вендоров.
Интересно хватит у них денег покрыть все иски.
"А выводы вы как всегда делаете сами"
Как же сложно будет теперь лоббировать клауд

Продолжаем следить
https://status.salesforce.com/current
Please open Telegram to view this post
VIEW IN TELEGRAM
«Тема дата гавернанс хороша пока ее не трогаешь» ©️Евгений Ермаков

🎙️Лампово поговорили с data coffee о data governance

Ребята застали меня в низкой точке веры в data governance и обманом вовлекли в разговор вместо BI и аналитики 🫢

Получилось немного тяжело, но как есть.
Кто в теме возможно послушает и найдет таки для себя пользу.
(Как всегда рекомендую ускорять воспроизведение)

Гайз @datacoffee - спасибо за приглашение и дайте потом мне еще шанс - про BI я могу говорить в 3 раза быстрее и веселее )

Идея Жени описать bullshit-free “data governance для стартапа” - отличная.
До конца года осмыслю и нарисую что-то.

🗺️ В конце выпуска упоминаю miro-борд по data governance - ссылка.
До конца лета будет полностью новая его версия. Зреет 🌱
Please open Telegram to view this post
VIEW IN TELEGRAM
Дата Каталог при покрытии описанием 30% объектов отбивает затраты за 2 квартала, при покрытии 50% уже в первом квартале.

Я тут упомянул про анализ окупаемости дата каталога на цифрах, который мне показался честным и наглядным.
Его автор - Александр Платонов (telegram, linkedin) пошарил презу и я ее выкладываю здесь с его согласия (см. файл в первом комментарии)

Много вопросов можно накидать к этим расчетам, да тут остается немало допущений.
Скорее всего уровень сложности здесь диктуется готовностью менеджмента вникать - сложнее - и уже никто бы не стал.
В конце концов, такое упражнение делают чтобы совершить внутреннюю продажу проекта и потом редко повторяют.

Но я не удержусь от размышлений поверх презы:

- Затраты и усилия возникают у одних людей в компании, ценность в виде экономии времени у других. И между ними часто бюджетная стена. Это первое препятствие на любом пути к продаже идеи каталога

- Экономия времени на data discovery и t2m нематериальна, она упирается скорее всего в операционный предел следующих этапов - доступность заказчика к взаимодействию, производительность дата инженеров и т.д. (мысль Жени Ермакова). Затраты на сам каталог и документирование абсолютно реальны, а сейвинги в большой степени растворяются. Было бы круто увидеть доходимость эффекта на t2m всего цикла дата проекта и как следствие повышение кпд всей фабрики инсайтов или сокращении необходимого штата дата аналитиков...

- Ну и совсем придираясь, замечу что в расчете есть затраты на разовое документирование, но не видны затраты на поддержание их актуальными. Ну и в каталог с описанием 30% аудитория не будет ходить 2 квартала - будет быстрое затухание трафика после первого всплеска.

И тем не менее это редкий пример попытки реального замера. Надеюсь вдохновит кого то повторить и улучшить.

Пример другого анализа - The Total Economic Impact Of The Alation Data Catalog. Пятилетней давности документ, но все еще актуально.
Еще вот такая статья хорошая своей понятностью, хоть и вендорская.

У кого то есть еще примеры по теме?
#БиАйГрафия - Серия коротких интервью с BI лидерами, подробнее

Выпуск #2 - Максим Иванов

🏠Компания: Finyard
📍Локация: Кипр
👤Должность: Head of BI
💬Контакт: телега, linkedin
BI Стек: Tableau, Grafana

Ответы на вопросы ➡️
Please open Telegram to view this post
VIEW IN TELEGRAM
( Макс Иванов - Часть 1 )

Ответы на вопросы:

Какие 1-3 главные проблемы / боли есть у твоего BI проекта сейчас?


Нет каких-то ярко выраженных проблем, так как все строим с нуля и знаем как делать. Поэтому основная проблема - не погрязнуть в текучке и не упустить какие-то важные моменты, когда компания перейдет с уровня дата-зрелости 0 на уровень 1. А именно: 1) Заложить культуру разработки отчетов и источников данных. Вести документацию в DWH, привязывать (тегать) каждый отчет к метрике за которую отвечает департамент (не плодить лишнее) и тп. 2) Организовать со старта процесс работы аналитиков и их взаимодействия с бизнесом 3) Не копить техдолг.

Что тебе нравится в работе ? Что дает тебе силы продолжать двигаться вперед и вести за собой ?

Преодолевать трудности, делать то, что другие не могут сделать. Когда добиваешься результата, это дает большой заряд энергии. Такой большой, что ты сам бежишь вперед и еще других можешь заразить своей энергией.
Еще драйвит рост членов команды, когда ты видишь, что ты перестаешь объяснять как и что делать, а команда сама понимает задачи и проявляет инициативу.

Что самое крутое ты и твоя команда сделали за последнее время?
Опиши коротко суть


Построили слаженно работающую BI функцию в компании (уже не в одной). На прошлом месте в Экснесс мы научились строить аналитические команды разными способами - линейно, матрично, гибридно и тп. Такая «тренировка» позволила почувствовать сильные и слабые стороны подходов и сейчас на новом месте уже стало легче выстраивать функцию с нуля.

Какие 1-3 инициативы развития вы сейчас драйвите в команде?

1. Metric Map. Разрабатываем дерево метрик для подразделений, которые ложатся в основу КПИ каждой команды и которые служат точкой отсчета для всех дэшбордов/отчетов компании.

2. Tableau Bot. Расширенный функционал стандартного приложения Табло в Слаке, в котором есть команды и который может по запросу выдавать, например, полный список доступных отчетов/проектов по конкретному пользователю. По сути он может выполнять все, что можно сделать через API Tableau и не только. Будем со временем добавлять команды, расширять функционал, использовать для рассылки метрик там, где хотим сэкономить на лицензиях (например, в команде саппорта) и тп.

Формальные вопросы для бенчмарков:
- Каков размер BI практики в вашей компании?

В Data команде сейчас 2 дата инженера, 2 BI разработчика, 4 дата аналитика.

- Сколько бизнес-пользователей у Вашей BI системы ? Какой процент из них заходит в BI как минимум раз в месяц?

Компания пока небольшая, стартап. Сейчас у нас 50-60 пользователей. Все заходят минимум раз в неделю. Получается adoption близок к 100%, но думаю это ненадолго. Компания быстро растет и эти цифры очень быстро меняются.
Скоро будем расширять таргетную аудиторию до 150 пользователей.

И последнее, опиши свой взгляд на будущее BI, как он будет трансформироваться под влиянием AI?

Глазами сэйлов будущее выглядит видимо так - дата портал со строкой поиска, ты формулируешь запрос и этот тул ищет инсайты, рекомендует что делать дальше с бизнесом, рисует дашборды и дата стори к совещанию и тп.

По факту - продолжим делать сами дашборды, может станем меньше обращать внимание на дизайн, более концентрируясь на качестве данных. Семантический слой с метриками будет всё еще в наших головах, а не в тулах типа dbt. Периодически будем смотреть, что нового советуют AI помощники, но делать будем все сами.

Круто зафиналил.
Спасибо, Макс, что поделился!

💬 Не стесняйтесь задавать свои вопросы

#БиАйГрафия
Please open Telegram to view this post
VIEW IN TELEGRAM
🩺 Доделал самое внятное мини-исследование про Data Governance из тех, что вы читали.
Если нет верну вам деньги. А блин, оно же бесплатное.

🔗 PDF Файл

За последние полгода я встретился с 20 технологическими компаниями. В основном крупными и очень крупными, но были и небольшие. Общались про их реальный data governance.

Уже не помню, зачем я это начал, но помню, что меня начала раздражать эта тема и я искал опору. как итог - я получил для себя довольно четкую картинку по отрасли. Больше нет ощущения, что где то есть миры невиданной мачурности, созданные по DMBOK, где розовые пони скачут по радуге дата стюарды добровольно улучшают качество данных.

Я описал все интересное и теперь делюсь этой картиной с вами. 80% моих наблюдений и 20% выводов.

В процессе познакомился с классными людьми. Спасибо вам за отклик и участие: Олег (Авито), Селим (HeadHunter), Женя (Yandex->Toloka), Андрей (ЦИАН), Кирилл (Just Eat Takeaway), Александр (SOFTSWISS), Энрика (Tinkoff) и многим другим.

В исследовании не раскрываю детали по конкретным компаниям. Мы вели доверительные беседы без приукрашивания реальности. Вместо этого выделяю общие черты и практики.

Если совсем кратко - Большинство топ компаний купаются в хаосе, делая отдельные точечные здравые вещи - живут и не обламываются 🙃

Но не буду пересказывать содержание - посмотрите файл. Продулирую в первом комменте 👇
Там не так уж много букав. Уж проявите энтузиазм.
Feedback is welcome
Please open Telegram to view this post
VIEW IN TELEGRAM
#БиАйГрафия - Серия коротких интервью с BI лидерами, подробнее

Выпуск #3 - Антон Клюге

🏠Компания: Лига ставок
📍Локация: Москва
👤Должность: Head of BI
💬Контакт: телега, linkedin
Стек: "Пока используем иностранное решение (из топ3), на будущее смотрим-анализируем новые решения на рынке РФ, но пока все слишком уступает, на мой взгляд".

Ответы на вопросы ➡️
Please open Telegram to view this post
VIEW IN TELEGRAM
( Антон Клюге - Часть 1 )

Какие 1 - 3 главные проблемы - боли есть у вашего BI проекта сейчас?


1. Сражаемся с экселями и плоскими табличками в 138 метрик шириной). Очень сложно склонить пользователей к красивым и легко читаемым дашбордам.
Работаем над Data Literacy в компании, проводим воркшопы и вебинары по работе в BI, разбираем кейсы, создали корпоративную базу знаний .
2. Очень часто заказчики к нам приходят без четко понимания - а что же они хотят увидеть, какие выводы будут делать. Как итог раньше часто получали отчеты, которые через месяц уже никто не использовал.
Тут вариант один - погружаться глубоко в бизнес область и процессы отделов - где-то подсказать и скорректировать задачу, а где-то отказать и направить в уже готовые отчеты.
3. От нас часто просят в BI реализовать функционал, для которого он не предназначен. Какие-то функции онлайн мониторинга или загрузить сырые данные на миллиарды строк.
Тут приходится уже включать дипломатию (мы же максимально бизнес-ориентированная команда) и договариваться и искать или альтернативные решения в продукте или обучать работе с данными напрямую.

Что тебе нравится в работе ? Что дает тебе силы продолжать двигаться вперед и вести за собой ?

Меня мотивирует команда, когда она вовлечена в процесс и постоянно генерит идеи, как нам улучшить продукт, как помочь бизнесу, как улучшить что-то внутри команды - для меня это основной драйвер и мотивация.
Также очень мотивирует, когда твои отчеты являются эталонными в компании, по ним сверяют презентации и KPI, цифры от туда отправляют для СМИ. Это лучшая обратная связь.

Что самое крутое ты и твоя команда сделали за последнее время?
Опиши коротко суть
.

Добились полного доверия к данным и отчетам со стороны всех подразделений и топ менеджмента. Шли к этому долго, через сопротивление).
- Много работали над мониторингами и алармами, чтобы быстро выявлять и реагировать на проблемы в данных
- Делали специальные дашборды качества
- Погружались в источники для анализа структуры данных
- И в процессы подразделений для улучшения методологии
В итог - качество и стабильность отчетности отличные, бизнес полностью доверяет и пользуется нашими продуктами.

Какие 1-3 инициативы развития вы сейчас драйвите в команде?

1. Интеграция с BI и телеграм, уже сейчас отправляем ключевые цифры, мониторинги и алармы. В планах развивать и сделать бота.
2. Начали оцифровывать качество нашего сервиса (продукта) - сделали дашборды вовлечения, на основе классических продуктовых метрик и лояльности, на основе регулярных опросов пользователей.
3. Добавляем элементы динамического создания отчетов, когда в зависимости от введенных в Excel параметров, меняется сборка модели отчета или добавляются новые сценарии/метрики.

Формальные вопросы для бенчмарков:

Каков размер BI практики в вашей компании?

В команде сейчас 9 человек, все занимаются разработкой BI отчетов.
По ролям, 3 группы:
1 - отвечает за качество данных, витрины и Ad-hoc
2 - работа с бизнесом, обучение и разработка дашбордов
3 - архитектура и сложные модели данных

Сколько бизнес-пользователей у Вашей BI системы ? Какой процент из них заходит в BI как минимум раз в месяц?

MAU в районе 450-500 человек, DAU около 100-150.
Полная целевая численность аудитории BI системы - в районе 700.
(Довольно высокий Monthly engagement rate: 57-64%, примечание ред.)

И последнее, опиши свой взгляд на будущее BI, как он будет трансформироваться под влиянием AI?

Не вижу пока сценариев, где AI полностью заменяет людей в BI командах.
Да, можно будет , наверное, интегрировать в продукт удобные вики , или где-то упростить разработчикам работу со скриптами, возможно, подсвечивать ошибки в коде.
Но все равно это будут поддерживающие функции в системе, а не ее замена.

Круто. Спасибо, Антон, что поделился!

#БиАйГрафия
Data Quality Songbook. Episode 3

🔗
Родился очередной Miro-борд с 80-ю схемами про DQ.

Есть такой Piotr Czarnas (Founder @ DQOps open-source Data Quality platform).
Глубоко копает, поднимает сложные вопросы в рамках DQ, ну и постит много своих схем на эту тему.
Читать про DQ скучно. Любая визуализация (даже такие с кучей текста) заходит сильно лучше.

Вник я в итоге не во все.
Но в миро все картинки в итоге свел, себе для удобства.
Пользуйтесь и вы, кому тема близка.

Еще у этого товарища есть хороший бесплатный гайд, примерно о том же.
😬 Вредные привычки дата-команд по мнению Paul Blankey. Небольшой перевод с моими мыслями.

✏️ Слишком много ад-хоков
Решается через self-service и проверку бизнес-ценности запроса.

💬 Отсутствие фидбэка
Регулярные опросы, проверка используемости созданных вами аналитических продуктов и простое “спросить”.

🛠️Неоптимальный технический стек: слишком много инструментов; сложно ими управлять; боязнь пробовать что-то новое.

🗑️ Ненужные дэшборды
Дэшборд не ответ на любой аналитический запрос. Он нужен, когда данные будут обновляться регулярно и за ними нужно будет постоянно следить.

🎨Трата времени на красивые дэшборды
Дэшборд должен быть не красивым, а понятным и удобным. Простота — залог успеха.

🚁Отсутствие мышления “как руководитель”
Не добавляйте лишние детали, которые не нужны для принятия решения. Старайтесь смотреть на картинку сверху и как то, что вы делаете ложится в задачи бизнеса.

🧹Создавать и не удалять
Процессы архивации старого и неактуального контента важны и нужны.

🧩 Пренебрежение моделированием данных
Можно будет очень быстро запутаться во всём, что насоздавали. Структура важна и в организации таблиц, и дэшбордов.

🗂️ Неописанный семантический слой
Я бы тут сказала, что уже хотя бы бизнес-глоссарий по основным метрикам и их бизнес-логике.
В ходе одного проекта я предложил рассчитать Data Driven Index Компании. В итоге меня же и попросили разработать для этого логику 🤦‍♂️

Придумать хитро-выдуманные метрики нетрудно, проблема — разработать показатели, которые были бы одновременно значимыми и поддающимися расчету.

Короче придумал такой концепт компонентов формулы:

Основные (с более высоким весом):
- Data Literacy score
- Tools Adoption score
- Direct Business Value score
- Data Accessibility score
- Organizational Model score
- Data Management score

Второстепенные компоненты:
- Analytics Maturity score
- Culture score
- Innovation score
- Customer Insights score
- Data Security score
- Data Infrastructure score
- Leadership score

Для каждого компонента нужны измеримые показатели, но вычислять их все по-прежнему будет слишком дорого.
Логично сократить количество метрик до 10 максимум.
Все метрики относительные, но их нужно нормализовать, чтобы сбалансировать эффект. Проще весами.

Как бы вы посчитали свой DDI?
Какие веса и показатели вы бы использовали?

🔗 Более подробно об этом экспериментальном подходе - см в моей коллекции шаблонов здесь — https://miro.com/app/board/o9J_lha8MnM=/ и здесь https://miro.com/app/board/uXjVKElvf7U=/