Этот пост про набор на ежегодный курс про BI стратегию в июне-июле.
Каждый новый год в профессии - он как хайкинг в горах
🍷 Сначала ты свеж - вдохновляешься конференциями, трендами, релизами. заряжаешь себя и людей целями
😬 Потом сталкиваешься с проблемами своей готовности:
ошибаешься, переосмысляешь, преодолеваешь
Теряешь часть попутчиков. Меняешь маршрут.
🍷 В итоге все таки достигаешь реалистичной цели, часто не той что была на картинке.
Сидишь уставший и смотришь вниз и вдаль.
Думаешь про новые горы (или о спа-центре - кто постарше)
Тут надо вырулить метафору на тему курса о стратегии в BI.
Одни готовы хотят лезть на высокую гору nextGen BI, тестировать AI генерацию инсайтов и проч кайфовые штуки которые подарил дивный новый мир, где никто еще не проложил троп.
Другие на опыте соизмеряют силы и риски - взбираются на горы пониже. Я тут про выстраивание качественного слоя витрин, отчетов и метрик - чтобы тратить меньше сил для получения большего эффекта - через оттачивание (пока) традиционных для BI процессов.
Чаще BI менеджер лезет на все горы сразу, борясь с тревогой от упущения времени с ИИ, хаосом данных, земными потребностями пользователя, и размытием границ ролей и тулов.
Ведь уже почти нет как такового BI - есть сквозной гавернанс данных и аналитики через зоопарк систем и метрик. Об этом и есть курс.
По правде сказать за годы этот курс превратился в гайд из 100500 тем, полезных практик и шаблонов.
Каждый мог найти что то для себя. Но каждый раз я пытаюсь запускать все больше обсуждений, когда участники скидывают свои кейсы под темы занятий и мы вместе их крутим.
Получается и терапия BI неврозов и концентрированный обмен опытом.
Не буду перечислять программу, тем более что она еще изменится походу.
Пишите в личку вопросы - я расскажу.
Или оставляйте заявки тут
Дата старта: 18 июня и далее 11 занятий по средам, пятницам и понедельникам
Формат: вечерние посиделки по 2-2,5 часа в онлайне, домашки и оффлайн сбор в баре в Москве в конце
Аудитория: обычно BI хеды, лиды, CDO, COO и дата менеджеры
Каждый новый год в профессии - он как хайкинг в горах
ошибаешься, переосмысляешь, преодолеваешь
Теряешь часть попутчиков. Меняешь маршрут.
Сидишь уставший и смотришь вниз и вдаль.
Думаешь про новые горы (или о спа-центре - кто постарше)
Тут надо вырулить метафору на тему курса о стратегии в BI.
Одни готовы хотят лезть на высокую гору nextGen BI, тестировать AI генерацию инсайтов и проч кайфовые штуки которые подарил дивный новый мир, где никто еще не проложил троп.
Другие на опыте соизмеряют силы и риски - взбираются на горы пониже. Я тут про выстраивание качественного слоя витрин, отчетов и метрик - чтобы тратить меньше сил для получения большего эффекта - через оттачивание (пока) традиционных для BI процессов.
Чаще BI менеджер лезет на все горы сразу, борясь с тревогой от упущения времени с ИИ, хаосом данных, земными потребностями пользователя, и размытием границ ролей и тулов.
Ведь уже почти нет как такового BI - есть сквозной гавернанс данных и аналитики через зоопарк систем и метрик. Об этом и есть курс.
По правде сказать за годы этот курс превратился в гайд из 100500 тем, полезных практик и шаблонов.
Каждый мог найти что то для себя. Но каждый раз я пытаюсь запускать все больше обсуждений, когда участники скидывают свои кейсы под темы занятий и мы вместе их крутим.
Получается и терапия BI неврозов и концентрированный обмен опытом.
Не буду перечислять программу, тем более что она еще изменится походу.
Пишите в личку вопросы - я расскажу.
Или оставляйте заявки тут
Дата старта: 18 июня и далее 11 занятий по средам, пятницам и понедельникам
Формат: вечерние посиделки по 2-2,5 часа в онлайне, домашки и оффлайн сбор в баре в Москве в конце
Аудитория: обычно BI хеды, лиды, CDO, COO и дата менеджеры
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Пошарю две ссылки с вами - занудную и фановую.
Начнем с первой:
1️⃣ Центральный банк РФ месяц назад выпустил методологию "Управление данными на финансовом рынке" - может все в курсе, я только увидел - спасибо @aivan_vok.
См 4 файла внизу страницы.
Это замах на стандарт и модель оценки зрелости управления данными. До этого все были зарубежные. Тут конечно компиляция мировых моделей, но достаточно хорошо переработанная. Короче возможно это событие. Тема data governance еще бустанет - все знают как тяжело получить такой бюджет. Теперь все банки и страховые получают если не пинок, то хороший аргумент.
Немного деталей:
Начнем с нейминга. Ну это извините пиздец, а не нейминг:
Посмотрел, нашел прям признаки проработки и осмысления темы:
Есть прям отсылки к чему то глубокому:
Короче видно что писали не дураки и не на отъебись.
Ну и самое интересное, как это будет метчиться с регулированием. Я так понял это пока как бонус:
Но видимо далее подъедут сертификации и компании, которые будут помогать ее проходить🤑
(я, если что, не готов сейчас)).
Еще бы ставку снизили, вообще огонь.
2️⃣ Симулятор Who’s the best CDO? https://www.whoisthebestcdo.com (на фото).
Фановая штука но с глубоким смыслом. Растишь репутацию, тратишь бюджет, решаешь проблемы и пытаешься принести пользу выраженную в выручке. Я поймал рабочие флешбеки.
Если добавить групповой формат игры, домены и штук 1000 разных событий, то можно неплохо провести время.
Источник Сайт Юры Гаврилова
Начнем с первой:
См 4 файла внизу страницы.
Это замах на стандарт и модель оценки зрелости управления данными. До этого все были зарубежные. Тут конечно компиляция мировых моделей, но достаточно хорошо переработанная. Короче возможно это событие. Тема data governance еще бустанет - все знают как тяжело получить такой бюджет. Теперь все банки и страховые получают если не пинок, то хороший аргумент.
Немного деталей:
Начнем с нейминга. Ну это извините пиздец, а не нейминг:
СУД УФР - Система управления данными участника финансового рынка.
Посмотрел, нашел прям признаки проработки и осмысления темы:
... Учреждение коллегиального органа по управлению данными (если требуется)
... Цифровые миражи – последствия от низкого качества данных
Есть прям отсылки к чему то глубокому:
... USER JOURNEY MAP в управлении данными
... Концептуальный дизайн на основе карточки процесса
Короче видно что писали не дураки и не на отъебись.
Ну и самое интересное, как это будет метчиться с регулированием. Я так понял это пока как бонус:
Задачами Банка России для реализации процедуры оценки зрелости
СУД УФР являются:
1. Создание методики оценки зрелости СУД УФР.
2. Проведение процедуры оценки зрелости СУД УФР.
3. Обработка и анализ результатов оценки зрелости СУД УФР.
Результаты оценки зрелости СУД УФР отправляются через личный кабинет Единой платформы внешнего взаимодействия Банка России или по электронной почте
Но видимо далее подъедут сертификации и компании, которые будут помогать ее проходить
(я, если что, не готов сейчас)).
Еще бы ставку снизили, вообще огонь.
Фановая штука но с глубоким смыслом. Растишь репутацию, тратишь бюджет, решаешь проблемы и пытаешься принести пользу выраженную в выручке. Я поймал рабочие флешбеки.
Если добавить групповой формат игры, домены и штук 1000 разных событий, то можно неплохо провести время.
Источник Сайт Юры Гаврилова
Please open Telegram to view this post
VIEW IN TELEGRAM
Про BI Health Score
Мы в командах всегда много экспериментировали с этим подходом. Сейчас в Авито заходим на новый круг.
Проблема стара как сам BI: массово делаем отчёты → страдает гигиена → страдает навигация → теряем трафик.
Кто-то пытается зарегулировать процесс (тесты, преревью), кто-то отпускает — и плодит хаос.
В децентрализованной системе от 100+ аналитиков - обязаловка не работает. Что работает:
– сертифицировать часть контента (важно, но об этом отдельно)
– качать культуру разработки и вайб качества
– фокусировать внимание через личные цели и окры.
Важно искать баланс:
- держать здоровье значимых объектов на уровне,
- для остального давать тулы для самоконтроля.
BI Health Score Reporting - это инструмент поддержки для всех этих мер. К нему прилагается процесс (например периодические BI Субботники, но это тоже тянет на отдельный пост).
Цель такого отчета проскорить все объекты по факторам и подсветить автору и лиду зоны для фиксов. При этом на заставлять “кипятить океан” и чинить неважные баги в неважных отчётах, датасетах.
Как мы посчитали первую версию Health Score:
Объекту (дашборду, датасету) начисляются «штрафные» баллы (чем больше тем "хуже здоровье") за:
– скорость, медленные запросы и ошибки
– отсутствие владельца
– неиспользуемость
– заброшенность - срок с последнего обновления
– дубли и высокое подобие, временные схемы и т.п.
Далее добавляем мультипликаторы. Усугубляем если:
- владелец BI
- высокий WAU
- используется руководством
Считаем скоры по объекту и агрегируем по доменам и авторам: Health Score = (сумма баллов × мультипликаторы) / максимум
Когда накопим опыт и устаканим логику — ребята опишут подробнее статьей на Хабр. Подсвечу тогда тему ещё раз.
Если у вас был близкий опыт — велком в комменты.
🗂 Кстати - кто хочет следить за BI в Авито - вот папка с авторскими и общими tg каналами
#АвитоBI
Мы в командах всегда много экспериментировали с этим подходом. Сейчас в Авито заходим на новый круг.
Проблема стара как сам BI: массово делаем отчёты → страдает гигиена → страдает навигация → теряем трафик.
Кто-то пытается зарегулировать процесс (тесты, преревью), кто-то отпускает — и плодит хаос.
В децентрализованной системе от 100+ аналитиков - обязаловка не работает. Что работает:
– сертифицировать часть контента (важно, но об этом отдельно)
– качать культуру разработки и вайб качества
– фокусировать внимание через личные цели и окры.
Важно искать баланс:
- держать здоровье значимых объектов на уровне,
- для остального давать тулы для самоконтроля.
BI Health Score Reporting - это инструмент поддержки для всех этих мер. К нему прилагается процесс (например периодические BI Субботники, но это тоже тянет на отдельный пост).
Цель такого отчета проскорить все объекты по факторам и подсветить автору и лиду зоны для фиксов. При этом на заставлять “кипятить океан” и чинить неважные баги в неважных отчётах, датасетах.
Как мы посчитали первую версию Health Score:
Объекту (дашборду, датасету) начисляются «штрафные» баллы (чем больше тем "хуже здоровье") за:
– скорость, медленные запросы и ошибки
– отсутствие владельца
– неиспользуемость
– заброшенность - срок с последнего обновления
– дубли и высокое подобие, временные схемы и т.п.
Далее добавляем мультипликаторы. Усугубляем если:
- владелец BI
- высокий WAU
- используется руководством
Считаем скоры по объекту и агрегируем по доменам и авторам: Health Score = (сумма баллов × мультипликаторы) / максимум
Когда накопим опыт и устаканим логику — ребята опишут подробнее статьей на Хабр. Подсвечу тогда тему ещё раз.
Если у вас был близкий опыт — велком в комменты.
🗂 Кстати - кто хочет следить за BI в Авито - вот папка с авторскими и общими tg каналами
#АвитоBI
Ничего нового, никаких умных мыслей
Вместе с ребятами из Т-банк, Яндекс, Авито, positive tech, Андреем Data Yoga, Ромой Reveal the data, Сашей из DataBar и др - пили пиво и приятно душнили.
ИИ Скепсис и тревога, ИИ равнодушие и отвага
Записал себе два наблюдения
1) некоторые тех компании уже начали при бекфиле (замене ушедшего сотрудника) запрашивать обязательное подтверждение, что его не может заменить ИИ. Форма фриза найма ?)
2) дата тикток - лента дата инсайтов, сделать думскролинг полезным для компании. (И оставить таким же вредным для сотрудника ))
Изучал на неделе взгляд табло на будущее биай.
Рисуют новый продукт рядом со старым.
Отсюда родился вопрос-кейс (пишите ответы в комменты):
Вместе с ребятами из Т-банк, Яндекс, Авито, positive tech, Андреем Data Yoga, Ромой Reveal the data, Сашей из DataBar и др - пили пиво и приятно душнили.
ИИ Скепсис и тревога, ИИ равнодушие и отвага
Записал себе два наблюдения
1) некоторые тех компании уже начали при бекфиле (замене ушедшего сотрудника) запрашивать обязательное подтверждение, что его не может заменить ИИ. Форма фриза найма ?)
2) дата тикток - лента дата инсайтов, сделать думскролинг полезным для компании. (И оставить таким же вредным для сотрудника ))
Изучал на неделе взгляд табло на будущее биай.
Рисуют новый продукт рядом со старым.
Отсюда родился вопрос-кейс (пишите ответы в комменты):
Вы развиваете свой опенсорс BI в компании - как бы вы поделили инвестиции на ближ 3 года в разработку между
- фичами классического биай (чтобы делать быстро дашборды и работать с данными и логикой)
- фичами нового биай (ии
агенты и чат-парадигма)
Ваши 2 цифры?
пример 80 на 20
А если на 6+ лет?
🛫 Ускользающая мудрость: Стоимость прокачки любой метрики в какой то момент становится запредельной и для достижения максимальной пользы нужно комбинировать разные драйверы, опытным путем находя точки где дальнейшие инвестиции не разумны.
Иллюстрация таких «точек» на примере пользы от BI.
Последний график претендует на другую динамику.
Нужно вложить много, но и масштабируемость пользы будет выше. Нет?
На прошедшей на неделе стратсессии по развитию BI в Авито родились эти графики и показались свежим откровением. Сейчас смотрю - вроде база.
Воистину мысль осознанная заново - новая мысль.
Иллюстрация таких «точек» на примере пользы от BI.
Последний график претендует на другую динамику.
Нужно вложить много, но и масштабируемость пользы будет выше. Нет?
На прошедшей на неделе стратсессии по развитию BI в Авито родились эти графики и показались свежим откровением. Сейчас смотрю - вроде база.
Воистину мысль осознанная заново - новая мысль.
AI Актуалочка
На последних стратсессиях по данным и аналитике - встретил новый фактор. Блок некоторых участников обсуждать и комититься на долгосрочные цели. Причина - зачем мы строим планы в текущей парадигме, если вот прям совсем скоро GenAI трансформирует все. Приходится тратить много сил, чтобы вернуть креатив и вовлеченность
В итоге это проводит к двойственной стратегии - условно вы планируете и "старый BI" с его понятными практиками и пользой и "новый BI" с этими всеми экспериментами и гипотезами. В условиях нехватки ресурса - это такая себе стратегия, ну а как иначе. Нельзя останавливаться - надо бежать во все стороны, и при этом не отставать (сарказм).
Я писал про DG здравого смысла, про то, что надо трезво оценивать текущую и целевую зрелость своей компании с учетом ее рынка и размера. Видимо нужна такая же модель зрелости для AI.
Наверное там должны быть тезисы типа:
- если твоя выручка меньше ярда долларов, (или) ты не техкомпания - не трать деньги на хостинг своей Gen AI инфры. Следи за трендами, и качай свой Core BI, хранилище и DQ. Максимум делай 1 пилот по самому критичному AI usecase своего бизнеса.
- если ты относительно богат и лидер отрасли - подели бюджет на три части:
1/3 надата гавернанс на построение качественного слоя дата продуктов и метаданных, управление рисками
1/3 на разработку: proof-of-concept'ы по консервативно ранжированному списку юзкейсов, найм и обучение людей
Только 1/3 на инфру.
Посерчил и не нашел ничего толкового. Только вендорский и big4 булшит.
Видимо рано еще.
Если кто находил что толковое по GenAI зрелости - кидайте.
Ссылки на более-менее интересные статьи, что я нашел - оставлю в комментах.
На последних стратсессиях по данным и аналитике - встретил новый фактор. Блок некоторых участников обсуждать и комититься на долгосрочные цели. Причина - зачем мы строим планы в текущей парадигме, если вот прям совсем скоро GenAI трансформирует все. Приходится тратить много сил, чтобы вернуть креатив и вовлеченность
Кстати - Про проблему FOMO (Fear of missing out, страх, что все что-то знают и делают, а только ты – все упускаешь) в контектсе GenAI истерии вышел терапевтический выпуск с Евгением Котом. Помогает. Главное не поймайте ФОМО во время прослушивания подкаста про ФОМО.
В итоге это проводит к двойственной стратегии - условно вы планируете и "старый BI" с его понятными практиками и пользой и "новый BI" с этими всеми экспериментами и гипотезами. В условиях нехватки ресурса - это такая себе стратегия, ну а как иначе. Нельзя останавливаться - надо бежать во все стороны, и при этом не отставать (сарказм).
Я писал про DG здравого смысла, про то, что надо трезво оценивать текущую и целевую зрелость своей компании с учетом ее рынка и размера. Видимо нужна такая же модель зрелости для AI.
Наверное там должны быть тезисы типа:
- если твоя выручка меньше ярда долларов, (или) ты не техкомпания - не трать деньги на хостинг своей Gen AI инфры. Следи за трендами, и качай свой Core BI, хранилище и DQ. Максимум делай 1 пилот по самому критичному AI usecase своего бизнеса.
- если ты относительно богат и лидер отрасли - подели бюджет на три части:
1/3 на
1/3 на разработку: proof-of-concept'ы по консервативно ранжированному списку юзкейсов, найм и обучение людей
Только 1/3 на инфру.
Посерчил и не нашел ничего толкового. Только вендорский и big4 булшит.
Видимо рано еще.
Если кто находил что толковое по GenAI зрелости - кидайте.
Ссылки на более-менее интересные статьи, что я нашел - оставлю в комментах.
5 BI вендоров и стол
В этом мире автогенерирумой экспертизы провели ламповый, но круглый стол с ребятами из Visiology, Data Lens, Loginom, PIX BI. Еще Маша Гришина к нам пришла разогнать тоску своим отборным обесцениванием.
Наговорили 2 часа не под запись. Спасибо ребят.
Для написания саммари в пост👇 мучил промптами текстовую расшифровку нашей встречи, плюнул и написал сам. Сука сглаживает все. Бесит, ведь не ждешь уже подвоха.
На фото справа - Сергей aka Громов - человек,который не пришел - предпочел дебри природы дебрям современного биай.
Кто его осудит.
Всем лета.
Тезисы
В этом мире автогенерирумой экспертизы провели ламповый, но круглый стол с ребятами из Visiology, Data Lens, Loginom, PIX BI. Еще Маша Гришина к нам пришла разогнать тоску своим отборным обесцениванием.
Наговорили 2 часа не под запись. Спасибо ребят.
Для написания саммари в пост👇 мучил промптами текстовую расшифровку нашей встречи, плюнул и написал сам. Сука сглаживает все. Бесит, ведь не ждешь уже подвоха.
На фото справа - Сергей aka Громов - человек,
Кто его осудит.
Всем лета.
Тезисы
Вот мой конспект тезисов:
💁♂ Российский биай (vs мировой):
- считает что догнал в ux и core фичах (спорно)
- сильно отстает в платформенности (да)
- будет опережать в ИИ, тут все стартовали с одной точки (возможно да)
🧐 80% роcсийского рынка все еще на западном биай несмотря на риски - «Если что-то работает, то, конечно, никому неохота переделывать»
⚡ Борьба концепций - биай как рисовалка (молодежь) vs биай end to end (старики). Борьбы видимо нет. Просто делят клиентов по зрелости стека и запросам. Впереди консолидация рынка.
😰 Про суперсет и другой оперсорс: «Если организация научилась управлять сайзингом, ресурсом и набрала решимости идти в продукт/опенсорс — всё-таки может взлететь на большом масштабе и ресурсе. Кор фичи отточить а дальше легче.
Иначе через три года - осознание и откат к рыночным корпоративным продуктам.»
Ну и что там про Gen AI
🤗 GenAI быстрее стартует там где выше толерантность к ошибкам ("где руками косячат еще больше")
В итоге сценарии в дата менеджменте (глоссарии, документация, DQ) - более перспективные чем в биай.
😟 «Мы видим панику в глазах у стоящих на обрыве: компании боятся пускать ИИ в DWH и неструктурированные источники...» хм, ну не знаю
🤑 «GenAI ложно воспринимается как волшебная таблетка - как сам BI 10 лет назад. Порог входа в движуху очень высокий»
Решения от вендоров (облачные, но и тех пока нет) будут косо-криво интегрироваться с экосистемами компаний (каталоги, мета, документация, метрики), а свой end-to-end дата ассистент это супердорого и сложно.
Придётся строить серьёзный фундамент, с DG и другим блекджеком. А это уже не секси.
Короче сдувается драйв и все смотрят на бихтехи?
😭 Вендоры играют с
- саммаризацией - добыча инсайтов из дашбордов
- навигацией - продвинутый поиск и рекомендация готовых отчетов
- сoding копайлотами - они есть и будут на каждом углу: писать SQL, DAX, HTML и проч - нормальная тема, но это уже принятая нами реальность.
Чистые дата ассистенты пытаются делать, и тут все признаются - все работает только на "красивых" примерах. На продукт пока не тянет.
- считает что догнал в ux и core фичах (спорно)
- сильно отстает в платформенности (да)
- будет опережать в ИИ, тут все стартовали с одной точки (возможно да)
Иначе через три года - осознание и откат к рыночным корпоративным продуктам.»
Ну и что там про Gen AI
В итоге сценарии в дата менеджменте (глоссарии, документация, DQ) - более перспективные чем в биай.
Решения от вендоров (облачные, но и тех пока нет) будут косо-криво интегрироваться с экосистемами компаний (каталоги, мета, документация, метрики), а свой end-to-end дата ассистент это супердорого и сложно.
Придётся строить серьёзный фундамент, с DG и другим блекджеком. А это уже не секси.
Короче сдувается драйв и все смотрят на бихтехи?
- саммаризацией - добыча инсайтов из дашбордов
- навигацией - продвинутый поиск и рекомендация готовых отчетов
- сoding копайлотами - они есть и будут на каждом углу: писать SQL, DAX, HTML и проч - нормальная тема, но это уже принятая нами реальность.
Чистые дата ассистенты пытаются делать, и тут все признаются - все работает только на "красивых" примерах. На продукт пока не тянет.
Please open Telegram to view this post
VIEW IN TELEGRAM
Data Nature 🕊
Про BI Health Score Мы в командах всегда много экспериментировали с этим подходом. Сейчас в Авито заходим на новый круг. Проблема стара как сам BI: массово делаем отчёты → страдает гигиена → страдает навигация → теряем трафик. Кто-то пытается зарегулировать…
Рассказывал недавно про BI health score. И вот подъехал пост в канале Маши Аничковой про проведенный в Авито BI субботник. Есть много мыслей как еще усилить пользу, но опыт будем повторять и миксовать с сертификаций отчетов и витрин 🧹
#АвитоBI
#АвитоBI
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
Пирожки и бары | про BI
❔ Как проверить 1 000 объектов в BI-системе и не сойти с ума (а главное - зачем?)
Под BI-объектами в этом посте я буду подразумевать дашборды и то, из чего они состоят - в нашем случае это квери и чартсы. А также датасеты - источники данных для дашборда…
Под BI-объектами в этом посте я буду подразумевать дашборды и то, из чего они состоят - в нашем случае это квери и чартсы. А также датасеты - источники данных для дашборда…
- Как внедрять стандарты там, где бизнес быстро меняется и аналитики не успевают думать про гавернанс?
- Как делать кор слои метрик, отчетов, витрин в децентрализованных мульти-доменах?
- Как реально качать селфсервис сценарии на стыке оперсорс BI и LLM?
- Как прокачивать качество и культуру визуализации, не уходя в избыточность и датавизо-поклонничество?
- А нужны ли вообще процессы и центры экспертизы или аджальный хаос лучше подходит этому миру?
Если у тебя есть ответ на один из этих вопросов выше - откликайся на вакансию к нам в команду Core BI.
Мы делаем постмодерновый BI с блекджеком и здравым смыслом.
Ищем звезду. Стек значения не имеет.
Детали - в посте Димы, CV в личку
#АвитоBI
- Как делать кор слои метрик, отчетов, витрин в децентрализованных мульти-доменах?
- Как реально качать селфсервис сценарии на стыке оперсорс BI и LLM?
- Как прокачивать качество и культуру визуализации, не уходя в избыточность и датавизо-поклонничество?
- А нужны ли вообще процессы и центры экспертизы или аджальный хаос лучше подходит этому миру?
Если у тебя есть ответ на один из этих вопросов выше - откликайся на вакансию к нам в команду Core BI.
Мы делаем постмодерновый BI с блекджеком и здравым смыслом.
Ищем звезду. Стек значения не имеет.
Детали - в посте Димы, CV в личку
#АвитоBI
Бенчмарки по численности и функционалу data ролей
В этом году делал полевой ресерч структур дата/BI команд в российском Tech сегменте (cпасибо всем за участие).
В эту же тему делал ранее более широкий опрос.
В итоге после очистки осталось 64 российских компаний из разных отраслей и я таки собрал данные в публичный деш.
Вот хайлайт выводов
Пропорции ролей
На 1 data роль - 11.7 casual users (обычные бизнес пользователи)
На 1 BI/DA - 25 casual users
На 1 DE - 1.9 BI/DA
Структура data ролей (в среднем):
51% — BI/DA (на 1 BI - 8-10 Data-аналитиков)
26% — Data Engineers.
17% — Data Scientists.
7% — DG/DQ
В условном IT+ecomm - количество дата ролей значимо больше, чем в других отраслях:
На 1 data роль - 8.3 casual users
На 1 BI/DA - 15 casual users
Воздержусь от других выводов - слишком малая выборка и много вопросов к тому кто, кого, куда относит на стыках DE-BI, DA-DS.
Кажется специфика компании ее история и аналитическая традиция влияет на состав (и нейминг) ролей не меньше, чем размер или отрасль.
Данные можно соотнести с databenchmarks.
Забавно что если сделать регруппинг моих ролей по их корзинам insight / engineering / ML (DS попадает в Insight, BI и DG в Engineering) то получаются очень близкие цифры.
Другие наблюдения из интервью
BI COE/Core BI
В децентрализованной модели - масштаб спонсирует организацию: при небольшом числе доменов и BI-аналитиков (менее 30) - BI CoE себя не окупает.
При росте возникает BI Core/CoE, который берёт на себя стандартизацию, кросс-доменные практики работы с качеством, демократизацию, обучение, координацию инициатив развития.
Триггер - когда несколько доменов начинают автономно строить свои собственные процессы управления BI/данными.
Размер Core BI обычно 3–5 человек. Больше - только если команда берет на себя дополнительные домены на поддержку, как правило корп функций.
Есть варианты «виртуального» CoE (сборные советы чемпионов) - могут давать ограниченный эффект на малом-среднем масштабе.
Другие Роли
- Подход 1: BI работает рядом с SA и DE, деля между собой функции в BI-цикле. BI - деши и репортинг витрины. SA и DE - качество остальных слоев данных.
- Подход 2: BI как fullstack/AE. DE занимается платформой и кор слоем витрин.
При этом все может быть гибридно и неоднородно внутри одной компании от домена к домену.
Курирование доменов
Зрелые компании вводят дополнительную роль Дата партнеров (нейминг разнится), отвечающие за BI сертификацию, полноту метаданных, за качество данных внутри домена. Это могут быть BI-лиды, системные аналитики. Роль замыкает на себя рутины гавернанса.
Кому есть что добавить - велком
В этом году делал полевой ресерч структур дата/BI команд в российском Tech сегменте (cпасибо всем за участие).
В эту же тему делал ранее более широкий опрос.
В итоге после очистки осталось 64 российских компаний из разных отраслей и я таки собрал данные в публичный деш.
Вот хайлайт выводов
Пропорции ролей
На 1 data роль - 11.7 casual users (обычные бизнес пользователи)
На 1 BI/DA - 25 casual users
На 1 DE - 1.9 BI/DA
Структура data ролей (в среднем):
51% — BI/DA (на 1 BI - 8-10 Data-аналитиков)
26% — Data Engineers.
17% — Data Scientists.
7% — DG/DQ
В условном IT+ecomm - количество дата ролей значимо больше, чем в других отраслях:
На 1 data роль - 8.3 casual users
На 1 BI/DA - 15 casual users
Воздержусь от других выводов - слишком малая выборка и много вопросов к тому кто, кого, куда относит на стыках DE-BI, DA-DS.
Кажется специфика компании ее история и аналитическая традиция влияет на состав (и нейминг) ролей не меньше, чем размер или отрасль.
Данные можно соотнести с databenchmarks.
Забавно что если сделать регруппинг моих ролей по их корзинам insight / engineering / ML (DS попадает в Insight, BI и DG в Engineering) то получаются очень близкие цифры.
Другие наблюдения из интервью
BI COE/Core BI
В децентрализованной модели - масштаб спонсирует организацию: при небольшом числе доменов и BI-аналитиков (менее 30) - BI CoE себя не окупает.
При росте возникает BI Core/CoE, который берёт на себя стандартизацию, кросс-доменные практики работы с качеством, демократизацию, обучение, координацию инициатив развития.
Триггер - когда несколько доменов начинают автономно строить свои собственные процессы управления BI/данными.
Размер Core BI обычно 3–5 человек. Больше - только если команда берет на себя дополнительные домены на поддержку, как правило корп функций.
Есть варианты «виртуального» CoE (сборные советы чемпионов) - могут давать ограниченный эффект на малом-среднем масштабе.
Другие Роли
- Подход 1: BI работает рядом с SA и DE, деля между собой функции в BI-цикле. BI - деши и репортинг витрины. SA и DE - качество остальных слоев данных.
- Подход 2: BI как fullstack/AE. DE занимается платформой и кор слоем витрин.
При этом все может быть гибридно и неоднородно внутри одной компании от домена к домену.
Курирование доменов
Зрелые компании вводят дополнительную роль Дата партнеров (нейминг разнится), отвечающие за BI сертификацию, полноту метаданных, за качество данных внутри домена. Это могут быть BI-лиды, системные аналитики. Роль замыкает на себя рутины гавернанса.
Кому есть что добавить - велком