Настал момент поделиться еще одним пет-проектом уходящего и глядущего года - это настольная игра с кодовым названием Data Wombata.
ссылка на лендинг
Идея сделать настолку для дата/аналитических команд возникла в этом канале в середине лета, собралась небольшая идейная команда проекта, началось творчество.
Серия брейнстормов завершилась двумя идеями:
- "простая, про дата грамотность" - где игроки зарабатывают очки, подбирая лучшие ассоциации к терминам и картинкам (что то похожее на имаджинариум и codenames), соревнуясь с коллегами и с виртуальным игроком (священный рандом).
- "сложная, про датамеш" - команды (домены) через баллы и ходы проигрывают прокачку данных из сырья в инсайты, попутно покупая и реализуя разные инициативы по управлению данными, чтобы сбалансировать экономику своей "фабрики", взаимодействуя с другими доменами и центральной командой.
🤔 Взяли идею 1 для старта. Будем делать не торопясь, за свои деньги.
Финальной цены еще нет, но уже ясно, что наш ценник будет выше массового ассортимента на озоне.
Наша цель - сделать что то кайфовое по игровой сути и из хороших материалов. Ну и есть расчет, что цена не будет определяющим фактором (гипотеза) для компаний, которые захотят ее купить.
Электронная версия для распределенных команд тоже в планах - сделаем, когда выпустим и откастдевим оффлайновую.
💬 Целимся напечатать в мае. А до этого будет серия постов с репортажем о процессе тут в канале о том,
- как формируем наборы слов-терминов,
- как c помощью LLM генерируем промты и картинки (с последующей ручной дорисовкой)
- как через ту же LLM тестируем слова об картинки и картинки об слова.
🙏 Какие-то идеи будем выносить на голосования и спрашивать мнение.
А пока - посмотрите на красивый лендинг, почитайте про концепт, про то, какие боли игра должна помочь решить.
Там же можно заявить об интересе к участию в предзаказе (без обязательств пока, просто спишемся с вами, пообщаемся ).
Оставляйте вопросы в комментах - это будет реально нам полезно, чтобы получить в итоге хороший продукт. Можете еще предлагать идеи терминов и картинок, это весело!
Сложно находить время на такие сайд-проекты, но такой публичный коммит не оставит нам выбора)
Наша дримтим проекта:
💻 Евгений Ермаков (Toloka AI)
👩🎤 Евгений Биккинин (Remerge)
🔥 Александр Бараков (Luxoft, Data Naturе)
🎼 Екатерина Стушкова (Cardgamer, классные ребята которые раньше работали в Data/BI а теперь делают крафтовые настольные игры)
и пусть в новом году у нас будет больше сил, желания и возможностей играть в игры,
с новым годом.
ссылка на лендинг
Идея сделать настолку для дата/аналитических команд возникла в этом канале в середине лета, собралась небольшая идейная команда проекта, началось творчество.
Серия брейнстормов завершилась двумя идеями:
- "простая, про дата грамотность" - где игроки зарабатывают очки, подбирая лучшие ассоциации к терминам и картинкам (что то похожее на имаджинариум и codenames), соревнуясь с коллегами и с виртуальным игроком (священный рандом).
- "сложная, про датамеш" - команды (домены) через баллы и ходы проигрывают прокачку данных из сырья в инсайты, попутно покупая и реализуя разные инициативы по управлению данными, чтобы сбалансировать экономику своей "фабрики", взаимодействуя с другими доменами и центральной командой.
Финальной цены еще нет, но уже ясно, что наш ценник будет выше массового ассортимента на озоне.
Наша цель - сделать что то кайфовое по игровой сути и из хороших материалов. Ну и есть расчет, что цена не будет определяющим фактором (гипотеза) для компаний, которые захотят ее купить.
Электронная версия для распределенных команд тоже в планах - сделаем, когда выпустим и откастдевим оффлайновую.
- как формируем наборы слов-терминов,
- как c помощью LLM генерируем промты и картинки (с последующей ручной дорисовкой)
- как через ту же LLM тестируем слова об картинки и картинки об слова.
А пока - посмотрите на красивый лендинг, почитайте про концепт, про то, какие боли игра должна помочь решить.
Там же можно заявить об интересе к участию в предзаказе (без обязательств пока, просто спишемся с вами, пообщаемся ).
Оставляйте вопросы в комментах - это будет реально нам полезно, чтобы получить в итоге хороший продукт. Можете еще предлагать идеи терминов и картинок, это весело!
Сложно находить время на такие сайд-проекты, но такой публичный коммит не оставит нам выбора)
Наша дримтим проекта:
и пусть в новом году у нас будет больше сил, желания и возможностей играть в игры,
с новым годом.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Про Data Analytics Engineer
Новый год и новый проект заставил вернуться к теме балансировки базовых дата ролей.
Вроде казалось, что все ясно, но нет. В больших дата платформах роли формируются нешаблонно.
Наблюдение этой недели:
- Дата инженер в data mesh модели всегда стремится скрыться от бизнеса в свою "базу" - в построение и поддержку инфраструктуры, разработку платформы, тюннинг архитектуры, мониторинг производительности, ETL/ELT первичных интеграций, игры с облачными сервисами, кластерами и контейнерами.
- BI аналитик в data mesh модели получает право и обязанность готовить себе данные сам - моделировать раскладку на слои и оптимизировать. Можно добиться того, что Синьорные BI в результате будут делать все от качественного кода и подготовки данных до качественного аналитического продукта и визуала.
Но на практике здесь возникает зона для потерь.
BI под прессингом бизнес задач, адхоков, коммуникаций оказывается не способен строить и поддерживать сложные инженерные процессы с их постоянным мониторингом и оптимизацией. Заниматься дотошным гавернансом, документацией и датачеками дата слоя без ущерба BI проектам. А без этого мы быстро теряем "ощущение качества", и домен погружается в "костыли" и непрозрачность.
Решение? -
Analytics Engineer (термин придумал вроде dbt, еще встречается Business Data Engineer) - как я его понимаю это подтип дата инженера, работающего на бизнес-юнит на задачах от BI и дата аналитиков, задача которого создавать структурированную и качественную среду для работы с данными домена.
Он отвечает за
- подготовку данных для дашбордов, аналитических моделей. Либо выступая как сервис для BI, либо курируя то что пишут BI, беря на себя самое сложное
- работу над метадатой и качеством (метрики покрытия документацией и чекерами)
- оптимизацию пайплайнов и причесывание всей "поляны" данных домена (метрики usage и переиспользования сертифицированных таблиц)
плюс функционал со звездочкой:
*выступает продактом для данных в домене - упаковывает сертифицированные объекты в дата-продукты, обеспечивает прозрачное развитие с нотификациями и уровнем сервиса для потребителей из разных доменов.
** идеально подходит на роль domain data custodian (вспоминаем DG)
Фактически это тот же дата инженер, и можно не выделять его в отдельную роль, скажет кто-то. и будет прав.
Но отличия есть
- в скилах. требуется прогрузка в бизнес-логику
- в треке развития. вечная проблема гибридных ролей
Еще одна проблема такой роли - это найти на нее людей - приходится искать либо дата инженера, который будет готов работать так близко к бизнесу или хардового биайщика, который всегда мечтал быть инженером.
Скорее всего роль неуниверсальна и подходит для определенных сценариев сложных дата платформ. Мы набирали ее в одном желтом банке еще года 4 назад. Эксперимент был успешен.
1 такой внедренный дата инженер напрашивается на домен, где есть как минимум 3 плодовитых биащика.
На фото и по ссылке новый шаблон по этой теме с примером "разгрузки" BI роли. Может кому будет полезен.
Все ваши примеры решения похожих кейсов из практики - приму с благодарностью.
(если вы дочитали пост до конца доставьте + в комментарии🤔 )
Новый год и новый проект заставил вернуться к теме балансировки базовых дата ролей.
Вроде казалось, что все ясно, но нет. В больших дата платформах роли формируются нешаблонно.
Наблюдение этой недели:
- Дата инженер в data mesh модели всегда стремится скрыться от бизнеса в свою "базу" - в построение и поддержку инфраструктуры, разработку платформы, тюннинг архитектуры, мониторинг производительности, ETL/ELT первичных интеграций, игры с облачными сервисами, кластерами и контейнерами.
- BI аналитик в data mesh модели получает право и обязанность готовить себе данные сам - моделировать раскладку на слои и оптимизировать. Можно добиться того, что Синьорные BI в результате будут делать все от качественного кода и подготовки данных до качественного аналитического продукта и визуала.
Но на практике здесь возникает зона для потерь.
BI под прессингом бизнес задач, адхоков, коммуникаций оказывается не способен строить и поддерживать сложные инженерные процессы с их постоянным мониторингом и оптимизацией. Заниматься дотошным гавернансом, документацией и датачеками дата слоя без ущерба BI проектам. А без этого мы быстро теряем "ощущение качества", и домен погружается в "костыли" и непрозрачность.
Решение? -
Analytics Engineer (термин придумал вроде dbt, еще встречается Business Data Engineer) - как я его понимаю это подтип дата инженера, работающего на бизнес-юнит на задачах от BI и дата аналитиков, задача которого создавать структурированную и качественную среду для работы с данными домена.
Он отвечает за
- подготовку данных для дашбордов, аналитических моделей. Либо выступая как сервис для BI, либо курируя то что пишут BI, беря на себя самое сложное
- работу над метадатой и качеством (метрики покрытия документацией и чекерами)
- оптимизацию пайплайнов и причесывание всей "поляны" данных домена (метрики usage и переиспользования сертифицированных таблиц)
плюс функционал со звездочкой:
*выступает продактом для данных в домене - упаковывает сертифицированные объекты в дата-продукты, обеспечивает прозрачное развитие с нотификациями и уровнем сервиса для потребителей из разных доменов.
** идеально подходит на роль domain data custodian (вспоминаем DG)
Фактически это тот же дата инженер, и можно не выделять его в отдельную роль, скажет кто-то. и будет прав.
Но отличия есть
- в скилах. требуется прогрузка в бизнес-логику
- в треке развития. вечная проблема гибридных ролей
Еще одна проблема такой роли - это найти на нее людей - приходится искать либо дата инженера, который будет готов работать так близко к бизнесу или хардового биайщика, который всегда мечтал быть инженером.
Скорее всего роль неуниверсальна и подходит для определенных сценариев сложных дата платформ. Мы набирали ее в одном желтом банке еще года 4 назад. Эксперимент был успешен.
1 такой внедренный дата инженер напрашивается на домен, где есть как минимум 3 плодовитых биащика.
На фото и по ссылке новый шаблон по этой теме с примером "разгрузки" BI роли. Может кому будет полезен.
Все ваши примеры решения похожих кейсов из практики - приму с благодарностью.
(если вы дочитали пост до конца доставьте + в комментарии
Please open Telegram to view this post
VIEW IN TELEGRAM
Дизайн стратегии BI в Авито завел в дебри темы эффективности BI. Опять.
Об этом уже было тут и тут. И много еще где. И снова думаешь - это мы модно BI систему как продукт строим или уже метрики ради метрик? Если все это считать и мониторить, то когда отчеты делать.
Знаю за собой черту делать культ из BI со всеми моими любимыми сертификациями, фрейморками, слайгайдами.
И упускать фокус с адхочной сути аналитики как дата конвейера по обслуживанию изменчивых потребностей бизнеса.
Это особенно наглядно при попытках навязать бизнесу идею дашбордов для операционного мониторинга, которые стоят потом как статуи в пустом музее твоего честолюбия.
Короче процессы, цели и метрики не должны быть сложными). Какая то такая мысль.
Ладно, вроде убрал то, что совсем тумач, наверно можно еще подрезать.
Но все равно многовато.
Темно зеленым то, на что хочется завязываться целями.
Светло-зеленым - цели, которые можно поставить в отдельных доменах, где больнее.
Есть дополнения, народ?
(картинка в highres в комментах)
И кстати - приходите на BI роли в Авито, чтобы замерять эти метрики (не все конечно - часть) и делать биай великим снова.
Есть позиции BI разработчиков, а также BI продакта. Требования высокие. Как и уровень задач.
Будут вопросы пишите в лс
#АвитоBI
Об этом уже было тут и тут. И много еще где. И снова думаешь - это мы модно BI систему как продукт строим или уже метрики ради метрик? Если все это считать и мониторить, то когда отчеты делать.
Знаю за собой черту делать культ из BI со всеми моими любимыми сертификациями, фрейморками, слайгайдами.
И упускать фокус с адхочной сути аналитики как дата конвейера по обслуживанию изменчивых потребностей бизнеса.
Это особенно наглядно при попытках навязать бизнесу идею дашбордов для операционного мониторинга, которые стоят потом как статуи в пустом музее твоего честолюбия.
Короче процессы, цели и метрики не должны быть сложными). Какая то такая мысль.
Ладно, вроде убрал то, что совсем тумач, наверно можно еще подрезать.
Но все равно многовато.
Темно зеленым то, на что хочется завязываться целями.
Светло-зеленым - цели, которые можно поставить в отдельных доменах, где больнее.
Есть дополнения, народ?
(картинка в highres в комментах)
И кстати - приходите на BI роли в Авито, чтобы замерять эти метрики (не все конечно - часть) и делать биай великим снова.
Есть позиции BI разработчиков, а также BI продакта. Требования высокие. Как и уровень задач.
Будут вопросы пишите в лс
#АвитоBI
Не читаю каналы последнее время, что там нового в дата-ассистентах? потухли костры рябин энтузиазма первой, второй волны? Кто внедрил работающие продовые решения? Какой вы получили MAU ваших чатботов?
Больше год назад я описывал наш опыт по связыванию LLM и BI через навигационный сценарий. Тогда наш достаточно сырой MVP, не имел большого успеха. Денег, хотя скорее фокуса тогда не хватило изучать пользовательский опыт и допиливать.
И вот снова делаю мысленный разгон - см схему ☝️и картинку в норм разрешении в комментах👇:
Сколько будет жив Бизнес-пользователь - столько аналитики будут получать адхоки. Отчеты, self-service - все это прекрасно, но вот спросить человека, это ж надежнее, проще, приятнее. И вот - вы тоже пилите дата ассистента (даже если не от веры, а от скуки/интереса).
Но мы все научились пробиваться через бота в чате с банком, кажется такая же первая реакция идет на дата ассистента. Что нужно, чтобы пользователь давал боту шанс? - Правильные ответы (или их высокая доля) - скажет занудный читатель канала. и будет прав. Но и после этого шансов раскрутить бота мало.
Моя гипотеза добавить "социализации" боту. Начать с того, что включить его в чаты поддержки с кожаными коллегами. Эту комфортную среду доверия и дружеской токсичности. И для начала научить его распознавать адхок (это уже все научились в service desk командах) и рекомендовать готовые объекты - отчеты, метрики, датасеты (из слоя сертифицированных).
Для этого нужна только хорошая метадата, документация (всего то) и дальше процессить на дежурных (давайте решим, что дежурство у вас есть).
Неожиданный эффект этой схемы - мы получаем все для расчета квази time-to-insight (про который писалИван Роман Бунин) как время простоя аналитика в ожидании отчета. Кайф короче.
Только два небольших допущения
(1) все адхоки идут в чат а не личные сообщения,
(2) все полученные ответы являются инсайтами, что конечно неправда😄
В этом году скорее всего будем делать такую штуку, помимо прочего.
Кому интересно - есть вакансии.
#АвитоBI
Больше год назад я описывал наш опыт по связыванию LLM и BI через навигационный сценарий. Тогда наш достаточно сырой MVP, не имел большого успеха. Денег, хотя скорее фокуса тогда не хватило изучать пользовательский опыт и допиливать.
И вот снова делаю мысленный разгон - см схему ☝️и картинку в норм разрешении в комментах👇:
Сколько будет жив Бизнес-пользователь - столько аналитики будут получать адхоки. Отчеты, self-service - все это прекрасно, но вот спросить человека, это ж надежнее, проще, приятнее. И вот - вы тоже пилите дата ассистента (даже если не от веры, а от скуки/интереса).
Но мы все научились пробиваться через бота в чате с банком, кажется такая же первая реакция идет на дата ассистента. Что нужно, чтобы пользователь давал боту шанс? - Правильные ответы (или их высокая доля) - скажет занудный читатель канала. и будет прав. Но и после этого шансов раскрутить бота мало.
Моя гипотеза добавить "социализации" боту. Начать с того, что включить его в чаты поддержки с кожаными коллегами. Эту комфортную среду доверия и дружеской токсичности. И для начала научить его распознавать адхок (это уже все научились в service desk командах) и рекомендовать готовые объекты - отчеты, метрики, датасеты (из слоя сертифицированных).
Для этого нужна только хорошая метадата, документация (всего то) и дальше процессить на дежурных (давайте решим, что дежурство у вас есть).
Неожиданный эффект этой схемы - мы получаем все для расчета квази time-to-insight (про который писал
Только два небольших допущения
(1) все адхоки идут в чат а не личные сообщения,
(2) все полученные ответы являются инсайтами, что конечно неправда
В этом году скорее всего будем делать такую штуку, помимо прочего.
Кому интересно - есть вакансии.
#АвитоBI
Please open Telegram to view this post
VIEW IN TELEGRAM
Минус вайб (кодинг) или конец “рисованию дашбордов”
Потестил сам, посмотрел отзывы, обсудил с Виталием Тренкеншу и захотелось накинуть на вентилятор:
Что будет меняться в BI профессии?
Что будет с BI командами фабриками отчетов?
AI агенты сделают self-service бизнес команд реальностью?
До конца года генераторы дашбордов сделают вероятно все вендоры и фирмы-консалтеры.
Есть признаки, что такое качество результата - даст старт проникновению этого сценария в массы в следующем году.
Рисовальщики дашбордов уйдут, но постепенно. В среднем агент будет рисовать лучше чем средний BI.
Виталий говорит, что LLM уже лучше человека пишет требования, теперь и рисовать будет лучше.
И бизнес сможет собирать отчетность через чат-ботов.
У заказчика всегда была сложность внятно формулирвоать требования, а у BI-щика их снимать. При этом действительно если описать свою работу и задачу, дать датасет — LLM уже продумывает цели и метрики лучше человека и предлагает хорошую структуру дашборда. То есть уже делает все от сбора требований до релиза.
Насчет лучшей работы с требованиями — я не уверен, что бизнес уж захочет шарить требования в промпт. Им нужен будет «кожаный посредник».
Бизнесу не нужны отчеты/метрики, за цифры в которых не отвечает конкретный человек (Вася). LLM всегда может сказать извини, а Вася отвечает головой (выходными).
Роль таких Вась будет важной - это кураторы доменов, партнеры, как хотите.
Таким образом, человек в биай останется, но это будет уже аналитический инженер: DE + BI end-to-end.
Я думаю, команды-фабрикиотчетности тоже останутся. Только будет 2-3 человек там, где было 7+.
Будет постепенная миграция в инжиниринг и дата-гавернанс рутину — курирование дата слоя, дата чеки, метаданные.
Стабильно будут себя чувствовать аналитические-инженеры: найти источники, загрузить, проверить качество, соединить, описать, обновить, пофиксить, оптимизировать (все не без LLM). Будет медленно вымываться джун-мидл уровень.
В эту же или в отдельную роль, но просматривается работа BI/data продактов/аналитиков — то, что LLM не решит, это next step бизнес польза от BI контента - adoption, custdev, аплифт метрик.
Делать BI контент станет еще дешевле, его станет еще больше, навигации еще меньше. Размечать эталонные витрины/отчеты/метрики из общей массы станет еще важнее.
Витрина с хорошими и описанными данными - главная ценность.
Виталий набросил, что дата-каталоги, бизнес-глоссарии и слой метрик будут развивать не для людей, а для ИИ-агентов.
Смешно. Наконец-то ими начнут нормально пользоваться😄
В общую картину добавим - сценарий поддержки адхоков и дежурств.
Сколько ждать это счастье?
Порог входа по цене и зрелость результата уже приемлемы, чтобы средние+ компании могли такое решение построить, + на отладку уйдет 3-5 лет (как с любой системой).
Но скорее всего в этот блудняк пойдут только инноваторы из числа больших тех компании - где создается минимум 100+ новых дашбордов в месяц, и "давление в системе” поставки данных высокое. Вот только объем экономии/выгод не факт что среднесрочно превысит затраты на всю эту движуху.
Остальные поиграются, но адоптить решение сами не будут. Не будут ломать то, что работает, ради ИИ-авантюры.
А трансформация профессии кмк займет десятилетие.
Бизнес и человек в этом плане кажется инерционен.
Как охранник где-то все еще поднимают шлагбаумы, когда есть камеры считывающие номера, так и дашборды будут делать дедовскими методами, хардкорно (руками) еще десятки лет.
а может и нет.
Потестил сам, посмотрел отзывы, обсудил с Виталием Тренкеншу и захотелось накинуть на вентилятор:
Что будет меняться в BI профессии?
Что будет с BI командами фабриками отчетов?
AI агенты сделают self-service бизнес команд реальностью?
До конца года генераторы дашбордов сделают вероятно все вендоры и фирмы-консалтеры.
Есть признаки, что такое качество результата - даст старт проникновению этого сценария в массы в следующем году.
Рисовальщики дашбордов уйдут, но постепенно. В среднем агент будет рисовать лучше чем средний BI.
Виталий говорит, что LLM уже лучше человека пишет требования, теперь и рисовать будет лучше.
И бизнес сможет собирать отчетность через чат-ботов.
У заказчика всегда была сложность внятно формулирвоать требования, а у BI-щика их снимать. При этом действительно если описать свою работу и задачу, дать датасет — LLM уже продумывает цели и метрики лучше человека и предлагает хорошую структуру дашборда. То есть уже делает все от сбора требований до релиза.
Насчет лучшей работы с требованиями — я не уверен, что бизнес уж захочет шарить требования в промпт. Им нужен будет «кожаный посредник».
Вариант воркфлоу от Виталия:
- Бизнес менеджеры посовещались и решили: «надо бы вот так данные посмотреть»
- Кинули задачу на Васю — дата-звезду (BI/Data партнер) департамента
- Вася в чат-бот: голосом вылил поток сознания
- Агент ему всё структурировал (он знает, чем занимается команда, какие у них KPI и цели)
- Вася чуть подчистил и сказал «сделай дашборд»
- Агент полез в дата-каталог, нашел данные, создал визуализации. Если не нашел - Вася дал витрину, добавил поле.
- Вася пару часов правил через голос/чат. Подкрутил косяки. Скинул результат коллегам
Бизнесу не нужны отчеты/метрики, за цифры в которых не отвечает конкретный человек (Вася). LLM всегда может сказать извини, а Вася отвечает головой (выходными).
Роль таких Вась будет важной - это кураторы доменов, партнеры, как хотите.
Таким образом, человек в биай останется, но это будет уже аналитический инженер: DE + BI end-to-end.
Я думаю, команды-фабрикиотчетности тоже останутся. Только будет 2-3 человек там, где было 7+.
Будет постепенная миграция в инжиниринг и дата-гавернанс рутину — курирование дата слоя, дата чеки, метаданные.
Стабильно будут себя чувствовать аналитические-инженеры: найти источники, загрузить, проверить качество, соединить, описать, обновить, пофиксить, оптимизировать (все не без LLM). Будет медленно вымываться джун-мидл уровень.
В эту же или в отдельную роль, но просматривается работа BI/data продактов/аналитиков — то, что LLM не решит, это next step бизнес польза от BI контента - adoption, custdev, аплифт метрик.
Делать BI контент станет еще дешевле, его станет еще больше, навигации еще меньше. Размечать эталонные витрины/отчеты/метрики из общей массы станет еще важнее.
Витрина с хорошими и описанными данными - главная ценность.
Виталий набросил, что дата-каталоги, бизнес-глоссарии и слой метрик будут развивать не для людей, а для ИИ-агентов.
Смешно. Наконец-то ими начнут нормально пользоваться
В общую картину добавим - сценарий поддержки адхоков и дежурств.
Сколько ждать это счастье?
Порог входа по цене и зрелость результата уже приемлемы, чтобы средние+ компании могли такое решение построить, + на отладку уйдет 3-5 лет (как с любой системой).
Но скорее всего в этот блудняк пойдут только инноваторы из числа больших тех компании - где создается минимум 100+ новых дашбордов в месяц, и "давление в системе” поставки данных высокое. Вот только объем экономии/выгод не факт что среднесрочно превысит затраты на всю эту движуху.
Остальные поиграются, но адоптить решение сами не будут. Не будут ломать то, что работает, ради ИИ-авантюры.
А трансформация профессии кмк займет десятилетие.
Бизнес и человек в этом плане кажется инерционен.
Как охранник где-то все еще поднимают шлагбаумы, когда есть камеры считывающие номера, так и дашборды будут делать дедовскими методами, хардкорно (руками) еще десятки лет.
а может и нет.
Please open Telegram to view this post
VIEW IN TELEGRAM
Этот пост про набор на ежегодный курс про BI стратегию в июне-июле.
Каждый новый год в профессии - он как хайкинг в горах
🍷 Сначала ты свеж - вдохновляешься конференциями, трендами, релизами. заряжаешь себя и людей целями
😬 Потом сталкиваешься с проблемами своей готовности:
ошибаешься, переосмысляешь, преодолеваешь
Теряешь часть попутчиков. Меняешь маршрут.
🍷 В итоге все таки достигаешь реалистичной цели, часто не той что была на картинке.
Сидишь уставший и смотришь вниз и вдаль.
Думаешь про новые горы (или о спа-центре - кто постарше)
Тут надо вырулить метафору на тему курса о стратегии в BI.
Одни готовы хотят лезть на высокую гору nextGen BI, тестировать AI генерацию инсайтов и проч кайфовые штуки которые подарил дивный новый мир, где никто еще не проложил троп.
Другие на опыте соизмеряют силы и риски - взбираются на горы пониже. Я тут про выстраивание качественного слоя витрин, отчетов и метрик - чтобы тратить меньше сил для получения большего эффекта - через оттачивание (пока) традиционных для BI процессов.
Чаще BI менеджер лезет на все горы сразу, борясь с тревогой от упущения времени с ИИ, хаосом данных, земными потребностями пользователя, и размытием границ ролей и тулов.
Ведь уже почти нет как такового BI - есть сквозной гавернанс данных и аналитики через зоопарк систем и метрик. Об этом и есть курс.
По правде сказать за годы этот курс превратился в гайд из 100500 тем, полезных практик и шаблонов.
Каждый мог найти что то для себя. Но каждый раз я пытаюсь запускать все больше обсуждений, когда участники скидывают свои кейсы под темы занятий и мы вместе их крутим.
Получается и терапия BI неврозов и концентрированный обмен опытом.
Не буду перечислять программу, тем более что она еще изменится походу.
Пишите в личку вопросы - я расскажу.
Или оставляйте заявки тут
Дата старта: 18 июня и далее 11 занятий по средам, пятницам и понедельникам
Формат: вечерние посиделки по 2-2,5 часа в онлайне, домашки и оффлайн сбор в баре в Москве в конце
Аудитория: обычно BI хеды, лиды, CDO, COO и дата менеджеры
Каждый новый год в профессии - он как хайкинг в горах
ошибаешься, переосмысляешь, преодолеваешь
Теряешь часть попутчиков. Меняешь маршрут.
Сидишь уставший и смотришь вниз и вдаль.
Думаешь про новые горы (или о спа-центре - кто постарше)
Тут надо вырулить метафору на тему курса о стратегии в BI.
Одни готовы хотят лезть на высокую гору nextGen BI, тестировать AI генерацию инсайтов и проч кайфовые штуки которые подарил дивный новый мир, где никто еще не проложил троп.
Другие на опыте соизмеряют силы и риски - взбираются на горы пониже. Я тут про выстраивание качественного слоя витрин, отчетов и метрик - чтобы тратить меньше сил для получения большего эффекта - через оттачивание (пока) традиционных для BI процессов.
Чаще BI менеджер лезет на все горы сразу, борясь с тревогой от упущения времени с ИИ, хаосом данных, земными потребностями пользователя, и размытием границ ролей и тулов.
Ведь уже почти нет как такового BI - есть сквозной гавернанс данных и аналитики через зоопарк систем и метрик. Об этом и есть курс.
По правде сказать за годы этот курс превратился в гайд из 100500 тем, полезных практик и шаблонов.
Каждый мог найти что то для себя. Но каждый раз я пытаюсь запускать все больше обсуждений, когда участники скидывают свои кейсы под темы занятий и мы вместе их крутим.
Получается и терапия BI неврозов и концентрированный обмен опытом.
Не буду перечислять программу, тем более что она еще изменится походу.
Пишите в личку вопросы - я расскажу.
Или оставляйте заявки тут
Дата старта: 18 июня и далее 11 занятий по средам, пятницам и понедельникам
Формат: вечерние посиделки по 2-2,5 часа в онлайне, домашки и оффлайн сбор в баре в Москве в конце
Аудитория: обычно BI хеды, лиды, CDO, COO и дата менеджеры
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Пошарю две ссылки с вами - занудную и фановую.
Начнем с первой:
1️⃣ Центральный банк РФ месяц назад выпустил методологию "Управление данными на финансовом рынке" - может все в курсе, я только увидел - спасибо @aivan_vok.
См 4 файла внизу страницы.
Это замах на стандарт и модель оценки зрелости управления данными. До этого все были зарубежные. Тут конечно компиляция мировых моделей, но достаточно хорошо переработанная. Короче возможно это событие. Тема data governance еще бустанет - все знают как тяжело получить такой бюджет. Теперь все банки и страховые получают если не пинок, то хороший аргумент.
Немного деталей:
Начнем с нейминга. Ну это извините пиздец, а не нейминг:
Посмотрел, нашел прям признаки проработки и осмысления темы:
Есть прям отсылки к чему то глубокому:
Короче видно что писали не дураки и не на отъебись.
Ну и самое интересное, как это будет метчиться с регулированием. Я так понял это пока как бонус:
Но видимо далее подъедут сертификации и компании, которые будут помогать ее проходить🤑
(я, если что, не готов сейчас)).
Еще бы ставку снизили, вообще огонь.
2️⃣ Симулятор Who’s the best CDO? https://www.whoisthebestcdo.com (на фото).
Фановая штука но с глубоким смыслом. Растишь репутацию, тратишь бюджет, решаешь проблемы и пытаешься принести пользу выраженную в выручке. Я поймал рабочие флешбеки.
Если добавить групповой формат игры, домены и штук 1000 разных событий, то можно неплохо провести время.
Источник Сайт Юры Гаврилова
Начнем с первой:
См 4 файла внизу страницы.
Это замах на стандарт и модель оценки зрелости управления данными. До этого все были зарубежные. Тут конечно компиляция мировых моделей, но достаточно хорошо переработанная. Короче возможно это событие. Тема data governance еще бустанет - все знают как тяжело получить такой бюджет. Теперь все банки и страховые получают если не пинок, то хороший аргумент.
Немного деталей:
Начнем с нейминга. Ну это извините пиздец, а не нейминг:
СУД УФР - Система управления данными участника финансового рынка.
Посмотрел, нашел прям признаки проработки и осмысления темы:
... Учреждение коллегиального органа по управлению данными (если требуется)
... Цифровые миражи – последствия от низкого качества данных
Есть прям отсылки к чему то глубокому:
... USER JOURNEY MAP в управлении данными
... Концептуальный дизайн на основе карточки процесса
Короче видно что писали не дураки и не на отъебись.
Ну и самое интересное, как это будет метчиться с регулированием. Я так понял это пока как бонус:
Задачами Банка России для реализации процедуры оценки зрелости
СУД УФР являются:
1. Создание методики оценки зрелости СУД УФР.
2. Проведение процедуры оценки зрелости СУД УФР.
3. Обработка и анализ результатов оценки зрелости СУД УФР.
Результаты оценки зрелости СУД УФР отправляются через личный кабинет Единой платформы внешнего взаимодействия Банка России или по электронной почте
Но видимо далее подъедут сертификации и компании, которые будут помогать ее проходить
(я, если что, не готов сейчас)).
Еще бы ставку снизили, вообще огонь.
Фановая штука но с глубоким смыслом. Растишь репутацию, тратишь бюджет, решаешь проблемы и пытаешься принести пользу выраженную в выручке. Я поймал рабочие флешбеки.
Если добавить групповой формат игры, домены и штук 1000 разных событий, то можно неплохо провести время.
Источник Сайт Юры Гаврилова
Please open Telegram to view this post
VIEW IN TELEGRAM
Про BI Health Score
Мы в командах всегда много экспериментировали с этим подходом. Сейчас в Авито заходим на новый круг.
Проблема стара как сам BI: массово делаем отчёты → страдает гигиена → страдает навигация → теряем трафик.
Кто-то пытается зарегулировать процесс (тесты, преревью), кто-то отпускает — и плодит хаос.
В децентрализованной системе от 100+ аналитиков - обязаловка не работает. Что работает:
– сертифицировать часть контента (важно, но об этом отдельно)
– качать культуру разработки и вайб качества
– фокусировать внимание через личные цели и окры.
Важно искать баланс:
- держать здоровье значимых объектов на уровне,
- для остального давать тулы для самоконтроля.
BI Health Score Reporting - это инструмент поддержки для всех этих мер. К нему прилагается процесс (например периодические BI Субботники, но это тоже тянет на отдельный пост).
Цель такого отчета проскорить все объекты по факторам и подсветить автору и лиду зоны для фиксов. При этом на заставлять “кипятить океан” и чинить неважные баги в неважных отчётах, датасетах.
Как мы посчитали первую версию Health Score:
Объекту (дашборду, датасету) начисляются «штрафные» баллы (чем больше тем "хуже здоровье") за:
– скорость, медленные запросы и ошибки
– отсутствие владельца
– неиспользуемость
– заброшенность - срок с последнего обновления
– дубли и высокое подобие, временные схемы и т.п.
Далее добавляем мультипликаторы. Усугубляем если:
- владелец BI
- высокий WAU
- используется руководством
Считаем скоры по объекту и агрегируем по доменам и авторам: Health Score = (сумма баллов × мультипликаторы) / максимум
Когда накопим опыт и устаканим логику — ребята опишут подробнее статьей на Хабр. Подсвечу тогда тему ещё раз.
Если у вас был близкий опыт — велком в комменты.
🗂 Кстати - кто хочет следить за BI в Авито - вот папка с авторскими и общими tg каналами
#АвитоBI
Мы в командах всегда много экспериментировали с этим подходом. Сейчас в Авито заходим на новый круг.
Проблема стара как сам BI: массово делаем отчёты → страдает гигиена → страдает навигация → теряем трафик.
Кто-то пытается зарегулировать процесс (тесты, преревью), кто-то отпускает — и плодит хаос.
В децентрализованной системе от 100+ аналитиков - обязаловка не работает. Что работает:
– сертифицировать часть контента (важно, но об этом отдельно)
– качать культуру разработки и вайб качества
– фокусировать внимание через личные цели и окры.
Важно искать баланс:
- держать здоровье значимых объектов на уровне,
- для остального давать тулы для самоконтроля.
BI Health Score Reporting - это инструмент поддержки для всех этих мер. К нему прилагается процесс (например периодические BI Субботники, но это тоже тянет на отдельный пост).
Цель такого отчета проскорить все объекты по факторам и подсветить автору и лиду зоны для фиксов. При этом на заставлять “кипятить океан” и чинить неважные баги в неважных отчётах, датасетах.
Как мы посчитали первую версию Health Score:
Объекту (дашборду, датасету) начисляются «штрафные» баллы (чем больше тем "хуже здоровье") за:
– скорость, медленные запросы и ошибки
– отсутствие владельца
– неиспользуемость
– заброшенность - срок с последнего обновления
– дубли и высокое подобие, временные схемы и т.п.
Далее добавляем мультипликаторы. Усугубляем если:
- владелец BI
- высокий WAU
- используется руководством
Считаем скоры по объекту и агрегируем по доменам и авторам: Health Score = (сумма баллов × мультипликаторы) / максимум
Когда накопим опыт и устаканим логику — ребята опишут подробнее статьей на Хабр. Подсвечу тогда тему ещё раз.
Если у вас был близкий опыт — велком в комменты.
🗂 Кстати - кто хочет следить за BI в Авито - вот папка с авторскими и общими tg каналами
#АвитоBI
Ничего нового, никаких умных мыслей
Вместе с ребятами из Т-банк, Яндекс, Авито, positive tech, Андреем Data Yoga, Ромой Reveal the data, Сашей из DataBar и др - пили пиво и приятно душнили.
ИИ Скепсис и тревога, ИИ равнодушие и отвага
Записал себе два наблюдения
1) некоторые тех компании уже начали при бекфиле (замене ушедшего сотрудника) запрашивать обязательное подтверждение, что его не может заменить ИИ. Форма фриза найма ?)
2) дата тикток - лента дата инсайтов, сделать думскролинг полезным для компании. (И оставить таким же вредным для сотрудника ))
Изучал на неделе взгляд табло на будущее биай.
Рисуют новый продукт рядом со старым.
Отсюда родился вопрос-кейс (пишите ответы в комменты):
Вместе с ребятами из Т-банк, Яндекс, Авито, positive tech, Андреем Data Yoga, Ромой Reveal the data, Сашей из DataBar и др - пили пиво и приятно душнили.
ИИ Скепсис и тревога, ИИ равнодушие и отвага
Записал себе два наблюдения
1) некоторые тех компании уже начали при бекфиле (замене ушедшего сотрудника) запрашивать обязательное подтверждение, что его не может заменить ИИ. Форма фриза найма ?)
2) дата тикток - лента дата инсайтов, сделать думскролинг полезным для компании. (И оставить таким же вредным для сотрудника ))
Изучал на неделе взгляд табло на будущее биай.
Рисуют новый продукт рядом со старым.
Отсюда родился вопрос-кейс (пишите ответы в комменты):
Вы развиваете свой опенсорс BI в компании - как бы вы поделили инвестиции на ближ 3 года в разработку между
- фичами классического биай (чтобы делать быстро дашборды и работать с данными и логикой)
- фичами нового биай (ии
агенты и чат-парадигма)
Ваши 2 цифры?
пример 80 на 20
А если на 6+ лет?
🛫 Ускользающая мудрость: Стоимость прокачки любой метрики в какой то момент становится запредельной и для достижения максимальной пользы нужно комбинировать разные драйверы, опытным путем находя точки где дальнейшие инвестиции не разумны.
Иллюстрация таких «точек» на примере пользы от BI.
Последний график претендует на другую динамику.
Нужно вложить много, но и масштабируемость пользы будет выше. Нет?
На прошедшей на неделе стратсессии по развитию BI в Авито родились эти графики и показались свежим откровением. Сейчас смотрю - вроде база.
Воистину мысль осознанная заново - новая мысль.
Иллюстрация таких «точек» на примере пользы от BI.
Последний график претендует на другую динамику.
Нужно вложить много, но и масштабируемость пользы будет выше. Нет?
На прошедшей на неделе стратсессии по развитию BI в Авито родились эти графики и показались свежим откровением. Сейчас смотрю - вроде база.
Воистину мысль осознанная заново - новая мысль.
AI Актуалочка
На последних стратсессиях по данным и аналитике - встретил новый фактор. Блок некоторых участников обсуждать и комититься на долгосрочные цели. Причина - зачем мы строим планы в текущей парадигме, если вот прям совсем скоро GenAI трансформирует все. Приходится тратить много сил, чтобы вернуть креатив и вовлеченность
В итоге это проводит к двойственной стратегии - условно вы планируете и "старый BI" с его понятными практиками и пользой и "новый BI" с этими всеми экспериментами и гипотезами. В условиях нехватки ресурса - это такая себе стратегия, ну а как иначе. Нельзя останавливаться - надо бежать во все стороны, и при этом не отставать (сарказм).
Я писал про DG здравого смысла, про то, что надо трезво оценивать текущую и целевую зрелость своей компании с учетом ее рынка и размера. Видимо нужна такая же модель зрелости для AI.
Наверное там должны быть тезисы типа:
- если твоя выручка меньше ярда долларов, (или) ты не техкомпания - не трать деньги на хостинг своей Gen AI инфры. Следи за трендами, и качай свой Core BI, хранилище и DQ. Максимум делай 1 пилот по самому критичному AI usecase своего бизнеса.
- если ты относительно богат и лидер отрасли - подели бюджет на три части:
1/3 надата гавернанс на построение качественного слоя дата продуктов и метаданных, управление рисками
1/3 на разработку: proof-of-concept'ы по консервативно ранжированному списку юзкейсов, найм и обучение людей
Только 1/3 на инфру.
Посерчил и не нашел ничего толкового. Только вендорский и big4 булшит.
Видимо рано еще.
Если кто находил что толковое по GenAI зрелости - кидайте.
Ссылки на более-менее интересные статьи, что я нашел - оставлю в комментах.
На последних стратсессиях по данным и аналитике - встретил новый фактор. Блок некоторых участников обсуждать и комититься на долгосрочные цели. Причина - зачем мы строим планы в текущей парадигме, если вот прям совсем скоро GenAI трансформирует все. Приходится тратить много сил, чтобы вернуть креатив и вовлеченность
Кстати - Про проблему FOMO (Fear of missing out, страх, что все что-то знают и делают, а только ты – все упускаешь) в контектсе GenAI истерии вышел терапевтический выпуск с Евгением Котом. Помогает. Главное не поймайте ФОМО во время прослушивания подкаста про ФОМО.
В итоге это проводит к двойственной стратегии - условно вы планируете и "старый BI" с его понятными практиками и пользой и "новый BI" с этими всеми экспериментами и гипотезами. В условиях нехватки ресурса - это такая себе стратегия, ну а как иначе. Нельзя останавливаться - надо бежать во все стороны, и при этом не отставать (сарказм).
Я писал про DG здравого смысла, про то, что надо трезво оценивать текущую и целевую зрелость своей компании с учетом ее рынка и размера. Видимо нужна такая же модель зрелости для AI.
Наверное там должны быть тезисы типа:
- если твоя выручка меньше ярда долларов, (или) ты не техкомпания - не трать деньги на хостинг своей Gen AI инфры. Следи за трендами, и качай свой Core BI, хранилище и DQ. Максимум делай 1 пилот по самому критичному AI usecase своего бизнеса.
- если ты относительно богат и лидер отрасли - подели бюджет на три части:
1/3 на
1/3 на разработку: proof-of-concept'ы по консервативно ранжированному списку юзкейсов, найм и обучение людей
Только 1/3 на инфру.
Посерчил и не нашел ничего толкового. Только вендорский и big4 булшит.
Видимо рано еще.
Если кто находил что толковое по GenAI зрелости - кидайте.
Ссылки на более-менее интересные статьи, что я нашел - оставлю в комментах.