Кто о чем а вшивый о бане.
На 2-м дне Data Science Conference я попал на доклад по …self service BI vs centralized BI.
Выводы спикера (чб картинка с барами) о применимости разных моделей близки к моим (цветная картинка).
В частности полная децентрализация не является оптимальным решением, о каком бы типе компании мы не говорили.
К тому, что "центральный BI" все таки нужен всем пришли даже датамешные бигтехи. Вопрос только баланса "гибридности" подхода для разных типов и размеров компаний.
На этом заметки с белградской конференции исчерпаны.
Не густо, но тут скорее моя вина. На второй день всегда нахожу с кем пить кофе и теряю интерес с выступлениям.
Едем дальше.
День 0, День 1
На 2-м дне Data Science Conference я попал на доклад по …self service BI vs centralized BI.
Выводы спикера (чб картинка с барами) о применимости разных моделей близки к моим (цветная картинка).
В частности полная децентрализация не является оптимальным решением, о каком бы типе компании мы не говорили.
К тому, что "центральный BI" все таки нужен всем пришли даже датамешные бигтехи. Вопрос только баланса "гибридности" подхода для разных типов и размеров компаний.
🧑💻В эту тему есть BI менеджерские вакансии в Авито. Зная ребят, высокий уровень задач гарантирован. Нужно строить как раз гибридную, адаптированную модель работы BI с сильной доменной автономией, сильным центром экспертизы для синхронизации усилий и управления развитием, сильной фабрикой кросс-функциональной управленческой аналитики. Без компромиссов короче.
Удачи в найме, кто готов. (не реклама)
На этом заметки с белградской конференции исчерпаны.
Не густо, но тут скорее моя вина. На второй день всегда нахожу с кем пить кофе и теряю интерес с выступлениям.
Едем дальше.
День 0, День 1
Miro подкинул идею, сделав обзор моей активности за год.
Мы вроде уже в команде развлекались с генерацией и рассылкой менеджерам индивидуальных дайджестов их перфоманса и hr аналитики за год.
Можно подумать, как через персональный дайджест "отпраздновать" с пользователями BI системы их активность за год.
Тут же придумать "номинации"
- как банальные типа: "вы собрали репорт-бинго" (пользовались отчетами из 5+ доменов) или "вы засмотрели его до дыр" (задарить постер с этим дашбордом)
- так и отбитые, типа: "вы нас сильно разочаровали", "мы ждали от вас больше", "а ведь этот отчет вас ждал"..
Короче подключить фантазию, самоиронию, добавить новогоднюю тематику и "подарки" - и можно хайпануть.
В борьбе за внимание и BI adoption нет мелочей.
Для креативной BI команды - работы на несколько дней. BI хеды, еще успеете до нового года.
Мы вроде уже в команде развлекались с генерацией и рассылкой менеджерам индивидуальных дайджестов их перфоманса и hr аналитики за год.
Можно подумать, как через персональный дайджест "отпраздновать" с пользователями BI системы их активность за год.
Тут же придумать "номинации"
- как банальные типа: "вы собрали репорт-бинго" (пользовались отчетами из 5+ доменов) или "вы засмотрели его до дыр" (задарить постер с этим дашбордом)
- так и отбитые, типа: "вы нас сильно разочаровали", "мы ждали от вас больше", "а ведь этот отчет вас ждал"..
Короче подключить фантазию, самоиронию, добавить новогоднюю тематику и "подарки" - и можно хайпануть.
В борьбе за внимание и BI adoption нет мелочей.
Для креативной BI команды - работы на несколько дней. BI хеды, еще успеете до нового года.
Гайд по теме Data Governance 2.0
2 года назад я публиковал data governance guide.
С тех пор я делал новую версию. Это мой способ подружить между собой абстракции, чтобы они не спорили как голоса в голове шизофреника, а логично и дружно жили. Возникая когда надо и не отсвечивали когда не нужны. Такая "ментальная парковка" и копинг стресса от информации.😭 😈
В декабре провели с BI Consult открытый курс по DG, мозг прогружен контекстом - возник шанс доделать.
Как и предыдущая версия - это все еще поверхностный взгляд на тему - он снимает верхний и средний слой проблематики. Гайд будет мало полезен людям с экспертным опытом, хотя местами есть хорошие ссылки и пасхалки.
🔗 Ссылки
Новая версия -https://miro.com/app/board/uXjVPlrgODk=/?moveToWidget=3458764592641555934&cot=14
Старая версия - https://miro.com/app/board/uXjVPlrgODk=/?moveToWidget=3458764546661134226&cot=14
На курсе были хорошие "обмены" с участниками и гостями:
- Подтвердилась гипотеза что опыт яндекса с дата партнерами это красивая модель, но деление на стюардов и кустодианов все таки жизнеспособнее.
- Классный бизнес кейс DG Александра Платонова но новому раскрыл мне идею "DG как on-demand сервиса, помогающего стартовать/разблокировать бизнес-инициативу".
- DataOps, автоматизация разработки, тестирования и документирования - важная черепаха, под ногами слонов DG.
- dbt нужен всем, а вот без слоя метрик все обходятся - вещь красивая, но организационно оч сложная.
- Бекенд системы таки можно вовлечь в общий лайнедж каталога, как и раскатать дата контрактинг, есть примеры
Вообще кажется есть позитив в индустрии - все больше людей проходят цикл страха-ярости-апатии, начинают креативно и логично строить сложные сбалансированные фреймворки.
🍷 Все кому гайд "зашел" и кто готов вносить вклад в его развитие (хорошие ссылки / мысли) напишите мне.
Есть немало экспертов, кто лучше меня шарит за DG, за отдельные его элементы, не отмалчивайтесь.
💬 Также можно оставлять комменты на борде с замечаниями/идеями (указывать на опечатки не нужно, не интересно).
У меня нет иллюзий - будет и третья версия через 2-3 года. От DG не убежать.
А пока, как обещал (самому себе), делаю паузу с DG, пора вернуться к BI. Приятный мир, где я уже не чувствую себя самозванцем.😑
2 года назад я публиковал data governance guide.
С тех пор я делал новую версию. Это мой способ подружить между собой абстракции, чтобы они не спорили как голоса в голове шизофреника, а логично и дружно жили. Возникая когда надо и не отсвечивали когда не нужны. Такая "ментальная парковка" и копинг стресса от информации.
В декабре провели с BI Consult открытый курс по DG, мозг прогружен контекстом - возник шанс доделать.
Как и предыдущая версия - это все еще поверхностный взгляд на тему - он снимает верхний и средний слой проблематики. Гайд будет мало полезен людям с экспертным опытом, хотя местами есть хорошие ссылки и пасхалки.
Новая версия -https://miro.com/app/board/uXjVPlrgODk=/?moveToWidget=3458764592641555934&cot=14
Старая версия - https://miro.com/app/board/uXjVPlrgODk=/?moveToWidget=3458764546661134226&cot=14
На курсе были хорошие "обмены" с участниками и гостями:
- Подтвердилась гипотеза что опыт яндекса с дата партнерами это красивая модель, но деление на стюардов и кустодианов все таки жизнеспособнее.
- Классный бизнес кейс DG Александра Платонова но новому раскрыл мне идею "DG как on-demand сервиса, помогающего стартовать/разблокировать бизнес-инициативу".
- DataOps, автоматизация разработки, тестирования и документирования - важная черепаха, под ногами слонов DG.
- dbt нужен всем, а вот без слоя метрик все обходятся - вещь красивая, но организационно оч сложная.
- Бекенд системы таки можно вовлечь в общий лайнедж каталога, как и раскатать дата контрактинг, есть примеры
Вообще кажется есть позитив в индустрии - все больше людей проходят цикл страха-ярости-апатии, начинают креативно и логично строить сложные сбалансированные фреймворки.
Есть немало экспертов, кто лучше меня шарит за DG, за отдельные его элементы, не отмалчивайтесь.
У меня нет иллюзий - будет и третья версия через 2-3 года. От DG не убежать.
А пока, как обещал (самому себе), делаю паузу с DG, пора вернуться к BI. Приятный мир, где я уже не чувствую себя самозванцем.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Настал момент поделиться еще одним пет-проектом уходящего и глядущего года - это настольная игра с кодовым названием Data Wombata.
ссылка на лендинг
Идея сделать настолку для дата/аналитических команд возникла в этом канале в середине лета, собралась небольшая идейная команда проекта, началось творчество.
Серия брейнстормов завершилась двумя идеями:
- "простая, про дата грамотность" - где игроки зарабатывают очки, подбирая лучшие ассоциации к терминам и картинкам (что то похожее на имаджинариум и codenames), соревнуясь с коллегами и с виртуальным игроком (священный рандом).
- "сложная, про датамеш" - команды (домены) через баллы и ходы проигрывают прокачку данных из сырья в инсайты, попутно покупая и реализуя разные инициативы по управлению данными, чтобы сбалансировать экономику своей "фабрики", взаимодействуя с другими доменами и центральной командой.
🤔 Взяли идею 1 для старта. Будем делать не торопясь, за свои деньги.
Финальной цены еще нет, но уже ясно, что наш ценник будет выше массового ассортимента на озоне.
Наша цель - сделать что то кайфовое по игровой сути и из хороших материалов. Ну и есть расчет, что цена не будет определяющим фактором (гипотеза) для компаний, которые захотят ее купить.
Электронная версия для распределенных команд тоже в планах - сделаем, когда выпустим и откастдевим оффлайновую.
💬 Целимся напечатать в мае. А до этого будет серия постов с репортажем о процессе тут в канале о том,
- как формируем наборы слов-терминов,
- как c помощью LLM генерируем промты и картинки (с последующей ручной дорисовкой)
- как через ту же LLM тестируем слова об картинки и картинки об слова.
🙏 Какие-то идеи будем выносить на голосования и спрашивать мнение.
А пока - посмотрите на красивый лендинг, почитайте про концепт, про то, какие боли игра должна помочь решить.
Там же можно заявить об интересе к участию в предзаказе (без обязательств пока, просто спишемся с вами, пообщаемся ).
Оставляйте вопросы в комментах - это будет реально нам полезно, чтобы получить в итоге хороший продукт. Можете еще предлагать идеи терминов и картинок, это весело!
Сложно находить время на такие сайд-проекты, но такой публичный коммит не оставит нам выбора)
Наша дримтим проекта:
💻 Евгений Ермаков (Toloka AI)
👩🎤 Евгений Биккинин (Remerge)
🔥 Александр Бараков (Luxoft, Data Naturе)
🎼 Екатерина Стушкова (Cardgamer, классные ребята которые раньше работали в Data/BI а теперь делают крафтовые настольные игры)
и пусть в новом году у нас будет больше сил, желания и возможностей играть в игры,
с новым годом.
ссылка на лендинг
Идея сделать настолку для дата/аналитических команд возникла в этом канале в середине лета, собралась небольшая идейная команда проекта, началось творчество.
Серия брейнстормов завершилась двумя идеями:
- "простая, про дата грамотность" - где игроки зарабатывают очки, подбирая лучшие ассоциации к терминам и картинкам (что то похожее на имаджинариум и codenames), соревнуясь с коллегами и с виртуальным игроком (священный рандом).
- "сложная, про датамеш" - команды (домены) через баллы и ходы проигрывают прокачку данных из сырья в инсайты, попутно покупая и реализуя разные инициативы по управлению данными, чтобы сбалансировать экономику своей "фабрики", взаимодействуя с другими доменами и центральной командой.
Финальной цены еще нет, но уже ясно, что наш ценник будет выше массового ассортимента на озоне.
Наша цель - сделать что то кайфовое по игровой сути и из хороших материалов. Ну и есть расчет, что цена не будет определяющим фактором (гипотеза) для компаний, которые захотят ее купить.
Электронная версия для распределенных команд тоже в планах - сделаем, когда выпустим и откастдевим оффлайновую.
- как формируем наборы слов-терминов,
- как c помощью LLM генерируем промты и картинки (с последующей ручной дорисовкой)
- как через ту же LLM тестируем слова об картинки и картинки об слова.
А пока - посмотрите на красивый лендинг, почитайте про концепт, про то, какие боли игра должна помочь решить.
Там же можно заявить об интересе к участию в предзаказе (без обязательств пока, просто спишемся с вами, пообщаемся ).
Оставляйте вопросы в комментах - это будет реально нам полезно, чтобы получить в итоге хороший продукт. Можете еще предлагать идеи терминов и картинок, это весело!
Сложно находить время на такие сайд-проекты, но такой публичный коммит не оставит нам выбора)
Наша дримтим проекта:
и пусть в новом году у нас будет больше сил, желания и возможностей играть в игры,
с новым годом.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Про Data Analytics Engineer
Новый год и новый проект заставил вернуться к теме балансировки базовых дата ролей.
Вроде казалось, что все ясно, но нет. В больших дата платформах роли формируются нешаблонно.
Наблюдение этой недели:
- Дата инженер в data mesh модели всегда стремится скрыться от бизнеса в свою "базу" - в построение и поддержку инфраструктуры, разработку платформы, тюннинг архитектуры, мониторинг производительности, ETL/ELT первичных интеграций, игры с облачными сервисами, кластерами и контейнерами.
- BI аналитик в data mesh модели получает право и обязанность готовить себе данные сам - моделировать раскладку на слои и оптимизировать. Можно добиться того, что Синьорные BI в результате будут делать все от качественного кода и подготовки данных до качественного аналитического продукта и визуала.
Но на практике здесь возникает зона для потерь.
BI под прессингом бизнес задач, адхоков, коммуникаций оказывается не способен строить и поддерживать сложные инженерные процессы с их постоянным мониторингом и оптимизацией. Заниматься дотошным гавернансом, документацией и датачеками дата слоя без ущерба BI проектам. А без этого мы быстро теряем "ощущение качества", и домен погружается в "костыли" и непрозрачность.
Решение? -
Analytics Engineer (термин придумал вроде dbt, еще встречается Business Data Engineer) - как я его понимаю это подтип дата инженера, работающего на бизнес-юнит на задачах от BI и дата аналитиков, задача которого создавать структурированную и качественную среду для работы с данными домена.
Он отвечает за
- подготовку данных для дашбордов, аналитических моделей. Либо выступая как сервис для BI, либо курируя то что пишут BI, беря на себя самое сложное
- работу над метадатой и качеством (метрики покрытия документацией и чекерами)
- оптимизацию пайплайнов и причесывание всей "поляны" данных домена (метрики usage и переиспользования сертифицированных таблиц)
плюс функционал со звездочкой:
*выступает продактом для данных в домене - упаковывает сертифицированные объекты в дата-продукты, обеспечивает прозрачное развитие с нотификациями и уровнем сервиса для потребителей из разных доменов.
** идеально подходит на роль domain data custodian (вспоминаем DG)
Фактически это тот же дата инженер, и можно не выделять его в отдельную роль, скажет кто-то. и будет прав.
Но отличия есть
- в скилах. требуется прогрузка в бизнес-логику
- в треке развития. вечная проблема гибридных ролей
Еще одна проблема такой роли - это найти на нее людей - приходится искать либо дата инженера, который будет готов работать так близко к бизнесу или хардового биайщика, который всегда мечтал быть инженером.
Скорее всего роль неуниверсальна и подходит для определенных сценариев сложных дата платформ. Мы набирали ее в одном желтом банке еще года 4 назад. Эксперимент был успешен.
1 такой внедренный дата инженер напрашивается на домен, где есть как минимум 3 плодовитых биащика.
На фото и по ссылке новый шаблон по этой теме с примером "разгрузки" BI роли. Может кому будет полезен.
Все ваши примеры решения похожих кейсов из практики - приму с благодарностью.
(если вы дочитали пост до конца доставьте + в комментарии🤔 )
Новый год и новый проект заставил вернуться к теме балансировки базовых дата ролей.
Вроде казалось, что все ясно, но нет. В больших дата платформах роли формируются нешаблонно.
Наблюдение этой недели:
- Дата инженер в data mesh модели всегда стремится скрыться от бизнеса в свою "базу" - в построение и поддержку инфраструктуры, разработку платформы, тюннинг архитектуры, мониторинг производительности, ETL/ELT первичных интеграций, игры с облачными сервисами, кластерами и контейнерами.
- BI аналитик в data mesh модели получает право и обязанность готовить себе данные сам - моделировать раскладку на слои и оптимизировать. Можно добиться того, что Синьорные BI в результате будут делать все от качественного кода и подготовки данных до качественного аналитического продукта и визуала.
Но на практике здесь возникает зона для потерь.
BI под прессингом бизнес задач, адхоков, коммуникаций оказывается не способен строить и поддерживать сложные инженерные процессы с их постоянным мониторингом и оптимизацией. Заниматься дотошным гавернансом, документацией и датачеками дата слоя без ущерба BI проектам. А без этого мы быстро теряем "ощущение качества", и домен погружается в "костыли" и непрозрачность.
Решение? -
Analytics Engineer (термин придумал вроде dbt, еще встречается Business Data Engineer) - как я его понимаю это подтип дата инженера, работающего на бизнес-юнит на задачах от BI и дата аналитиков, задача которого создавать структурированную и качественную среду для работы с данными домена.
Он отвечает за
- подготовку данных для дашбордов, аналитических моделей. Либо выступая как сервис для BI, либо курируя то что пишут BI, беря на себя самое сложное
- работу над метадатой и качеством (метрики покрытия документацией и чекерами)
- оптимизацию пайплайнов и причесывание всей "поляны" данных домена (метрики usage и переиспользования сертифицированных таблиц)
плюс функционал со звездочкой:
*выступает продактом для данных в домене - упаковывает сертифицированные объекты в дата-продукты, обеспечивает прозрачное развитие с нотификациями и уровнем сервиса для потребителей из разных доменов.
** идеально подходит на роль domain data custodian (вспоминаем DG)
Фактически это тот же дата инженер, и можно не выделять его в отдельную роль, скажет кто-то. и будет прав.
Но отличия есть
- в скилах. требуется прогрузка в бизнес-логику
- в треке развития. вечная проблема гибридных ролей
Еще одна проблема такой роли - это найти на нее людей - приходится искать либо дата инженера, который будет готов работать так близко к бизнесу или хардового биайщика, который всегда мечтал быть инженером.
Скорее всего роль неуниверсальна и подходит для определенных сценариев сложных дата платформ. Мы набирали ее в одном желтом банке еще года 4 назад. Эксперимент был успешен.
1 такой внедренный дата инженер напрашивается на домен, где есть как минимум 3 плодовитых биащика.
На фото и по ссылке новый шаблон по этой теме с примером "разгрузки" BI роли. Может кому будет полезен.
Все ваши примеры решения похожих кейсов из практики - приму с благодарностью.
(если вы дочитали пост до конца доставьте + в комментарии
Please open Telegram to view this post
VIEW IN TELEGRAM
Дизайн стратегии BI в Авито завел в дебри темы эффективности BI. Опять.
Об этом уже было тут и тут. И много еще где. И снова думаешь - это мы модно BI систему как продукт строим или уже метрики ради метрик? Если все это считать и мониторить, то когда отчеты делать.
Знаю за собой черту делать культ из BI со всеми моими любимыми сертификациями, фрейморками, слайгайдами.
И упускать фокус с адхочной сути аналитики как дата конвейера по обслуживанию изменчивых потребностей бизнеса.
Это особенно наглядно при попытках навязать бизнесу идею дашбордов для операционного мониторинга, которые стоят потом как статуи в пустом музее твоего честолюбия.
Короче процессы, цели и метрики не должны быть сложными). Какая то такая мысль.
Ладно, вроде убрал то, что совсем тумач, наверно можно еще подрезать.
Но все равно многовато.
Темно зеленым то, на что хочется завязываться целями.
Светло-зеленым - цели, которые можно поставить в отдельных доменах, где больнее.
Есть дополнения, народ?
(картинка в highres в комментах)
И кстати - приходите на BI роли в Авито, чтобы замерять эти метрики (не все конечно - часть) и делать биай великим снова.
Есть позиции BI разработчиков, а также BI продакта. Требования высокие. Как и уровень задач.
Будут вопросы пишите в лс
#АвитоBI
Об этом уже было тут и тут. И много еще где. И снова думаешь - это мы модно BI систему как продукт строим или уже метрики ради метрик? Если все это считать и мониторить, то когда отчеты делать.
Знаю за собой черту делать культ из BI со всеми моими любимыми сертификациями, фрейморками, слайгайдами.
И упускать фокус с адхочной сути аналитики как дата конвейера по обслуживанию изменчивых потребностей бизнеса.
Это особенно наглядно при попытках навязать бизнесу идею дашбордов для операционного мониторинга, которые стоят потом как статуи в пустом музее твоего честолюбия.
Короче процессы, цели и метрики не должны быть сложными). Какая то такая мысль.
Ладно, вроде убрал то, что совсем тумач, наверно можно еще подрезать.
Но все равно многовато.
Темно зеленым то, на что хочется завязываться целями.
Светло-зеленым - цели, которые можно поставить в отдельных доменах, где больнее.
Есть дополнения, народ?
(картинка в highres в комментах)
И кстати - приходите на BI роли в Авито, чтобы замерять эти метрики (не все конечно - часть) и делать биай великим снова.
Есть позиции BI разработчиков, а также BI продакта. Требования высокие. Как и уровень задач.
Будут вопросы пишите в лс
#АвитоBI
Не читаю каналы последнее время, что там нового в дата-ассистентах? потухли костры рябин энтузиазма первой, второй волны? Кто внедрил работающие продовые решения? Какой вы получили MAU ваших чатботов?
Больше год назад я описывал наш опыт по связыванию LLM и BI через навигационный сценарий. Тогда наш достаточно сырой MVP, не имел большого успеха. Денег, хотя скорее фокуса тогда не хватило изучать пользовательский опыт и допиливать.
И вот снова делаю мысленный разгон - см схему ☝️и картинку в норм разрешении в комментах👇:
Сколько будет жив Бизнес-пользователь - столько аналитики будут получать адхоки. Отчеты, self-service - все это прекрасно, но вот спросить человека, это ж надежнее, проще, приятнее. И вот - вы тоже пилите дата ассистента (даже если не от веры, а от скуки/интереса).
Но мы все научились пробиваться через бота в чате с банком, кажется такая же первая реакция идет на дата ассистента. Что нужно, чтобы пользователь давал боту шанс? - Правильные ответы (или их высокая доля) - скажет занудный читатель канала. и будет прав. Но и после этого шансов раскрутить бота мало.
Моя гипотеза добавить "социализации" боту. Начать с того, что включить его в чаты поддержки с кожаными коллегами. Эту комфортную среду доверия и дружеской токсичности. И для начала научить его распознавать адхок (это уже все научились в service desk командах) и рекомендовать готовые объекты - отчеты, метрики, датасеты (из слоя сертифицированных).
Для этого нужна только хорошая метадата, документация (всего то) и дальше процессить на дежурных (давайте решим, что дежурство у вас есть).
Неожиданный эффект этой схемы - мы получаем все для расчета квази time-to-insight (про который писалИван Роман Бунин) как время простоя аналитика в ожидании отчета. Кайф короче.
Только два небольших допущения
(1) все адхоки идут в чат а не личные сообщения,
(2) все полученные ответы являются инсайтами, что конечно неправда😄
В этом году скорее всего будем делать такую штуку, помимо прочего.
Кому интересно - есть вакансии.
#АвитоBI
Больше год назад я описывал наш опыт по связыванию LLM и BI через навигационный сценарий. Тогда наш достаточно сырой MVP, не имел большого успеха. Денег, хотя скорее фокуса тогда не хватило изучать пользовательский опыт и допиливать.
И вот снова делаю мысленный разгон - см схему ☝️и картинку в норм разрешении в комментах👇:
Сколько будет жив Бизнес-пользователь - столько аналитики будут получать адхоки. Отчеты, self-service - все это прекрасно, но вот спросить человека, это ж надежнее, проще, приятнее. И вот - вы тоже пилите дата ассистента (даже если не от веры, а от скуки/интереса).
Но мы все научились пробиваться через бота в чате с банком, кажется такая же первая реакция идет на дата ассистента. Что нужно, чтобы пользователь давал боту шанс? - Правильные ответы (или их высокая доля) - скажет занудный читатель канала. и будет прав. Но и после этого шансов раскрутить бота мало.
Моя гипотеза добавить "социализации" боту. Начать с того, что включить его в чаты поддержки с кожаными коллегами. Эту комфортную среду доверия и дружеской токсичности. И для начала научить его распознавать адхок (это уже все научились в service desk командах) и рекомендовать готовые объекты - отчеты, метрики, датасеты (из слоя сертифицированных).
Для этого нужна только хорошая метадата, документация (всего то) и дальше процессить на дежурных (давайте решим, что дежурство у вас есть).
Неожиданный эффект этой схемы - мы получаем все для расчета квази time-to-insight (про который писал
Только два небольших допущения
(1) все адхоки идут в чат а не личные сообщения,
(2) все полученные ответы являются инсайтами, что конечно неправда
В этом году скорее всего будем делать такую штуку, помимо прочего.
Кому интересно - есть вакансии.
#АвитоBI
Please open Telegram to view this post
VIEW IN TELEGRAM
Минус вайб (кодинг) или конец “рисованию дашбордов”
Потестил сам, посмотрел отзывы, обсудил с Виталием Тренкеншу и захотелось накинуть на вентилятор:
Что будет меняться в BI профессии?
Что будет с BI командами фабриками отчетов?
AI агенты сделают self-service бизнес команд реальностью?
До конца года генераторы дашбордов сделают вероятно все вендоры и фирмы-консалтеры.
Есть признаки, что такое качество результата - даст старт проникновению этого сценария в массы в следующем году.
Рисовальщики дашбордов уйдут, но постепенно. В среднем агент будет рисовать лучше чем средний BI.
Виталий говорит, что LLM уже лучше человека пишет требования, теперь и рисовать будет лучше.
И бизнес сможет собирать отчетность через чат-ботов.
У заказчика всегда была сложность внятно формулирвоать требования, а у BI-щика их снимать. При этом действительно если описать свою работу и задачу, дать датасет — LLM уже продумывает цели и метрики лучше человека и предлагает хорошую структуру дашборда. То есть уже делает все от сбора требований до релиза.
Насчет лучшей работы с требованиями — я не уверен, что бизнес уж захочет шарить требования в промпт. Им нужен будет «кожаный посредник».
Бизнесу не нужны отчеты/метрики, за цифры в которых не отвечает конкретный человек (Вася). LLM всегда может сказать извини, а Вася отвечает головой (выходными).
Роль таких Вась будет важной - это кураторы доменов, партнеры, как хотите.
Таким образом, человек в биай останется, но это будет уже аналитический инженер: DE + BI end-to-end.
Я думаю, команды-фабрикиотчетности тоже останутся. Только будет 2-3 человек там, где было 7+.
Будет постепенная миграция в инжиниринг и дата-гавернанс рутину — курирование дата слоя, дата чеки, метаданные.
Стабильно будут себя чувствовать аналитические-инженеры: найти источники, загрузить, проверить качество, соединить, описать, обновить, пофиксить, оптимизировать (все не без LLM). Будет медленно вымываться джун-мидл уровень.
В эту же или в отдельную роль, но просматривается работа BI/data продактов/аналитиков — то, что LLM не решит, это next step бизнес польза от BI контента - adoption, custdev, аплифт метрик.
Делать BI контент станет еще дешевле, его станет еще больше, навигации еще меньше. Размечать эталонные витрины/отчеты/метрики из общей массы станет еще важнее.
Витрина с хорошими и описанными данными - главная ценность.
Виталий набросил, что дата-каталоги, бизнес-глоссарии и слой метрик будут развивать не для людей, а для ИИ-агентов.
Смешно. Наконец-то ими начнут нормально пользоваться😄
В общую картину добавим - сценарий поддержки адхоков и дежурств.
Сколько ждать это счастье?
Порог входа по цене и зрелость результата уже приемлемы, чтобы средние+ компании могли такое решение построить, + на отладку уйдет 3-5 лет (как с любой системой).
Но скорее всего в этот блудняк пойдут только инноваторы из числа больших тех компании - где создается минимум 100+ новых дашбордов в месяц, и "давление в системе” поставки данных высокое. Вот только объем экономии/выгод не факт что среднесрочно превысит затраты на всю эту движуху.
Остальные поиграются, но адоптить решение сами не будут. Не будут ломать то, что работает, ради ИИ-авантюры.
А трансформация профессии кмк займет десятилетие.
Бизнес и человек в этом плане кажется инерционен.
Как охранник где-то все еще поднимают шлагбаумы, когда есть камеры считывающие номера, так и дашборды будут делать дедовскими методами, хардкорно (руками) еще десятки лет.
а может и нет.
Потестил сам, посмотрел отзывы, обсудил с Виталием Тренкеншу и захотелось накинуть на вентилятор:
Что будет меняться в BI профессии?
Что будет с BI командами фабриками отчетов?
AI агенты сделают self-service бизнес команд реальностью?
До конца года генераторы дашбордов сделают вероятно все вендоры и фирмы-консалтеры.
Есть признаки, что такое качество результата - даст старт проникновению этого сценария в массы в следующем году.
Рисовальщики дашбордов уйдут, но постепенно. В среднем агент будет рисовать лучше чем средний BI.
Виталий говорит, что LLM уже лучше человека пишет требования, теперь и рисовать будет лучше.
И бизнес сможет собирать отчетность через чат-ботов.
У заказчика всегда была сложность внятно формулирвоать требования, а у BI-щика их снимать. При этом действительно если описать свою работу и задачу, дать датасет — LLM уже продумывает цели и метрики лучше человека и предлагает хорошую структуру дашборда. То есть уже делает все от сбора требований до релиза.
Насчет лучшей работы с требованиями — я не уверен, что бизнес уж захочет шарить требования в промпт. Им нужен будет «кожаный посредник».
Вариант воркфлоу от Виталия:
- Бизнес менеджеры посовещались и решили: «надо бы вот так данные посмотреть»
- Кинули задачу на Васю — дата-звезду (BI/Data партнер) департамента
- Вася в чат-бот: голосом вылил поток сознания
- Агент ему всё структурировал (он знает, чем занимается команда, какие у них KPI и цели)
- Вася чуть подчистил и сказал «сделай дашборд»
- Агент полез в дата-каталог, нашел данные, создал визуализации. Если не нашел - Вася дал витрину, добавил поле.
- Вася пару часов правил через голос/чат. Подкрутил косяки. Скинул результат коллегам
Бизнесу не нужны отчеты/метрики, за цифры в которых не отвечает конкретный человек (Вася). LLM всегда может сказать извини, а Вася отвечает головой (выходными).
Роль таких Вась будет важной - это кураторы доменов, партнеры, как хотите.
Таким образом, человек в биай останется, но это будет уже аналитический инженер: DE + BI end-to-end.
Я думаю, команды-фабрикиотчетности тоже останутся. Только будет 2-3 человек там, где было 7+.
Будет постепенная миграция в инжиниринг и дата-гавернанс рутину — курирование дата слоя, дата чеки, метаданные.
Стабильно будут себя чувствовать аналитические-инженеры: найти источники, загрузить, проверить качество, соединить, описать, обновить, пофиксить, оптимизировать (все не без LLM). Будет медленно вымываться джун-мидл уровень.
В эту же или в отдельную роль, но просматривается работа BI/data продактов/аналитиков — то, что LLM не решит, это next step бизнес польза от BI контента - adoption, custdev, аплифт метрик.
Делать BI контент станет еще дешевле, его станет еще больше, навигации еще меньше. Размечать эталонные витрины/отчеты/метрики из общей массы станет еще важнее.
Витрина с хорошими и описанными данными - главная ценность.
Виталий набросил, что дата-каталоги, бизнес-глоссарии и слой метрик будут развивать не для людей, а для ИИ-агентов.
Смешно. Наконец-то ими начнут нормально пользоваться
В общую картину добавим - сценарий поддержки адхоков и дежурств.
Сколько ждать это счастье?
Порог входа по цене и зрелость результата уже приемлемы, чтобы средние+ компании могли такое решение построить, + на отладку уйдет 3-5 лет (как с любой системой).
Но скорее всего в этот блудняк пойдут только инноваторы из числа больших тех компании - где создается минимум 100+ новых дашбордов в месяц, и "давление в системе” поставки данных высокое. Вот только объем экономии/выгод не факт что среднесрочно превысит затраты на всю эту движуху.
Остальные поиграются, но адоптить решение сами не будут. Не будут ломать то, что работает, ради ИИ-авантюры.
А трансформация профессии кмк займет десятилетие.
Бизнес и человек в этом плане кажется инерционен.
Как охранник где-то все еще поднимают шлагбаумы, когда есть камеры считывающие номера, так и дашборды будут делать дедовскими методами, хардкорно (руками) еще десятки лет.
а может и нет.
Please open Telegram to view this post
VIEW IN TELEGRAM
Этот пост про набор на ежегодный курс про BI стратегию в июне-июле.
Каждый новый год в профессии - он как хайкинг в горах
🍷 Сначала ты свеж - вдохновляешься конференциями, трендами, релизами. заряжаешь себя и людей целями
😬 Потом сталкиваешься с проблемами своей готовности:
ошибаешься, переосмысляешь, преодолеваешь
Теряешь часть попутчиков. Меняешь маршрут.
🍷 В итоге все таки достигаешь реалистичной цели, часто не той что была на картинке.
Сидишь уставший и смотришь вниз и вдаль.
Думаешь про новые горы (или о спа-центре - кто постарше)
Тут надо вырулить метафору на тему курса о стратегии в BI.
Одни готовы хотят лезть на высокую гору nextGen BI, тестировать AI генерацию инсайтов и проч кайфовые штуки которые подарил дивный новый мир, где никто еще не проложил троп.
Другие на опыте соизмеряют силы и риски - взбираются на горы пониже. Я тут про выстраивание качественного слоя витрин, отчетов и метрик - чтобы тратить меньше сил для получения большего эффекта - через оттачивание (пока) традиционных для BI процессов.
Чаще BI менеджер лезет на все горы сразу, борясь с тревогой от упущения времени с ИИ, хаосом данных, земными потребностями пользователя, и размытием границ ролей и тулов.
Ведь уже почти нет как такового BI - есть сквозной гавернанс данных и аналитики через зоопарк систем и метрик. Об этом и есть курс.
По правде сказать за годы этот курс превратился в гайд из 100500 тем, полезных практик и шаблонов.
Каждый мог найти что то для себя. Но каждый раз я пытаюсь запускать все больше обсуждений, когда участники скидывают свои кейсы под темы занятий и мы вместе их крутим.
Получается и терапия BI неврозов и концентрированный обмен опытом.
Не буду перечислять программу, тем более что она еще изменится походу.
Пишите в личку вопросы - я расскажу.
Или оставляйте заявки тут
Дата старта: 18 июня и далее 11 занятий по средам, пятницам и понедельникам
Формат: вечерние посиделки по 2-2,5 часа в онлайне, домашки и оффлайн сбор в баре в Москве в конце
Аудитория: обычно BI хеды, лиды, CDO, COO и дата менеджеры
Каждый новый год в профессии - он как хайкинг в горах
ошибаешься, переосмысляешь, преодолеваешь
Теряешь часть попутчиков. Меняешь маршрут.
Сидишь уставший и смотришь вниз и вдаль.
Думаешь про новые горы (или о спа-центре - кто постарше)
Тут надо вырулить метафору на тему курса о стратегии в BI.
Одни готовы хотят лезть на высокую гору nextGen BI, тестировать AI генерацию инсайтов и проч кайфовые штуки которые подарил дивный новый мир, где никто еще не проложил троп.
Другие на опыте соизмеряют силы и риски - взбираются на горы пониже. Я тут про выстраивание качественного слоя витрин, отчетов и метрик - чтобы тратить меньше сил для получения большего эффекта - через оттачивание (пока) традиционных для BI процессов.
Чаще BI менеджер лезет на все горы сразу, борясь с тревогой от упущения времени с ИИ, хаосом данных, земными потребностями пользователя, и размытием границ ролей и тулов.
Ведь уже почти нет как такового BI - есть сквозной гавернанс данных и аналитики через зоопарк систем и метрик. Об этом и есть курс.
По правде сказать за годы этот курс превратился в гайд из 100500 тем, полезных практик и шаблонов.
Каждый мог найти что то для себя. Но каждый раз я пытаюсь запускать все больше обсуждений, когда участники скидывают свои кейсы под темы занятий и мы вместе их крутим.
Получается и терапия BI неврозов и концентрированный обмен опытом.
Не буду перечислять программу, тем более что она еще изменится походу.
Пишите в личку вопросы - я расскажу.
Или оставляйте заявки тут
Дата старта: 18 июня и далее 11 занятий по средам, пятницам и понедельникам
Формат: вечерние посиделки по 2-2,5 часа в онлайне, домашки и оффлайн сбор в баре в Москве в конце
Аудитория: обычно BI хеды, лиды, CDO, COO и дата менеджеры
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Пошарю две ссылки с вами - занудную и фановую.
Начнем с первой:
1️⃣ Центральный банк РФ месяц назад выпустил методологию "Управление данными на финансовом рынке" - может все в курсе, я только увидел - спасибо @aivan_vok.
См 4 файла внизу страницы.
Это замах на стандарт и модель оценки зрелости управления данными. До этого все были зарубежные. Тут конечно компиляция мировых моделей, но достаточно хорошо переработанная. Короче возможно это событие. Тема data governance еще бустанет - все знают как тяжело получить такой бюджет. Теперь все банки и страховые получают если не пинок, то хороший аргумент.
Немного деталей:
Начнем с нейминга. Ну это извините пиздец, а не нейминг:
Посмотрел, нашел прям признаки проработки и осмысления темы:
Есть прям отсылки к чему то глубокому:
Короче видно что писали не дураки и не на отъебись.
Ну и самое интересное, как это будет метчиться с регулированием. Я так понял это пока как бонус:
Но видимо далее подъедут сертификации и компании, которые будут помогать ее проходить🤑
(я, если что, не готов сейчас)).
Еще бы ставку снизили, вообще огонь.
2️⃣ Симулятор Who’s the best CDO? https://www.whoisthebestcdo.com (на фото).
Фановая штука но с глубоким смыслом. Растишь репутацию, тратишь бюджет, решаешь проблемы и пытаешься принести пользу выраженную в выручке. Я поймал рабочие флешбеки.
Если добавить групповой формат игры, домены и штук 1000 разных событий, то можно неплохо провести время.
Источник Сайт Юры Гаврилова
Начнем с первой:
См 4 файла внизу страницы.
Это замах на стандарт и модель оценки зрелости управления данными. До этого все были зарубежные. Тут конечно компиляция мировых моделей, но достаточно хорошо переработанная. Короче возможно это событие. Тема data governance еще бустанет - все знают как тяжело получить такой бюджет. Теперь все банки и страховые получают если не пинок, то хороший аргумент.
Немного деталей:
Начнем с нейминга. Ну это извините пиздец, а не нейминг:
СУД УФР - Система управления данными участника финансового рынка.
Посмотрел, нашел прям признаки проработки и осмысления темы:
... Учреждение коллегиального органа по управлению данными (если требуется)
... Цифровые миражи – последствия от низкого качества данных
Есть прям отсылки к чему то глубокому:
... USER JOURNEY MAP в управлении данными
... Концептуальный дизайн на основе карточки процесса
Короче видно что писали не дураки и не на отъебись.
Ну и самое интересное, как это будет метчиться с регулированием. Я так понял это пока как бонус:
Задачами Банка России для реализации процедуры оценки зрелости
СУД УФР являются:
1. Создание методики оценки зрелости СУД УФР.
2. Проведение процедуры оценки зрелости СУД УФР.
3. Обработка и анализ результатов оценки зрелости СУД УФР.
Результаты оценки зрелости СУД УФР отправляются через личный кабинет Единой платформы внешнего взаимодействия Банка России или по электронной почте
Но видимо далее подъедут сертификации и компании, которые будут помогать ее проходить
(я, если что, не готов сейчас)).
Еще бы ставку снизили, вообще огонь.
Фановая штука но с глубоким смыслом. Растишь репутацию, тратишь бюджет, решаешь проблемы и пытаешься принести пользу выраженную в выручке. Я поймал рабочие флешбеки.
Если добавить групповой формат игры, домены и штук 1000 разных событий, то можно неплохо провести время.
Источник Сайт Юры Гаврилова
Please open Telegram to view this post
VIEW IN TELEGRAM
Про BI Health Score
Мы в командах всегда много экспериментировали с этим подходом. Сейчас в Авито заходим на новый круг.
Проблема стара как сам BI: массово делаем отчёты → страдает гигиена → страдает навигация → теряем трафик.
Кто-то пытается зарегулировать процесс (тесты, преревью), кто-то отпускает — и плодит хаос.
В децентрализованной системе от 100+ аналитиков - обязаловка не работает. Что работает:
– сертифицировать часть контента (важно, но об этом отдельно)
– качать культуру разработки и вайб качества
– фокусировать внимание через личные цели и окры.
Важно искать баланс:
- держать здоровье значимых объектов на уровне,
- для остального давать тулы для самоконтроля.
BI Health Score Reporting - это инструмент поддержки для всех этих мер. К нему прилагается процесс (например периодические BI Субботники, но это тоже тянет на отдельный пост).
Цель такого отчета проскорить все объекты по факторам и подсветить автору и лиду зоны для фиксов. При этом на заставлять “кипятить океан” и чинить неважные баги в неважных отчётах, датасетах.
Как мы посчитали первую версию Health Score:
Объекту (дашборду, датасету) начисляются «штрафные» баллы (чем больше тем "хуже здоровье") за:
– скорость, медленные запросы и ошибки
– отсутствие владельца
– неиспользуемость
– заброшенность - срок с последнего обновления
– дубли и высокое подобие, временные схемы и т.п.
Далее добавляем мультипликаторы. Усугубляем если:
- владелец BI
- высокий WAU
- используется руководством
Считаем скоры по объекту и агрегируем по доменам и авторам: Health Score = (сумма баллов × мультипликаторы) / максимум
Когда накопим опыт и устаканим логику — ребята опишут подробнее статьей на Хабр. Подсвечу тогда тему ещё раз.
Если у вас был близкий опыт — велком в комменты.
🗂 Кстати - кто хочет следить за BI в Авито - вот папка с авторскими и общими tg каналами
#АвитоBI
Мы в командах всегда много экспериментировали с этим подходом. Сейчас в Авито заходим на новый круг.
Проблема стара как сам BI: массово делаем отчёты → страдает гигиена → страдает навигация → теряем трафик.
Кто-то пытается зарегулировать процесс (тесты, преревью), кто-то отпускает — и плодит хаос.
В децентрализованной системе от 100+ аналитиков - обязаловка не работает. Что работает:
– сертифицировать часть контента (важно, но об этом отдельно)
– качать культуру разработки и вайб качества
– фокусировать внимание через личные цели и окры.
Важно искать баланс:
- держать здоровье значимых объектов на уровне,
- для остального давать тулы для самоконтроля.
BI Health Score Reporting - это инструмент поддержки для всех этих мер. К нему прилагается процесс (например периодические BI Субботники, но это тоже тянет на отдельный пост).
Цель такого отчета проскорить все объекты по факторам и подсветить автору и лиду зоны для фиксов. При этом на заставлять “кипятить океан” и чинить неважные баги в неважных отчётах, датасетах.
Как мы посчитали первую версию Health Score:
Объекту (дашборду, датасету) начисляются «штрафные» баллы (чем больше тем "хуже здоровье") за:
– скорость, медленные запросы и ошибки
– отсутствие владельца
– неиспользуемость
– заброшенность - срок с последнего обновления
– дубли и высокое подобие, временные схемы и т.п.
Далее добавляем мультипликаторы. Усугубляем если:
- владелец BI
- высокий WAU
- используется руководством
Считаем скоры по объекту и агрегируем по доменам и авторам: Health Score = (сумма баллов × мультипликаторы) / максимум
Когда накопим опыт и устаканим логику — ребята опишут подробнее статьей на Хабр. Подсвечу тогда тему ещё раз.
Если у вас был близкий опыт — велком в комменты.
🗂 Кстати - кто хочет следить за BI в Авито - вот папка с авторскими и общими tg каналами
#АвитоBI