Data Nature 🕊
5.92K subscribers
382 photos
6 videos
3 files
196 links
Канал о жизни BI аналитики и инфо-дизайна в корп реалиях с фокусом на работающих практиках управления.
Веду как летопись полезного для себя и людей с такими же неврозами.

александр бараков @alexbarakov
datanature.ru
data-nature.com

(рекламу не размещаю)
Download Telegram
В поисках понимания что же самом деле insight management в компании - общался на неделе с kausa.ai - ребята делают инструмент диагностической аналитики (как они себя определяют).
Тул немного сырой и пока негибкий, но есть в нем новая идея пользовательского BI опыта:
- фокус на анализе как на сущности, которую настраиваешь и запускаешь по кнопке. + две сущности метрика и датасет
- нет ML блекбокса (🤔необычно). В основе простая математика про расчет вклада в отклонение метрики между всеми факторами, обсчитанных на всех уровнях датасета. Все просто и отвечает на вопросы почему изменилась метрика и что влияло сильнее
- из коробки идут конструируемые сообщения в teams/slack (инсайты 🤌?). можно задать количество выводимых в алерт контрибьюторов и глубину поиска вниз по факторам, запуски пушей ставятся на расписание

Слабые/странные стороны продукта:
- визуал пока сведен к минимуму - тупо таблица влияния факторов. Дашбордов тут не ждешь, но как то скудно
- не хватило самари значимых файндингов, тем более что все комбинации обсчитаны и можно бы это емко представить. Чтоб не только аналитику в этом копаться.
- клауд бейзд, но - данные загружаются, обсчитываются и.. после удаляются. Типа не хранятся
- анализ можно уточнять фильтрами для разных аудиторий, но для каждой комбинации прав необходимо по сути создавать свой анализ и ранить отдельно
- оплата идёт за запуски, вернее за затраченные мощности. Пользователи не лимитируются.

Забавно что ребята предлагают пилот на 2 мес, где мы настроим себе несколько моделей, а они обсчитают для нас ценник замерив ресурсы. Продукт можно назвать дешевым, они только начинают выходить на крупных клиентов и вписывается в блудняки охотно, ищут себя.

Продукт достаточно легко повторить. Мы размышляем о таком туле только с более широким функционалом.
Отдельный такой диагностический анализ можно создать в любой средней+ биай системе. Но тут быстро, чистенько и с настраиваемыми алертами в корп мессенджеры. И нет соблазна залепить +1 дашборд. Уже немало.
У кого есть аналоги на примете ?
This media is not supported in your browser
VIEW IN TELEGRAM
Очень залипательная 2D визуализация кубика-рубика.. цвета не оригинальные, но все равно хорошо. Мозг активно требует замедления скорости )

Источник twitter
Если вы когда-либо подключались к PostgreSQL, которая крутится под вашим Tableau Server, то вы наверняка знаете, сколько любопытной информации там есть. Встроенные в сервер страшненькие и простенькие отчеты про трафик и джобы - это лишь часть картины 🎨
Причём, это далеко не самая привлекательная ее часть.

Если как следует покопаться в этих данных, можно получить куда более полную информацию о просмотрах и других действиях пользователей, узнать больше об обновлениях экстрактов и проблемах с ними - в общем, не быть сапожником без сапог: разве мы не заслуживаем лучшего, чем admin views 👀?

Давайте начнем с довольно простой (на первый взгляд) задачи - как поймать и разогнать очереди из экстрактов на сервере? Если у вас есть нерешенные вопросы по поводу добычи серверной статистики - жду комментов, возможно, идея или даже решение уже есть 🙌🏻

👉 https://datanature.ru/server-statistics-1

#tableautips
Winners of the Business Analytics category in the 2022 Information is Beautiful Awards. Выглядит странно..

Премия одна из немногих в отрасли и не хочется ее хейтить. Но победители в номинации Business Analytics - сплошные вопросы.

Победитель The star of our work - отчет о работе команды в виде постера с аллегорией на звездное небо. Арт составляющую не трогаем, но символы выбранные для визуализации проектов - это тренажер для оперативной памяти. Чтение похоже на расшифровку древнего языка - никак не удается удержать символьную легенду в сознании. немного странно если мы говорим про бизнес-аналитику.

При этом третье место - более менее классический dashboard от крутого таблиста Pradeep Kumar. Не самая при этом его мощная работа. если придираться сам дашборд содержит мало контекста для бизнес-аналитического инструмента. Такие обычно первыми архивируется так как их не используют. Но это хотя бы бизнес аналитика..

По тегу RWFD на tableau public есть кстати немало хорошего бизнес дашбординга https://public.tableau.com/app/search/vizzes/RWFD

Понятно, что есть известная проблема этой номинации - корпоративный дашбординг очень сложно вытащить на всеобщее обозрение. И тем не менее. Ощущение что под Business Analytics ребята понимают что-то иное.

informationisbeautifulawards
Провели последние пару недель в профессиональном споре о нюансах CTB / RTB* подхода в проектах централизованной BI команды. У кого есть те же мысли - велком в комменты, нужны внешние мнения)

Суть проблемы: производство отчетов постепенно забивает капасити BI разработчиков поддержкой этих решений. И это даже при регулярной архивации устаревших отчетов и росте команды. В результате у BI отдела не хватает ресурса экстренно и без ущерба стартованным проектам брать работу запросы от топ-менеджмента, особенно если они идут пачкой (после крупного менеджерского шабаша). Теряется оперативность аналитики как сервиса. А уход отдельного BI аналитика со сложными контекстами дополнительно повышает "давление в системе".

У проблемы разные пути решений:
- Выставлять заслоны на пути новых запросов. Создавать жесткие критерии приема задач и скоринга их приоритетности. Снизить условно скорость работы фабрики отчетов. Помогает получить на вход более "осознанные" задачи в части требований и ожиданий и не делать проекты низкой ценности и охвата. Делается ресурсный буфер. Но далее у такого пушбека будет предел если вы сервисная команда
- Повышать кросс-доменность в команде. Помогает гибче передавать проекты, бекапить уходы, легче находить ресурс на срочные таски
- Развивать self-service в бизнесе. Какие то проекты получится передать после разработки или с самого начала. Но на приемлемый уровень выходят только малая часть бизнес-подразделений, да и сложные кросс-доменные отчеты передавать некому.
- делить команду на специализированные RTB/CTB BI группы. Тут самое интересное. Подход помимо прочего приводит к необходимости дублировать коммуникации с крупными заказчиками по проектам разных типов..

У кого иной опыт в этой теме?

*RTB (run the business) BI проект - классический кейс автоматизации анализа по требованиям
CTB (change the business) BI проект - является частью транформационных инициатив компании: меняют несколько процессов; идет от топ менеджмента; компонент исследовательского анализа превосходит собственно цель автоматизации
Tableau csv + Graph = Восторг

В нашей команде в Luxoft мы часто создаем сложные tableau отчеты и развиваем их годами, передавая от аналитика к аналитику. Чтобы трансферить знания быстро и структурно мы даже начали рисовать майдмепы в Miro (см фото) для особо сложных отчетов, визуализируя ключевые связи, калькуляции, параметры и прочую подкопотную живность табло воркбука. Штука полезная но уж больно одноразовая и запарная.
Но вот статья LaDataViz о создании графов в табло - навела на страшную мысль запилить графы из матадататы табло воркбука. Ведь наши майдмепы сильно похожи на графы. А вытащить из CSV файла объекты и связи - задача рабочая.

В итоге, мы получили чудо из чудес. Красота возможно даже превосходит полезность. Велик соблазн взять любимые отчеты да распечатать в постеры на стену)
https://screenrec.com/share/rCjLtJnZ8b
Не все еще удалось размапить из типологии (сеты, user filters… ) и визуал можно докрутить, но штука определенно упрощает знакомство с отчетом или процесс вспоминания его архитектуры после паузы. Также помогает аудировать и чистить книгу анализируя связи в каскаде калькуляций. Нельзя назвать это полной заменой майдмепу - нет контекстных комментариев к связям, но зато ноль трудозатрат при постановке тула на обновление по всем отчетам.
Позже напишем статью с деталями реализации

The Oscar goes to @mynameisircou - Ира реализовала всю сложную часть проекта 🎉
В прямом смысле взрыв мозга - эта Визуализация функций мозга 🤯

Прямо постмодернистская деконструкция всего, что образует собой современный взгляд на дизайн текста и информации. Рассматриваю и не могу перестать смеяться - ну чистый кайф. Больше всего разрывают овалы под текстом и сетка на заднем плане 😂
Вникнуть в суть представленной информации можно не пытаться, хотя она судя по всему соответствует реальности

картинка в высоком разрешении
источник
BI Project Innovation Map
Нашлось время в отпуске осмыслить подход, который родился и эволюционировал на наших воркшопах по развитию BI проекта. Этот борд в Miro - сборная версия того, как я вижу BI стратегически и как мы с командой обсуждаем куда приложить усилия в следующие полгода-год, какие инициативы стартовать.

Сразу скажу, что не все стикеры на борде "раскопаны" и покрыты у нас, в некоторых областях мы только в начале пути, а где-то только присматриваемся к теме.

Вещь прикладная, и вроде бы универсальная.
Будут дополнения/замечания - оставляйте комментами на борде - буду рад обогатиться вашим опытом

Кому удобнее картинкой
How Well Does ChatGPT Know Tableau?

Если коротко - BI разработчики спят спокойно дальше, а вот роль Егора aka @trumassive в Чате Tableau под большим вопросом 😥
🤖 Нельзя просто взять и перестать постить скриншоты Chat GPT. Попросил его играть две роли BI Strategy Consultant и Tableau developer and designer. Наиболее интересные вопросы-ответы начал отправлять коллегам. В итоге сохранил их на MIRO-доску чтобы меньше спамить). Не мог не закинуть и сюда 😎

Итоги общения коротко (опущу восторги, они по умолчанию):
🔹 Сценарий предложить метрики по коротко заданным требованиям и далее для этих метрик предложить структуру дашбордов - работает 🤯. Этот результат очень близок к тому, что в итоге было сделано. Точно мог бы помочь джуну и сэкономить какое то время у синьора на менторстве
🔹 Порадовали ответы про управление BI беклогом и критерии приоритизации задач. Есть неповерхностные идеи
🔹Бодро так ответил на вопрос 'Почему никто не использует Ask Data в Tableau'. Не придраться
🔹 На вопрос про BI следующего поколения - говорит что Conversational BI будет рулить. Пресейлит сам себя на будущее)
🔹Задавал вопросы про типологизацию дашбордов, развитие Insignt Management, повышение BI Adoption, выбора между Scrum и Kanban в BI проектах, про SSBI и Data Quality, про FineBI. Ответы по делу, хотя и весьма базовые и энциклопедичные

Генерить код не просил, уже все проверили - умеет)
У кого нет (из РФ) доступа на openai.com - пишите предложения по интересным вопросам, покачаем еще тему. Самое интересное - проверять способность давать не справочную инфу, а релевантные рекомендации на конкретный бизнес кейс
🔥 Как Microsoft планирует внедрить ChatGPT в MS Teams и PowerBI?

После объявления о планах по интеграции ChatGPT в поисковик Bing Microsoft подтвердила, что также планируется интеграция с приложениями Office. Я запросил у ChatGPT более подробную информацию, начав с вопроса: «Microsoft plans to incorporate ChatGPT into MS Teams and Power BI. Can you give some bullet points of what the user experience can be?». Вот некоторые тезисы из разговора:

🔷 Пользователи смогут взаимодействовать с ChatGPT через MS Power BI и MS Teams в conversational режиме, используя ввод на естественном языке. ChatGPT сможет помочь с такими задачами, как создание отчетов, ответы на вопросы и предоставление информации о данных.
ChatGPT сможет пройти обучение по конкретным предметным областям, чтобы помочь в решении отраслевых задач.

🔷 Для подключения ChatGPT к соответствующим источникам данных и возможности анализа данных потребуется дополнительная интеграция. Это может включать следующие шаги:
▪️Подключение ChatGPT к источникам данных, таким как хранилище данных. Это можно сделать с помощью API или других инструментов интеграции данных.
▪️Обучение ChatGPT конкретным наборам данных и задачам анализа, которые компания хочет выполнять. Это может включать в себя предоставление ChatGPT примеров типов анализа, которые необходимо выполнить.
...

🔷 Обучение ChatGPT на конкретных наборах данных и задачах анализа можно организовать по следующим шагам:
▪️Определение конкретных наборов данных и задач анализа, которые компания хочет, чтобы ChatGPT выполнял.
▪️Подготовка наборов данных для обучения. Это может включать очистку и предварительную обработку данных, а также обеспечение того, чтобы они были в формате, понятном ChatGPT.
▪️Создание обучающего набора данных, который должен включать в себя примеры типов задач
... и т.д
Полная версия

В целом идея понятна, но остаются сомнения в качестве результата, учитывая что корп данные более сложный домен чем википедия и тонны книжных корпусов. Тем не менее проект в песочнице - звучит как план на 2023 🤔