Data Driven культура от AW BI
1.08K subscribers
69 photos
5 videos
97 links
Вы на канале про Data Driven культуру, который бережно и старательно ведёт команда российского BI продукта Analytic Workspace — AW BI. Но здесь не про нас, а про ваc.

Про нас здесь: analyticworkspace.ru
https://tttttt.me/awcommunity
Сотрудничество: @GrekovM
Download Telegram
Как наконец-то настроить себе пузырьковую диаграмму?

🫧Пузырьковая диаграмма включает 2 оси значений и точки, которые ставятся в месте пересечения значений от 2 осей. Этот тип диаграммы часто вызывает интерес аналитиков — все хотят её построить, однако при работе с ней легко запутаться.

Разберёмся на примерах 3 кейсов использования.

1️⃣Простое выведение 2 показателей на оси.
Этот вариант принято использовать для демонстрации корреляции между двумя величинами. Такие матрицы могут иллюстрировать высчитанные математически коэффициенты корреляции 2 показателей. Другими словами, наша цель — оценить «облако точек». Чем больше «облако точек» похоже на линию, тем значимее связь показателей (картинка 1). Такая диаграмма ещё называется точечной. 

2️⃣Случай, когда необходимо посмотреть разницу между крупными группами. Для этого мы агрегируем значения, соответственно, точек у нас будет значительно меньше — по количеству групп (а не по количеству строк, как в первом случае). Наша цель — оценить относительное расположение точек. По картинке 2 можно сказать, что сертификаты и напитки приносят в среднем одинаковый доход, так как напитки хоть и дешевле, но обычно продаются группой.

❗️Здесь нужно быть внимательным: иногда отдельные точки-группы могут перерасти в «облако точек».
Рассмотрим пример с картинки 3: мы видим показатели цены пиццы и количества продаж по разным позициям в меню. Глядя на эту картинку, нам трудно произвести сравнение, из-за того, что точки расположены очень близко друг другу, а для подписей уже нет места. Вместо сравнения конкретных элементов, как на картинке 2, мы получили зелёное «облако точек» там, где не планировали.

3️⃣Мы рассмотрели примеры, где точки были одинаковы между собой. Теперь рассмотрим возможности добавлять различия между точками и расставлять акценты. В общем, то, чем и привлекательна пузырьковая диаграмма.
📎Эта диаграмма позволяет нам точками создавать различия в размере — добавлять своего рода «третье измерение». Для достижения этого эффекта обычно следует добавить третий агрегат (картинка 4).
📎Помимо всего прочего, этот тип диаграммы даёт возможность добавлять внутренние группировки или серии. Данные различных серий подчёркиваются разными цветами или формой точки. Например, глядя на картинку 5, мы можем сравнить продажи за разные месяцы.
📎Ещё пузырьковая диаграмма позволяет использовать все те методы, которые есть в обычной диаграмме — например, форматирование по условию или выведение на ось значений строковых данных, наподобие обычной диаграммы с группировкой (картинка 6).

Вместо итога.🙌🏻
Что только не даёт пузырьковая диаграмма аналитику, взявшемуся за работу с ней: формировать «облако точек», подсвечивать показатели размером точки, добавлять дополнительную внутреннюю разбивку на серии, настраивать форму точки. При этом всё это и является основной сложностью в работе:) За многообразием методов можно потеряться в данных и не справиться с задачей.

Таким образом, чтобы сделать классный график этого типа, вам нужно:
1️⃣Выбрать один или два конкретных метода, которыми вы захотите обозначить различия. Например, только точки, или только цвет. Экспериментировать можно — и обязательно нужно! С осторожностью.
2️⃣Следить, когда вы хотите добавить «облако точек», а когда именно сравнить конкретные точки. Первый метод подходит для оценки неагрегированных данных, второй — для оценки конкретных групп.

*Картинки прикрепляем ниже, следующим постом.
Please open Telegram to view this post
VIEW IN TELEGRAM
Древнеегипетский Excel: как считали маржу фараоны🧐

Какие образы у вас возникают в голове, когда говорят о письменности в Древнем Египте?

Наверняка иероглифы: стены, исписанные художественными изображениями, которые описывают жизнь фараонов, божественные деяния Ра, или восхваляют плодородность реки Нил.

☝🏻Но мало кто знает, что бухгалтерский учёт начал своё развитие ещё в древнеегипетском государстве.

📎На данный момент мы точно можем сказать, что как таковой учёт появился ещё в Месопотамии (около 5500 лет назад). На глиняных табличках записывали сведения о продаже зерна, скота и тканей: количество проданных товаров, их цены и даты сделок. 

📎А в Египте пошли ещё дальше и централизовали этот процесс: существовали отдельные государственные учреждения, с десятками бухгалтеров в штате.
Они записывали данные, но не иероглифами. В Древнем Египте существовал и второй вид письменности: иератическое письмо, гораздо более похожее на современную письменность.

📎На папирусах (ещё одна инновация, по сравнению с глиняными табличками Месопотамии) оформлялись крупные торговые сделки, которые записывались в особом присутственном месте, при свидетелях, имена которых записывались в документах. Правда, на папирусах чаще всего упоминается недостача, особенно зерна.

📎Примерно в это же время в Египте начинают зарождаться первые аналоги валюты: дебены или утены. Во времена XIX династии рабыня, оценённая в 4 дебена и 1 серебряный кидет, была куплена за аналогичные по ценности товары: 6 бронзовых сосудов, 10 медных дебенов, 15 льняных одеяний, покрывало, одеяло и горшок мёда.

🧮Налоги в древности тоже были, например, налог на урожай, взимавшийся пшеницей и ячменём, равнялся 5-ю мешкам с одной аруры (2/3 акра) обычной пахотной земли больших хозяйств, что составляло примерно половину урожая, собранного с такой почвы. Что интересно, ежегодно проводились даже «аудиты», которые проверяли площади пахотных земель, и в случае, если они, например, были повреждены стихией или другими событиями непреодолимой силы, налог могли снизить.

Ещё письмом, например, написан Московский математический папирус, датируемый ~1850 годом до н.э., на котором записаны 25 математических и геометрических задач.

📌Из интересного: уже тогда египтяне рассчитывали площади кривой поверхности, в вычислениях необходимо использовать число π и египтяне определяли его, как 3,16, благодаря чему можно с уверенностью сказать, что инженеры того времени могли с большой точностью вычислять площади различных геометрических фигур, тех же самых  пирамид.

*Основной источник: Кембриджская история древнего мира.
👆🏻Папирус Эдвина Смита, описывающий на иератическом письме 48 травматических случаев, каждый с описанием физического обследования, лечения и прогноза. ~ 1500 год до н.э., однако есть данные, что этот папирус является копией более древнего документа, написанного примерно за 500 лет до этого.
This media is not supported in your browser
VIEW IN TELEGRAM
Космический #DATAVIZ ☄️

Потрясающая интерактивная визуализация данных от NASA, которая позволяет наблюдать за астероидами в реальном времени.

📌Дисклеймер: будьте осторожны, можно залипнуть, надолго.
Please open Telegram to view this post
VIEW IN TELEGRAM
📈Скрайбинг: польза и применение

Пещерная живопись была первоначальной формой скрайбинга: наши предки использовали рисунки, чтобы передать нам, современным людям, важную информацию.

🔹Что такое скрайбинг?
Это это процесс визуализации сложного смысла простыми образами, при котором отрисовка образов происходит в процессе донесения информации.

🔹Как он может быть полезен?
Преимущество скрайбинга – возможность просто и эффективно привлечь, захватить и удержать внимание людей. Данный способ подачи информации будет полезен во всех областях бизнеса, а также в образовании и просветительской деятельности.

⚡️Примеры использования скрайбинга в различных компаниях:
- Как скрайбинг помог интернет-магазину «Комус» налаживать связи на мероприятии;
- Корпоративный отчёт компании «Мегафон ритейл» в форме скрайб-видеоролика;
- Скрайбинг-сопровождение открытых лекций от Центрального Банка России.
Ещё больше примеров по ссылке.

#знание
Что такое ETL, ELT и в чём их отличия?

📎ETL (Extract, Transform, Load) — это процесс извлечения данных из различных источников, их трансформации (очистки, обогащения, агрегации и т.д.), а затем загрузки в целевую систему, обычно хранилище данных. ETL является традиционным методом интеграции данных.

📎ELT (Extract, Load, Transform) — это метод, при котором данные сначала извлекаются и загружаются в целевую систему, а затем трансформируются. ELT стал популярным с развитием мощных облачных хранилищ данных, таких как Google BigQuery и Amazon Redshift.

Основные отличия между процессами:
1️⃣Порядок шагов: в ETL данные трансформируются перед загрузкой, а в ELT — после загрузки.
2️⃣Место трансформации: в ETL трансформация происходит в промежуточном сервере, а в ELT — в целевой системе.
3️⃣Использование ресурсов: ETL требует значительных вычислительных ресурсов на промежуточном сервере, тогда как ELT использует мощность целевой системы для трансформаций.

☝🏻Кроме этих методов, существуют и другие:
▫️CDC (Change Data Capture) — технология, позволяющая отслеживать и захватывать изменения в данных в реальном времени. Используется для синхронизации данных между системами.
▫️Data Virtualization — метод, позволяющий получать доступ к данным из различных источников без их физического перемещения. Предоставляет единый интерфейс для работы с данными в реальном времени.
▫️Data Replication — процесс копирования данных из одной базы данных в другую для обеспечения высокой доступности и отказоустойчивости.
▫️Data Streaming — обработка и интеграция данных в реальном времени с использованием технологий потоковой передачи, таких как Apache Kafka и Amazon Kinesis.

#новичкам #знание
Please open Telegram to view this post
VIEW IN TELEGRAM
У нас классная новость!🔥

Мы — команда Analytic Workspace запустили BI-марафон по прокачке навыков в обработке и визуализации данных.

🔜Уже на следующей неделе, 18 июня, стартует BI-марафон «Сквозь данные к смыслам»4-дневный интенсив-практикум по прокачке BI-навыков с ТОПовыми экспертами.

☝🏻Программа марафона создана для аналитиков данных, бизнес-аналитиков, продакт-менеджеров, руководителей проектов, начинающих и не только.

Почему стоит поучаствовать:
⚡️будут обучать эксперты-практики
⚡️в финале марафона конкурс — можно выиграть деньги, получите сертификат и +1 проект в портфолио
⚡️есть hr-партнёры, от которых можно получить приглашение на собеседование
⚡️дата-партнёр марафона – VK Cloud
⚡️участие бесплатное

Практические занятия будут проходить внутри BI-системы Analytic Workspace. Напомним, что у нас есть неограниченная по времени Free-версия, поэтому после марафона можно сколько угодно тестить систему, практиковаться и просто создавать классные дашики.📊

🤩В общем, будет круто! Приглашаем вас к участию, присоединяйтесь и зовите коллег — они скажут вам спасибо!

🔗Ссылка на регистрацию
Please open Telegram to view this post
VIEW IN TELEGRAM