Data Bar | О data-проектах
1.92K subscribers
126 photos
1 file
100 links
Авторский канал о данных, аналитике, визуализации и датапроектах, которые создаю сам или в коллабе.
Саша Варламов @agvarl, Tableau Zen Master, ex Playrix, ex InDrive
Download Telegram
Топография баскетбола

Начинается баскетбольный сезон. Cегодня идём на первую игру "Уникса". 🏀

С тех пор как на горизонте засияла звезда Майкла Джордана, манера игры в НБА сильно изменилась. Броски постепенно сместились за дугу трёхочковой линии, а вместе с ними изменилась и тактика. Там где раньше игроки рвали оборону и прорывались к кольцу, сегодня чаще бросают издалека. Зрелищность поблекла, но игра стала более расчётливой.

Об этом много пишет журналист ESPN Кирк Голдсберри:
Статья 1, Статья 2

Именно у него я впервые увидел визуализацию Tanaka Contours. Этот метод - разновидность контурной диаграммы (Contour Plot), но с объёмным эффектом: каждый контур отбрасывает тень, и чем их больше, тем выше плотность события.

Интересно, что Tanaka Contours придумал профессор Кичиро Танака ещё в 1950-м, чтобы показывать рельеф на картах.

Я тоже решил перенести этот приём в баскетбол и построил визуализацию плотности бросков разных игроков. Рассматривал броски в радиусе восьми футов от кольца. Контуры рассчитал в Python (Seaborn, Matplotlib) методом kernel density estimation. В визуализации можно регулировать степень "трёхмерности" и при желании, свести всё к стандартным Contour Plot.

Подробно расписал как делать в статье "Contour Plots и оценка плотности событий в Tableau".

Особенно нравится в этой истории то, что одна картинка сразу показывает стиль конкретного баскетболиста. Сравните Шакила О’Нила с другими игроками или Джордана с Харденом. Оба - выдающиеся бомбардиры, но играли абсолютно по-разному.

На Reddit кто-то шутил, что такие графики похожи на рентген мозга 🙂

🖼 Визуализация 'NBA Hot Spots'

@data_bar 🍀
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15👍6😱1
Стартует детский конкурс по визуализации данных. Участники - ребята от 6 до 11 лет и их родители. Буду в составе жюри первого всероссийского конкурса по визуализации данных для детей. Конкурс полностью бесплатный.

Участников ждут:
крутые подарки - iPad, LEGO и ещё много всего классного
обучающие эфиры, где диаграмму можно построить из игрушек или конфет
бонусы каждому ребёнку

Работа с данными - один из ключевых навыков будущего. Конкурс - отличный способ показать детям, что работа с данными - это игра и творчество.

🍀 Регистрация

🍀 Канал конкурса
Please open Telegram to view this post
VIEW IN TELEGRAM
10👍4🥰2
Конструктор карт Mapbox

Mapbox - крутой сервис где можно создавать карты и потом использовать их в своих приложениях. Разработчики и дизайнеры используют его, чтобы визуализировать данные, строить маршруты, добавлять 3D-объекты и полностью менять стиль карты под проект. Благодаря гибкости, скорости и красивому дизайну Mapbox применяют: Strava, Foursquare, Financial Times и NASA.

Свою первую карту я сделал в 2017г. С этого момента накопилось 74 кастомные карты. Большинство для Tableau проектов.

В сервисе можно добавлять слои из данных и шарить карты.

Это карта с трассами Формулы 1 в цветах команды Mercedes-AMG. Здесь рисовал трассы и накладывал слоями.
Карта в цветах Формулы E

Если нужны карты, которые будут не просто фоном, а частью продукта - Mapbox подходит идеально.

Делал статью про Mapbox и интеграцию с PowerBI и Tableau, может кому-то пригодится.

@data_bar 🍀
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
13👍6🔥4
Знаменитости по росту

Коротко о том, что случается, если оторвать ноль от графика, и как визуал меняет восприятие фактов.

@data_bar 🍀
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣25😁173🥴3
Аналитика от Аристотеля до Data Science

2000 лет назад аналитикой занимались в античности. Аристотель - отец аналитики, а его трактат "Органон" - базовый труд аналитической теории древности. Кроме прочего, он содержит два трактата: "Первая аналитика" (Analytica Priora) и "Вторая аналитика" (Analytica Posteriora). "Аналитики" стали теоретическим фундаментом для всей европейской науки, философии и математики.

Это труд, где Аристотель создал формальную логику или первый в истории "язык рассуждений" (Придумал античный сторителлинг ).

Цель "Первой аналитики" - понять, как устроено правильное умозаключение.
Цель "Второй аналитики" - понять, как из наблюдений и доказательств получить истинное знание.

Меня хватило только на половину "Первой аналитики", но сложно.

Аристотель считал, что истинное знание начинается с наблюдения, но завершается пониманием причин и общих законов, то есть логическим выводом из первых принципов. C данными в Античности было туго, поэтому приходилось доходить до выводов путём рассуждений.

Отец аналитики ввёл основы формальной логики, которой пользовались более 2000 лет до появления математической логики в XIX веке. Он впервые сформулировал идею научного метода: знание строится на доказательстве, а не на вере или авторитете. Вот за это - отдельное спасибо!

Аристотель подходил к анализу через поиск причин, выделяя 4 типа:

Материальная причина (Из чего это состоит?)
Формальная причина (Как это устроено?)
Действенная причина (Кто или что вызывает это?)
Целевая причина (Зачем это происходит, какая цель?)

Поиск первопричины - не просто факт, а смысл происходящего.

Интересно, что те же причины можно спроецировать на современный анализ данных. На картинке выше показано как рассуждают Аристотель и современный аналитик о причинах падения продаж. ChatGPT помог построить таблицу, но логика понятна.

Аристотель искал "почему" через понимание сути и причин.
Аналитик ищет "почему" через данные и доказательства.
Но оба делают одно и то же по сути - ищут логическую связь между явлением и его причиной.

Это всё к тому, что рассуждения и поиск причин без данных - история, которой уже 2000 лет.

А вы, как аналитики, пробовали читать Аристотеля?

@data_bar 🍀
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥14👍63
Скоро заканчиваем прием работ на конкурс Дата Кидс!

Буду в составе жюри датавиз конкурса для детей!
О конкурсе:

Дедлайн подачи работ:
30 октября

Что ждёт участников:
• крутые подарки - iPad, LEGO и ещё много всего классного
• обучающие эфиры, где диаграмму можно построить из игрушек или конфет
• бонусы каждому ребёнку
• детский гайд по диаграммам при регистрации

Скоро уже заканчивается прием работ на этот необычный конкурс детского креатива! Спешите!

Участвовать!
👍73🥰3
Транспортные задачи и оптимальные маршруты.

Поиск оптимальных путей в логистике - мощный инструмент, позволяющий существенно сэкономить время и деньги.

Транспортная задача или задача Монжа-Канторовича - это классическая задача линейного программирования о построении оптимального плана перевозок грузов из пунктов отправления в пункты назначения с минимальными затратами.

Советский учёный Леонид Канторович, один из создателей линейного программирования, зачастую работал по ночам и имел склонность к опозданиям. Поэтому, часто пользовался такси. Обратив внимание на простой факт: машины простаивают, а водители неохотно делают короткие поездки, он вместе с группой учёных с помощью математических методов разработал обоснованные тарифы: ввели плату за посадку и уменьшили цену за километраж. Подобный подход затем применяли таксопарки по всему Советскому Союзу.

Леонид Канторович был удостоен Нобелевской премии за вклад в математическую экономику.


В статье "Транспортные задачи в Python и Tableau" я показал пример поиска оптимальных и неоптимальных маршрутов такси. Геометрия дорог не учитывается - рассматриваются прямые, соединяющие точки посадки с точками высадки. На визуализации можно оценить изменение общей длины маршрутов - почти в 5 раз.

Для иллюстрации задачи были взяты координаты 392 отелей на Манхэттене и 392 местоположений такси (все данные с Kaggle). Представим, что нужно все такси отправить во все 392 отеля для 392 постояльцев в один момент.

Для решения задачи в Python используется библиотека "POT: Python Optimal Transport".

Берутся точки начала маршрутов (Source) и точки концов маршрутов (Target).
Строится матрица расстояний или затрат на перемещение (Cost Matrix)
Вычисляются оптимальные маршруты на матрице Optimal Transport
Визуализируются траектории

Подробности описаны в статье.
Визуализация с анимацией позволяет наблюдать, как траектории переходят от неоптимальных к оптимальным. Это пример того, как математическая задача может привести к реальной экономии.

У компании беспилотного такси Waymo есть патент "Route optimization for autonomous driving systems" - в нём описывается способ оптимизации маршрута для автономного автомобиля. Но там всё сложнее, и оптимальные траектории зависят не только от расстояния, но и от других факторов. Оптимальность здесь - баланс безопасностью, данными, надежностью и временем. А Weymo уже начинает локально замещать Uber в Штатах.

Решение сложных транспортных задач задач в масштабах государств находит применение в таких областях как:
Расчёт местоположения логистических центров
Планирование маршрутов транспорта при проведении крупных мероприятий (например, Олимпийские игры или Чемпионат мира по футболу)
Строительство и развитие дорожной инфраструктуры

@data_bar 🍀
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17👍94
Архитектурное наследие Японии

В канале раньше рассказывал про невозможные визуализации в BI. Ещё одна работа с 3D моделями в Tableau рассказывает о классической японской архитектуре. Модели зданий брал из SketchUp. Делал в формате сторителлинга, с описанием и ключевыми событиями для каждого здания на таймлайне. Здания можно поворачивать. Ещё в тексте упоминаются ключевые элементы зданий - их можно подсвечивать на визуализации.

📶 Сама визуализация "Japanese Architectural Heritage"

Большую часть делал в новогодние праздники. Всего около месяца ушло на работу.

Одной из проблем было сделать алгоритм сортировки полигонов в BI по оси Z, чтобы при повороте зданий ближние полигоны перекрывали дальние.

Подробно про такие визы писал в статье "3D модели в Tableau"

@data_bar 🍀
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
11🔥9
Друзья, с наступающим Новым Годом! 🎄

Последние полтора месяца почти не было времени на канал, и тому были веские причины.
В Новый год я вхожу в новой роли и с крутой командой.
В январе–феврале расскажу кем, куда и что буду делать.

А пока - немного личных итогов уходящего года:

VILKY
Наш общий проект по аналитике IT-зарплат отмечает первый год. Мы собирали данные, делали автоотчёты, подключали LLM — и о нас писали крупные Telegram-каналы.
Последние три месяца проект почти не развиваем, но он живёт самостоятельно. В его данных - целая история динамики IT-рынка, эволюции должностей и многое другое. Скорее всего, поставим проект на паузу и вернёмся к нему, когда появится время.

LLM и MCP
Погружался в мир языковых моделей, подключал их к данным и делился результатами. Тема бездонная - ещё многое предстоит исследовать.

✈️ Аналитика Telegram
Много работал с данными TGStat и Telemetr - мир Telegram оказался невероятно глубоким и сложным, а в сочетании с анализом LLM/NLP можно видеть множество скрытых паттернов в данных.

🍀 Встречи и знакомства
Наконец-то увиделся, пообщался и познакомился вживую с теми, кого давно знал онлайн — это бесценно. Познакомися с ребятами из сообщества "Немного продакт", ещё был классный конкурс авторских TG каналов

А пока ухожу на праздники - хочется провести больше времени с семьёй.
В новом году формат канала хочу немного изменить, как именно - подумаю на праздниках.

С праздником! Желаю вам тёплых дней, уюта и сил для новых свершений. Здоровья вам и вашим близким, счастья и любви.

До встречи в 2026-м! 💫
Please open Telegram to view this post
VIEW IN TELEGRAM
🍾128👍3👎1