Датавизнутая
1.17K subscribers
444 photos
13 videos
94 links
Датавиз, дата-арт, python. Медийная и образовательная визуализация. Рабочее и личное от редактора инфографики Сони Ш.

https://dataviz_addict.tilda.ws
Download Telegram
Эйлер, мосты и теория графов

Раньше математик Леонард Эйлер мне был известен лишь благодаря визуализации множеств (круги Эйлера). Но недавно прочитала, что он, ко всему прочему, является отцом теории графов! Вот так вот используешь разные визуализации в работе и даже не знаешь их истории...

Решила исправиться и прочитала перевод статьи Эйлера, дата публикации которой (1736 год) считается рождением новой области математики — теории графов. В труде "Решение одной задачи, связанной с геометрией положения" математик описывает алгоритм решения популярной в то время задачи про семь мостов Кенигсберга (ныне Калининграда). Согласно ее условиям, нужно пройти по всем мостам, не ступая ни на один из них второй раз.

Как Эйлер решил задачу и какие правила вывел — законспектировала в карточках. А в комментариях оставила еще одну схему из статьи, если кому-нибудь захочется самостоятельно повторить рассчеты.

P.S. Остров до сих пор существует и называется островом Канта. А вот мосты сохранились не все.

#degraphing #датавиз #личное
19👍2🔥2
Пока что времени на содержательный контент нет, поэтому поделюсь забавной находкой — инфографикой-меню😋

Интересно, кто и как внедряет подобные идеи в нетипичную для датавиза сферу? От кого исходит инициатива — от дизайнера, организации или кого-то еще? Загадка🤔

#датамем
17👍3🔥2
Скетчи

Сегодня делала наброски для рабочего проекта и поняла, что у меня уже собралась маленькая коллекция вручную отрисованных референсов (показываю некоторые из них). Для чего они нужны:

1. Скетчи помогают структурировать разрозненные идеи в голове и подобрать визуальное решение👁

2. Визуальное проще показать, а не рассказать. Коллегам редакторам, дизайнерам и иллюстраторам будет легче вас понять, и коммуникация пройдет быстрее⚡️

3. Вероятность потерять хорошую идею в чертогах разума становится меньше — теперь она есть и на аналоговом носителе🗒

4. Приятный бонус, если любите рисовать: можно в рабочее время легально помедитировать с карандашом и бумагой😌

От руки я скетчу в основном схемы, а референсы графиков иногда делаю в фигме (если не хватает ресурсов датавизных сервисов).

P.S. То, что получилось на основе набросков благодаря трудам коллег-дизайнеров, можно посмотреть по ссылкам: морская вода, нарвал, озоновый слой, Ленин.

#датавиз #инфографика #рабочее
16🔥4👍2😱1
Солнце и история🌞

На днях ресерчила тему солнечной активности и магнитосферы Земли и наткнулась на старое забавное исследование о связи солнечных циклов и истории человечества.

Автор составил таблицу событий, которые приходятся на пики 11-летних солнечных циклов и построил график. Придраться можно много к чему, например:

1) Внимание уделяется в большей степени событиям в Европе

2) Не объяснено, как определяется значимость событий

3) Не показано, какие события происходили между пиками солнечной активности

Да и вообще, подобный подход получается довольно манипулятивным. Но хотя бы радует то, что итоги работы автор называет не причинно-следственной связью, а корреляцией (хотя ее скорее всего и не будет, если учитывать события во всем мире).

На мой взгляд, получился отличный пример того, как фрагментарные данные могут искажать картину.

#датавиз
😁63👍2
Не зеленая "Матрица"

31 марта 25 лет назад в массовый прокат вышла первая часть трилогии "Матрица".

К этой дате решила использовать относительно недавно освоенный алгоритм анализа цвета видео в python и составила палитры трех фильмов (про алгоритм расскажу в отдельной серии постов).

Такие визуализации уже делали (например, тут и тут), но мне хотелось дополнительно выделить основные цвета и интересные акценты.

"Матрица" в первую очередь ассоциируется с зелеными оттенками, но цветокоррекция кадра во всех частях меняется в зависимости от локаций и основных сущностей.

P.S. За помощь по вопросам дизайна спасибо Антону💚

P.P.S. С коллегами в ТАСС к дате сделали постер с Нео и шуточное бинго😎

#датавиз #личное #python
26👍7🔥4🥰2
1 апреля отмечают не только День смеха, но и Международный день птиц🐥

По этому поводу сделала карточки для редакционного тг-канала с помощью недавно завирусившегося в датавиз-сообществе сервиса.

Идеальный мэтч темы и визуала😇

https://xn--r1a.website/sokrati_pls/723

#датавиз #рабочее
9👍6🥰4
Анализ видео: подготовка данных

Я использую python, но общая логика алгоритма может пригодиться и для других языков.

Сначала нужно покадрово считать видео. Сделаем это с помощью библиотеки OpenCV (cv2):
import cv2

# видео целиком
video = cv2.VideoCapture('file_name.mp4')

# частота кадров
fps = int(video.get(cv2.CAP_PROP_FPS))

# число кадров во всем видео
frame_count = int(video.get(cv2.CAP_PROP_FRAME_COUNT))


Теперь можно запустить цикл и собрать один кадр за каждую секунду. В цикле повторяется такой код:
ret, frame = video.read()


Каждую итерацию считывается следующий кадр. В ret записывается информация о корректности считывания (True/False), frame — кадр в формате массива с rgb каждого пикселя.

Имея частоту видео, мы можем записать только один кадр в секунду. Такого объема данных достаточно для анализа. В итоге получаем список с числом кадров равным длительности видео в секундах. Что делать с ним дальше расскажу в следующем посте.

P.S. В комментариях полный код этой части.

#датавиз #python
🔥188🤓5
Анализ видео: цвет

На прошлом этапе мы записали по одному кадру видео в секунду в список captures_array. Имея данные о кадрах в формате rgb, мы можем определить преобладающие оттенки.

Для этого используем метод кластеризации, а точнее kmeans. Он позволяет разбить массив на нужное число групп по близости значений и выделить их центры (центроиды). Эти значения являются доминирующими оттенками кадра. На мой взгляд, детальность данных будет достаточная, если выделить пять центроидов (k). Этот алгоритм нужно применить в цикле к каждому кадру (capture):

# определяем размеры массива
shape = capture.shape

# пересобираем в одномерный массив
ar = capture.reshape(np.product(shape[:2]), shape[2]).astype(float)

# находим заданное число центроидов
centroids,_ = kmeans(ar, k)

В итоге получаем палитру каждого кадра фильма в хронологическом порядке. Как ее визуализировать, расскажу в следующем посте.

P.S. Полный код оставила в комментариях.

#датавиз #python
9👍6🔥4
Экзопланеты 🌐

Сегодня захотелось вспомнить проект, который для меня стал первой крупной работой в ТАСС, связанной с темой космоса. Было интересно покопаться в базе данных об экзопланетах от Nasa и разобраться с поначалу пугавшими терминами вроде "equilibrium temperature", "eccentricity" и т.д.

Спасибо Антону за интерактивную красоту и всей команде за проект, о котором приятно рассказывать❤️

#датавиз #рабочее
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6🤩65👍1👎1
В небольшом рабочем завале на глаза попалась обложка отчета ООН об уровне выбросов. Очень понравилась игра слов и визуальная метафора: "record" переводится и как пластинка, и как данные. Если бы линии отражали реальную статистику по выбросам, то даже получился бы дата-арт.

#датаарт #рабочее
13👍2🔥1
Опубликовали новый проект про ленинградские военные плакаты — "Блокадные "Окна ТАСС". Сегодня с коллегой выступили на форуме-выставке "Россия" с презентацией этого материала. В своей части рассказала про инфографику в проекте. Коллеги Сабина Вахитова и Настя Сирина собрали данные о более 300 сохранившихся "Окнах", исследовали тексты, дополняющие изображения, и визуализировали данные о художниках, трудившихся над плакатами.

Я работала над частью с анализом цветов "Окон" — на фотографии можно увидеть график, на который у меня ушло больше всего сил и времени. Подробнее о процессе создания этой визуализации расскажу позже, а пока можете посмотреть на результаты нашего исследования в проекте☺️

#датавиз #рабочее
14🔥9👍3🤡1😍1