Weekly Charts
1.39K subscribers
610 photos
9 videos
1 file
343 links
Weekly Charts: еженедельные визуализации c помощью R и Datawrapper на основе разнообразных данных, обзоры на интересные публикации/примеры визуализаций, лайфхаки и полезные материалы по визуализации данных etc.
Download Telegram
4👍2🔥1
📕 Обзор книги «Наука о данных и искусственный интеллект в медицине»

В современную эпоху биомедицинские исследования сталкиваются с беспрецедентным ростом объемов информации. Объём доступных данных стремительно увеличился: их стало проще собирать, хранить и обрабатывать. Однако сами по себе данные не дают знания – ключевым становится умение их анализировать. Наука о данных (Data Science) превращается в фундамент доказательной медицины, позволяя не просто описывать явления, но и строить прогностические модели, выявлять скрытые закономерности и обеспечивать высокую точность выводов. Умение работать с данными сегодня является критически важным навыком для исследователей, стремящихся к объективности и воспроизводимости своих результатов. При этом на первый план выходит не только техника, но и культура работы с данными: умение формулировать задачи, интерпретировать результаты и выстраивать прозрачный аналитический процесс. Речь идет о формировании особого мышления и грамотности работы с данными, без которых невозможно эффективно использовать их потенциал.

Практическое руководство «Наука о данных и искусственный интеллект в медицине» от коллектива авторов даёт читателям комплексное и прикладное представление о возможностях Data Science в медицине, охватывая все важные информационно-технологические и исследовательские аспекты – от принципов планирования и дизайна биомедицинских исследований до анализа и визуализации данных, включая машинное обучение и работу с реальными биомедицинскими датасетами. Материал изложен доступно, но без упрощения содержания, что позволяет исследователю уверенно применять описанные подходы в своей предметной области.

Авторы делают акцент на практической значимости излагаемого материала, когда каждая глава содержит не только теоретические основы, но и многочисленные примеры (практические пошаговые действия и объяснение кода на R), рекомендации по использованию тех или иных методов анализа данных (алгоритмы их выбора).

Методология книги настолько универсальна, что её можно использовать как «учебник по доказательному подходу» в любой сфере: 1) HR-аналитикам (например, описываемый в ней анализ выживаемости для оценки «срока жизни» сотрудника в компании и выявления драйверов текучести персонала), 2) психологам-исследователям (применять описываемые методы для анализа данных тестирования), 3) дата-журналистам (сделать предобработку данных, привести к «опрятному» виду, работать с «грязными» данными из разных источников и превращать их в интересные расследования).

Важной составляющей книги являются сопутствующие датасеты. Это не абстрактные примеры, а реальные наборы биомедицинских данных. Наличие этих файлов позволяет читателю практиковаться «в боевых условиях», отрабатывая навыки очистки, визуализации и моделирования на конкретных кейсах, которые легко переносятся в рабочую практику врача, аналитика или исследователя. В онлайн-репозитории книги вы можете ознакомиться и скачать все скрипты (примеры кода на языке R), которые рассматриваются в печатном издании.

Это не книга по программированию на языке R (хотя авторы делают ставку на язык R, и это главное преимущество книги), а руководство по переходу на новый уровень мышления, поскольку учит культуре работы с данными, где во главе угла стоят точность, прозрачность, воспроизводимость и доказательность. Книга для тех, кто хочет перестать бояться данных и научиться уверенно работать с ними: от постановки задачи до интерпретации результатов и их представления.

Структура книги выстроена последовательно и отражает реальное содержание и процесс работы с данными.

Первая глава посвящена особенностям медицинских исследований и закладывает основу доказательной медицины. Рассматриваются дизайн исследований, рандомизация, ослепление, типовые схемы, а также клинические исследования, их фазы, нормативные аспекты и возможные систематические ошибки. Отдельное внимание уделено систематическим обзорам и метаанализу.
Во второй главе читатель осваивает основы работы с данными на языке R: типы и структуры данных, базовые операции, обработку таблиц, работу с датами и строками, а также концепцию «опрятных» (tidy) данных. Дополнительно рассматриваются загрузка данных из внешних источников, веб-скрейпинг и сохранение результатов анализа.

Третья глава вводит в системы управления базами данных и принципы реляционной модели. Рассматриваются возможности PostgreSQL и язык SQL – от базовых операций до более продвинутых техник, включая оконные функции и оптимизацию запросов.

Четвёртая глава посвящена визуализации данных. Читатель знакомится с принципами грамматики графики и популярным пакетом для визуализации данных ggplot2, осваивает как базовые типы графиков, так и более сложные визуализации (тепловые карты, диаграммы Санкей, корреляционные матрицы). Дополнительно описаны R-пакеты в рамках grammar of graphics.

Пятая и шестая главы формируют прочную статистическую базу. Сначала вводятся ключевые понятия – выборки, гипотезы, доверительные интервалы и p-значения, рассматриваются конкретные методы анализа: от χ²-тестов и критерия Фишера до анализа времени до события и оценки диагностических тестов, включая вопросы выбора методов и поправки на множественные сравнения. Завершается глава вопросами планирования исследований (расчет размера выборки, рандомизация) и разведочного анализа данных.

Седьмая глава посвящена машинному обучению и большим данным. Рассматривается математика для машинного обучения. В ней даётся практическое введение в ключевые алгоритмы – регрессии, деревья решений, случайный лес, бустинг и нейронные сети, а также рассматриваются подходы к построению ML-пайплайнов и методы обучения без учителя.

Восьмая глава выходит за рамки анализа как такового и показывает, как организовать полноценный исследовательский процесс: от контроля версий (Git) до создания динамических отчётов и дашбордов (Quarto) и интерактивных приложений (Shiny), организации сбора данных. Содержание данной главы оформлено в виде скачиваемых файлов в формате PDF на сайте книги.

Девятая глава завершает книгу обзором биомедицинских датасетов. Материал служит базой для самостоятельной работы и воспроизведения примеров из книги. Наборы данных доступны для скачивания в интернет-репозитории.

📕 В итоге книга представляет собой целостное и практико-ориентированное руководство, которое не просто знакомит с инструментами анализа данных, а формирует системное мышление исследователя. Она особенно полезна тем, кто хочет перейти от фрагментарного использования методов к выстроенному, воспроизводимому и доказательному анализу данных – как в медицине, так и за её пределами.

Приобрести книжку можно, например, тут.

🔗 Ссылка на репозиторий: github.com/ds-book/code
📦 Датасеты: https://ds-book.ru/docs/datasets/

#R #ggplot2 #RStats #datascience #аналитика_данных #книги #машинное_обучение #ИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
🌍 Earth in Action: Планета в реальном времени

Наша планета никогда не остается статичной. Чтобы запечатлеть и наглядно показать её непрерывные изменения, появился проект Earth in Action (коллекция интерактивных карт).

Что внутри коллекции?

Широкий спектр данных: от концентрации черного углерода и пыли в атмосфере до ежедневных температурных аномалий.

Детализация: данные обновляются несколько раз в сутки.

Актуальность: следите за глобальными изменениями в режиме реального времени.

Концентрация в атмосфере и локализация черного углерода просто впечатляет! 😮

🔗 Earth in Action: https://www.maps.com/announcing-earth-in-action/

#cartography #gis #dataviz
4🔥3
🚀 Отслеживайте миссию НАСА Artemis II в режиме реального времени

Миссия Artemis II должна стать первым за последние полвека пилотируемым полётом к Луне. Старт намечен на 1 апреля 2026 года (2 апреля в 01:24 МСК). На корабле Orion к спутнику Земли отправятся четверо астронавтов: командир Рид Уайсмен (Reid Wiseman), пилот Виктор Гловер (Victor Glover) и специалисты Кристина Кох (Christina Koch) и Джереми Хансен (Jeremy Hansen). План полёта предусматривает 10-дневный облёт Луны с возвращением на Землю.

Следить за миссией Artemis II в реальном времени можно на веб-сайте AROW (Artemis Real-time Orbit Website) от NASA. Это основная интерактивная платформа для отслеживания полёта. По плану она станет доступна примерно через минуту после старта и будет работать до приводнения корабля Orion.

Нашёл ещё два дашборда с трекингом миссии от энтузиастов:

1. Artemis II Mission Tracker

2. Artemis II Mission Dashboard

#дашборды #космос #artemis_2 #разное
3
Forwarded from Всем Дата 2026
Всем дата — зовём всех!

Мы уже нашли партнёров — они поделятся данными. Мы уже готовим пространство — большое, уютное, с розетками и интернетом, прямо в центре Москвы. И мы уже зовём вас на хакатон по журналистике данных!

18-19 апреля
в ВШЭ на Покровском бульваре


Мы создаём пространство для свободного творчества и работы с данными. В первый день мы опубликуем датасеты и вы с командой приступите к созданию медийного дата-проекта. Презентации результатов пройдут в конце второго дня — времени для творчества будет достаточно

Мы намеренно не ставим задачу, чтобы вы могли:
- найти в данных инсайты и вдохновиться ими
- придумать свой формат подачи и реализовать его
- создать материал, которым будете гордиться

Отмечайте в календаре, зовите друзей и регистрируйтесь
Подробности и регистрация — на сайте
🔥3
🐽 Как начинали блокировать Telegram в марте 2026 года

В марте 2026 года доступ к Telegram в России заметно ухудшился. Роскомнадзор официально сообщает о замедлении работы мессенджера, а независимые измерения указывают на усиление ограничений. По данным OONI, международного проекта Open Observatory of Network Interference, который с 2012 года собирает и публикует открытые данные об интернет-цензуре с помощью приложения OONI Probe, на 2 апреля 2026 года Telegram доступен лишь в 25% случаев, а в 75% тестов наблюдаются аномалии, типичные для блокировки.

Код графика на Github.

#R #ggplot2 #цензура #bar_plot #OONI #telegram #stacked_bar_chart
🔥43👍2
🌑 Интерактивная модель орбиты Artemis II

В качестве дополнения к посту — отличная интерактивная модель траектории Artemis II.

Можно смотреть в трех измерениях с любой стороны, и мотать время вперед-назад!

#космос #artemis_2 #разное
2🔥1
🌸 День года с пиком цветения сакуры в Киото

Обновил прошлогодний график с пиком цветения сакуры в Японии: добавил точку данных за 2025 год и перевёл текст графика на русский. Код графика в исходном посте.

#R #ggplot2 #изменение_климата #примеры_визуализации #global_warming
7🔥4
Forwarded from Data-comics
Международный Конкурс Data2Kids!🌟

Осенью мы провели этот прекрасный конкурс в России (и СНГ), а теперь вышли на другие страны!

Так что если вы или ваши знакомые семьи интересуетесь вовлечением детей в дата-сферу, перешлите им ссылку ниже!

Начало приема регистраций сегодня:
30 марта!
В течение месяца будут образовательные эфиры и прием работ!
Участвуют дети: 7-12 лет!

С нами невероятные партнеры! Cole Knaflic😍, Alli Torban, Sophie Sparkes, Neil Richards, Bill Shander и многие другие, также знакомые нам датавиз эксперты, участвующие в глобал-активностях: Настя Кузнецова, Надя Андрианова, Алексей Новичков, Никита Рокотян, Алекс Варламов! 😍

Но напоминаю, что из РФ и СНГ поучаствовать не получится. Для нас конкурс будет осенью - ждем, ждем!)))

data2kids.com/en/award

Если у вас есть зарубежные соцсети - будем крайне признательны, если вы расскажете о нашем конкурсе на английском языке! ❤️
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7
📊 Гендерный состав космических экипажей (1960–2020-е)

Визуализация Ansgar Wolsing, созданная в рамках #30DayChartChallenge на основе данных обо всех космических миссиях, начиная с полёта Валентины Терешковой в 1963 году.

Это пример мозаичного графика (диаграммы Маримекко), где ширина столбцов зависит от общего числа людей, побывавших в космосе за десятилетие, а светлые блоки снизу показывают долю женщин (в процентах). Жёлтые точки (стилизованные звёзды) — отдельные женщины-космонавты.

После полёта Терешковой следующая женщина отправилась в космос только в 1982 году: ею стала Светлана Савицкая. По десятилетиям:
1980-е: 6%
1990-е: 15%
2000-е и 2010-е: спад и стабилизация на уровне 13%
2020–2023: рост до 19%

Даже с учётом текущего рекорда (19%) мужчины по прежнему составляют подавляющее большинство экипажей. Автор подготовил этот график под впечатлением от миссии Artemis II.

#R #ggplot2 #маримекко #референсы #DataViz #примеры_визуализаций #космос #ВизуализацияДанных
5🔥4
8
Каждый год в районе 12 апреля в Поиске резко растёт доля запросов о том, как стать космонавтом. В среднем, в неделю, на которую выпадает праздник, она увеличивается в 2,7 раза по сравнению с предыдущей. Самый большой пик был в 2024 году — тогда показатель вырос в 4,3 раза.

Иногда всплески интереса наблюдаются не только в связи с праздничной датой, но и во время космических запусков. Так, высокая доля запросов про то, как стать космонавтом, в 2024 году может объясняться тем, что 11 апреля Россия запустила с космодрома Восточный тяжелую ракету-носитель «Ангара-А5». Также рост, например, наблюдался в октябре 2021-го, в сентябре 2023-го и в ноябре 2025 года — во всех случаях в эти месяцы на МКС отправляли новый экипаж.

А ещё нам иногда встречались интересные запросы про то, как стать космонавтом. Например, в Поиске спрашивают [что нужно чтобы стать космонавтом с аппендицитом], [можно ли стать космонавтом после 9 класса] и [как стать космонавтом и улететь на луну].


Исследования Яндекса @YaResearches
😁54
🔄 Undo/redo теперь в Datawrapper!

Наконец-то! Нажми Ctrl/Cmd + Z и вернёшь всё назад. А комбинация клавиш Ctrl/Cmd + Shift + Z вернёт изменения обратно.

Плюс: дублировать, копировать, перемещать или удалить диаграмму теперь можно прямо из редактора через новое меню в левом верхнем углу.

🔗 Подробнее: https://www.datawrapper.de/blog/undo-redo-in-datawrapper

#datawrapper #dataviz #лайфхак #разное #полезное
5