Рациональные числа
24.6K subscribers
5.96K photos
212 videos
225 files
2.85K links
Понимание мира через данные

Собираем статистику и данные из разных областей. Минимум оценок и интерпретаций, максимум данных и фактов

Чат канала: @rationalchat

Сайт: http://rationalnumbers.ru

По рекламе: @kgreenmedia

Автор канала: @kirillgreen
Download Telegram
Сколько детей в среднем рожали женщины в возрасте от 25 до 44 лет в США, 1975–2023 (The Washington Post)

Каждый график — доля женщин, которые рожали определённое число детей. Доля женщин, никогда не рожавших на протяжении жизни, выросла до 35%, в то же время сократилась доля женщин, рожавших три и более раз

Больше данных по рождаемости в мире:
Динамика рождаемости, смертности, браков и разводов в России, апрель 2020 – февраль 2024
Индекс человеческого развития и рождаемость в странах мира, 1990–2020
Динамика рождаемости в мире, 1950–2020
В каком возрасте рожают детей в США, 2016–2020
Ежегодное число рождений, смертей и браков в Японии, 1947–2023
В каком возрасте мужчины и женщины заводили детей на протяжении 10000 поколений
Рациональные числа
Photo
Насколько точнее стали климатические прогнозы в мире (Our World in Data)

На первой диаграмме показано, как менялась точность климатических прогнозов на 10, 7, 5 и 3 дня вперёд. Чем выше процент — тем точнее прогноз совпадал с реальной погодой. В то же время, чем раньше вы хотите предсказать погоду — тем выше погрешность. Сплошными графиками нарисованы данные Северного полушария, пунктирными — Южного

Для оценки точности брали прогнозы на высоте 5500 метров над землёй, где атмосферное давление составляет 500 гектопаскаль (гПа) или 375 миллиметров ртутного столба

Существуют и другие важные высоты с давлением в диапазоне от 400 до 1000 гПа, но именно уровень с давлением 500 гПа позволяет анализировать и предсказывать цирукуляцию воздуха в нижней части атмосферы. Дело в том, что именно эти движения формируют погоду на поверхности. Предсказав их перемещения, можно сделать прогнозы максимальных температур, дождя, снега и других погодных явлений

На второй диаграмме — средняя погрешность при прогнозе перемещения ураганов и тропических циклонов за каждое десятилетие с 1960 года. Погрешность указана в морских милях за разное количество часов вперёд — от 0 до 120. На третьей картинке — те же данные за каждый год с 1970 по 2022

Благодаря чему качество прогнозов погоды росло каждое десятилетие? Причин этому несколько

Первая — увеличение объёмов и улучшение качества метеорологических данных. Росло число околоземных спутников и наземных станций, что увеличило как объёмы данных, так и плотность покрытия. Также рост точности измерительных приборов положительно повлиял на качество данных

Вторая причина — рост вычислительной мощности компьютеров и усовершенствование методов наблюдения и расчётов. Если раньше мир моделировали в виде квадратов со стороной 90 километров, то теперь сетка может состоять из квадратов 1,5×1,5 км. Более совершенные методы позволили точнее преобразовывать данные наблюдений в результаты моделирований. Это позволило перейти от очень простых представлений о климате к детальному пониманию сложных систем

Третий фактор — появление новых способов коммуникации. Человечество перешло от ежедневных прогнозов в газетах к почасовым сообщениям по радио и телевидению, а сейчас в интернете доступна поминутная информация о погоде

Больше данных по климату на планете:
Погода в странах мира
Мировая карта разнообразия климата на суше
6 диаграмм с данными по колебанию климата за последние 800 000 лет
Распределение глобальной температуры, 1920–2021
Аномалии зональных температур на Земле, 1880–2021
Температурные аномалии в мировом океане, 1900–2020
Пироговая диаграмма пирога

#рацкек
8 компаний мира с крупнейшими выручками в игровой индустрии, 2023 (Statista)

В список не включены компании, которые не указывают игровую сферу в качестве статьи дохода. Данные по Activision Blizzard указаны не за весь год, так как компания была куплена Microsoft в октябре 2023 года

Больше про игровой рынок:
Выручки в игровой индустрии на разных платформах, 1970–2023
Доход игровых индустрий на разных платформах, 1990–2020
10 компаний с крупнейшей выручкой в игровой индустрии, 2022
Число проданных игровых консолей PlayStation и Xbox, 1994–2022
Насколько женщины представлены в политике в странах мира, 1789–2023 (Our World in Data)

Подборка Our World in Data с данными по уровню представленности женщин в политике. На картах и диаграммах:
— Карта стран мира со всеобщим избирательным правом, 2022
— Как менялось соотношение стран мира со всеобщим избирательным правом, 1789–2022
— Доля женщин в парламенте стран мира, 2022
— Как менялось соотношение стран мира с различной долей женщин в парламенте, 1789–2023
— Пол главы правительства или государства в странах мира, 2023
— Как менялась доля стран мира с женщиной во главе государства, 1789–2023
— Доля стран мира, где хоть раз женщина становилась главой государства демократическим (синий график) или любым другим путём (оранжевый график), 1789–2023

Как менялась роль женщин в странах и в мире:
Доля трудоустроенных замужних женщин в США, 1790–1990
Проявление гендерных стереотипов в странах мира, 2021
Как изменилась доля женщин в некоторых высокооплачиваемых профессиях в США, 1980/2021
Гендерный баланс учителей в России и в мире, 2018–2022
Рациональные числа
Эта картинка опубликована ЦИКом РФ Она станет классическим примером бессовестного вранья при помощи графиков
Как показать маленькие значения в столбчатых диаграммах, не обманывая читателя (data.csv)

Ранее мы показывали, как ЦИК РФ врёт при помощи графиков. Число кандидатов было изображено столбиками в логарифмической шкале, чтобы скрыть огромный перевес в сторону провластных политических партий. Читатели в комментариях возражали, что подобный масштаб в диаграмме не искажает данных. Это неправда

Логарифмические шкалы нужны для визуализации процессов с экспоненциальным ростом: закона Мура, динамики биткоина за всё время, курса мировых валют относительно золота. Также логарифмический масштаб пригождается, когда нужно показать огромную разницу между объектами: карта обозримой Вселенной, диаграмма со всеми объектами Вселенной по массе и размеру, диапазоны громкости звука по степени воздействия на человека

Логарифмические шкалы оперируют не абсолютными значениями, а степенями. Именно поэтому неспециалисту трудно будет понять подобный масштаб. В визуализации ЦИК намеренно пользуются этим искажением восприятия — столбики обманывают читателя и не помогают сравнивать числа

Маленькие значения в столбчатых диаграммах можно показать другими способами, не вводящими в заблуждение. Например, отдельно приблизить область, которую нужно рассмотреть более детально. Так сделали в Т—Ж: отдельно показали сравнительно незаметные данные, сохранив оригинальный масштаб всей диаграммы

Подробнее про уместность логарифмических шкал в визуализации данных можно почитать в публикации Лёши Смагина

Другие наши публикации про грамотную и честную визуализацию данных:
1 датасет, 100 визуализаций
Сводка удобных цветовых палитр для визуализации данных
Генератор «гонок гистограмм»
Какая доля интернет-трафика в мире генерировалась ботами, 2013–2023 (Imperva)

Bad Bot Report — ежегодное издание об автоматизированном трафике в интернете от Imperva. Компания является крупным поставщиком продуктов для обеспечения кибербезопасности и защиты данных

В отчёте отдельно указана активность «хороших» и «плохих» ботов. Главное отличие в том, что «хорошие» боты выполняют ценные функции, например, индексируют сайты для поисковых систем или следят за производительностью разных ресурсов. Вредоносные же извлекают данные с сайтов без разрешения владельцев, используются в DDoS-атаках и мошенничестве

Главные числа из отчёта:
— 49,6% интернет-трафика в 2023 году генерировалась ботами
— в Ирландии ботами генерировалось 71,4% всего трафика
— 47% всех автоматизированных атак пришлось на США
— самая большая доля неживого трафика генерируется в игровой индустрии — 60,5%

Файл с полным отчётом можно посмотреть по этой ссылке

Другие наши публикации про интернет-трафик и кибербезопасность:
10 сайтов с крупнейшим трафиком, 1993–2022
Доли интернет-браузеров по количеству пользователей в мире, 1994–2022
Самые распространённые языки в мире и в интернете, 2023/2024
Объёмы убытков от киберпреступности, заявленные пользователями и компаниями в США, 2018–2023
Крупнейшие утечки данных в мире, 2004–2022