Рациональные числа
Photo
Насколько точнее стали климатические прогнозы в мире (Our World in Data)
На первой диаграмме показано, как менялась точность климатических прогнозов на 10, 7, 5 и 3 дня вперёд. Чем выше процент — тем точнее прогноз совпадал с реальной погодой. В то же время, чем раньше вы хотите предсказать погоду — тем выше погрешность. Сплошными графиками нарисованы данные Северного полушария, пунктирными — Южного
Для оценки точности брали прогнозы на высоте 5500 метров над землёй, где атмосферное давление составляет 500 гектопаскаль (гПа) или 375 миллиметров ртутного столба
Существуют и другие важные высоты с давлением в диапазоне от 400 до 1000 гПа, но именно уровень с давлением 500 гПа позволяет анализировать и предсказывать цирукуляцию воздуха в нижней части атмосферы. Дело в том, что именно эти движения формируют погоду на поверхности. Предсказав их перемещения, можно сделать прогнозы максимальных температур, дождя, снега и других погодных явлений
На второй диаграмме — средняя погрешность при прогнозе перемещения ураганов и тропических циклонов за каждое десятилетие с 1960 года. Погрешность указана в морских милях за разное количество часов вперёд — от 0 до 120. На третьей картинке — те же данные за каждый год с 1970 по 2022
Благодаря чему качество прогнозов погоды росло каждое десятилетие? Причин этому несколько
Первая — увеличение объёмов и улучшение качества метеорологических данных. Росло число околоземных спутников и наземных станций, что увеличило как объёмы данных, так и плотность покрытия. Также рост точности измерительных приборов положительно повлиял на качество данных
Вторая причина — рост вычислительной мощности компьютеров и усовершенствование методов наблюдения и расчётов. Если раньше мир моделировали в виде квадратов со стороной 90 километров, то теперь сетка может состоять из квадратов 1,5×1,5 км. Более совершенные методы позволили точнее преобразовывать данные наблюдений в результаты моделирований. Это позволило перейти от очень простых представлений о климате к детальному пониманию сложных систем
Третий фактор — появление новых способов коммуникации. Человечество перешло от ежедневных прогнозов в газетах к почасовым сообщениям по радио и телевидению, а сейчас в интернете доступна поминутная информация о погоде
Больше данных по климату на планете:
— Погода в странах мира
— Мировая карта разнообразия климата на суше
— 6 диаграмм с данными по колебанию климата за последние 800 000 лет
— Распределение глобальной температуры, 1920–2021
— Аномалии зональных температур на Земле, 1880–2021
— Температурные аномалии в мировом океане, 1900–2020
На первой диаграмме показано, как менялась точность климатических прогнозов на 10, 7, 5 и 3 дня вперёд. Чем выше процент — тем точнее прогноз совпадал с реальной погодой. В то же время, чем раньше вы хотите предсказать погоду — тем выше погрешность. Сплошными графиками нарисованы данные Северного полушария, пунктирными — Южного
Для оценки точности брали прогнозы на высоте 5500 метров над землёй, где атмосферное давление составляет 500 гектопаскаль (гПа) или 375 миллиметров ртутного столба
Существуют и другие важные высоты с давлением в диапазоне от 400 до 1000 гПа, но именно уровень с давлением 500 гПа позволяет анализировать и предсказывать цирукуляцию воздуха в нижней части атмосферы. Дело в том, что именно эти движения формируют погоду на поверхности. Предсказав их перемещения, можно сделать прогнозы максимальных температур, дождя, снега и других погодных явлений
На второй диаграмме — средняя погрешность при прогнозе перемещения ураганов и тропических циклонов за каждое десятилетие с 1960 года. Погрешность указана в морских милях за разное количество часов вперёд — от 0 до 120. На третьей картинке — те же данные за каждый год с 1970 по 2022
Благодаря чему качество прогнозов погоды росло каждое десятилетие? Причин этому несколько
Первая — увеличение объёмов и улучшение качества метеорологических данных. Росло число околоземных спутников и наземных станций, что увеличило как объёмы данных, так и плотность покрытия. Также рост точности измерительных приборов положительно повлиял на качество данных
Вторая причина — рост вычислительной мощности компьютеров и усовершенствование методов наблюдения и расчётов. Если раньше мир моделировали в виде квадратов со стороной 90 километров, то теперь сетка может состоять из квадратов 1,5×1,5 км. Более совершенные методы позволили точнее преобразовывать данные наблюдений в результаты моделирований. Это позволило перейти от очень простых представлений о климате к детальному пониманию сложных систем
Третий фактор — появление новых способов коммуникации. Человечество перешло от ежедневных прогнозов в газетах к почасовым сообщениям по радио и телевидению, а сейчас в интернете доступна поминутная информация о погоде
Больше данных по климату на планете:
— Погода в странах мира
— Мировая карта разнообразия климата на суше
— 6 диаграмм с данными по колебанию климата за последние 800 000 лет
— Распределение глобальной температуры, 1920–2021
— Аномалии зональных температур на Земле, 1880–2021
— Температурные аномалии в мировом океане, 1900–2020
8 компаний мира с крупнейшими выручками в игровой индустрии, 2023 (Statista)
В список не включены компании, которые не указывают игровую сферу в качестве статьи дохода. Данные по Activision Blizzard указаны не за весь год, так как компания была куплена Microsoft в октябре 2023 года
Больше про игровой рынок:
— Выручки в игровой индустрии на разных платформах, 1970–2023
— Доход игровых индустрий на разных платформах, 1990–2020
— 10 компаний с крупнейшей выручкой в игровой индустрии, 2022
— Число проданных игровых консолей PlayStation и Xbox, 1994–2022
В список не включены компании, которые не указывают игровую сферу в качестве статьи дохода. Данные по Activision Blizzard указаны не за весь год, так как компания была куплена Microsoft в октябре 2023 года
Больше про игровой рынок:
— Выручки в игровой индустрии на разных платформах, 1970–2023
— Доход игровых индустрий на разных платформах, 1990–2020
— 10 компаний с крупнейшей выручкой в игровой индустрии, 2022
— Число проданных игровых консолей PlayStation и Xbox, 1994–2022
Насколько женщины представлены в политике в странах мира, 1789–2023 (Our World in Data)
Подборка Our World in Data с данными по уровню представленности женщин в политике. На картах и диаграммах:
— Карта стран мира со всеобщим избирательным правом, 2022
— Как менялось соотношение стран мира со всеобщим избирательным правом, 1789–2022
— Доля женщин в парламенте стран мира, 2022
— Как менялось соотношение стран мира с различной долей женщин в парламенте, 1789–2023
— Пол главы правительства или государства в странах мира, 2023
— Как менялась доля стран мира с женщиной во главе государства, 1789–2023
— Доля стран мира, где хоть раз женщина становилась главой государства демократическим (синий график) или любым другим путём (оранжевый график), 1789–2023
Как менялась роль женщин в странах и в мире:
— Доля трудоустроенных замужних женщин в США, 1790–1990
— Проявление гендерных стереотипов в странах мира, 2021
— Как изменилась доля женщин в некоторых высокооплачиваемых профессиях в США, 1980/2021
— Гендерный баланс учителей в России и в мире, 2018–2022
Подборка Our World in Data с данными по уровню представленности женщин в политике. На картах и диаграммах:
— Карта стран мира со всеобщим избирательным правом, 2022
— Как менялось соотношение стран мира со всеобщим избирательным правом, 1789–2022
— Доля женщин в парламенте стран мира, 2022
— Как менялось соотношение стран мира с различной долей женщин в парламенте, 1789–2023
— Пол главы правительства или государства в странах мира, 2023
— Как менялась доля стран мира с женщиной во главе государства, 1789–2023
— Доля стран мира, где хоть раз женщина становилась главой государства демократическим (синий график) или любым другим путём (оранжевый график), 1789–2023
Как менялась роль женщин в странах и в мире:
— Доля трудоустроенных замужних женщин в США, 1790–1990
— Проявление гендерных стереотипов в странах мира, 2021
— Как изменилась доля женщин в некоторых высокооплачиваемых профессиях в США, 1980/2021
— Гендерный баланс учителей в России и в мире, 2018–2022
Рациональные числа
Эта картинка опубликована ЦИКом РФ Она станет классическим примером бессовестного вранья при помощи графиков
Как показать маленькие значения в столбчатых диаграммах, не обманывая читателя (data.csv)
Ранее мы показывали, как ЦИК РФ врёт при помощи графиков. Число кандидатов было изображено столбиками в логарифмической шкале, чтобы скрыть огромный перевес в сторону провластных политических партий. Читатели в комментариях возражали, что подобный масштаб в диаграмме не искажает данных. Это неправда
Логарифмические шкалы нужны для визуализации процессов с экспоненциальным ростом: закона Мура, динамики биткоина за всё время, курса мировых валют относительно золота. Также логарифмический масштаб пригождается, когда нужно показать огромную разницу между объектами: карта обозримой Вселенной, диаграмма со всеми объектами Вселенной по массе и размеру, диапазоны громкости звука по степени воздействия на человека
Логарифмические шкалы оперируют не абсолютными значениями, а степенями. Именно поэтому неспециалисту трудно будет понять подобный масштаб. В визуализации ЦИК намеренно пользуются этим искажением восприятия — столбики обманывают читателя и не помогают сравнивать числа
Маленькие значения в столбчатых диаграммах можно показать другими способами, не вводящими в заблуждение. Например, отдельно приблизить область, которую нужно рассмотреть более детально. Так сделали в Т—Ж: отдельно показали сравнительно незаметные данные, сохранив оригинальный масштаб всей диаграммы
Подробнее про уместность логарифмических шкал в визуализации данных можно почитать в публикации Лёши Смагина
Другие наши публикации про грамотную и честную визуализацию данных:
— 1 датасет, 100 визуализаций
— Сводка удобных цветовых палитр для визуализации данных
— Генератор «гонок гистограмм»
Ранее мы показывали, как ЦИК РФ врёт при помощи графиков. Число кандидатов было изображено столбиками в логарифмической шкале, чтобы скрыть огромный перевес в сторону провластных политических партий. Читатели в комментариях возражали, что подобный масштаб в диаграмме не искажает данных. Это неправда
Логарифмические шкалы нужны для визуализации процессов с экспоненциальным ростом: закона Мура, динамики биткоина за всё время, курса мировых валют относительно золота. Также логарифмический масштаб пригождается, когда нужно показать огромную разницу между объектами: карта обозримой Вселенной, диаграмма со всеми объектами Вселенной по массе и размеру, диапазоны громкости звука по степени воздействия на человека
Логарифмические шкалы оперируют не абсолютными значениями, а степенями. Именно поэтому неспециалисту трудно будет понять подобный масштаб. В визуализации ЦИК намеренно пользуются этим искажением восприятия — столбики обманывают читателя и не помогают сравнивать числа
Маленькие значения в столбчатых диаграммах можно показать другими способами, не вводящими в заблуждение. Например, отдельно приблизить область, которую нужно рассмотреть более детально. Так сделали в Т—Ж: отдельно показали сравнительно незаметные данные, сохранив оригинальный масштаб всей диаграммы
Подробнее про уместность логарифмических шкал в визуализации данных можно почитать в публикации Лёши Смагина
Другие наши публикации про грамотную и честную визуализацию данных:
— 1 датасет, 100 визуализаций
— Сводка удобных цветовых палитр для визуализации данных
— Генератор «гонок гистограмм»
This media is not supported in your browser
VIEW IN TELEGRAM
Динамика снижения уровня Аральского моря, 1957–2022 (Reddit)
Ещё мы писали про водоёмы:
— Объём воды и людей на Земле
— Динамика снижения уровня Аральского моря, 1957–2022
— Мусор в мировом океане, 2007–2021
— Рост уровня Мирового океана, 1993–2021
— Водосборные бассейны рек в мире
Ещё мы писали про водоёмы:
— Объём воды и людей на Земле
— Динамика снижения уровня Аральского моря, 1957–2022
— Мусор в мировом океане, 2007–2021
— Рост уровня Мирового океана, 1993–2021
— Водосборные бассейны рек в мире
Какая доля интернет-трафика в мире генерировалась ботами, 2013–2023 (Imperva)
Bad Bot Report — ежегодное издание об автоматизированном трафике в интернете от Imperva. Компания является крупным поставщиком продуктов для обеспечения кибербезопасности и защиты данных
В отчёте отдельно указана активность «хороших» и «плохих» ботов. Главное отличие в том, что «хорошие» боты выполняют ценные функции, например, индексируют сайты для поисковых систем или следят за производительностью разных ресурсов. Вредоносные же извлекают данные с сайтов без разрешения владельцев, используются в DDoS-атаках и мошенничестве
Главные числа из отчёта:
— 49,6% интернет-трафика в 2023 году генерировалась ботами
— в Ирландии ботами генерировалось 71,4% всего трафика
— 47% всех автоматизированных атак пришлось на США
— самая большая доля неживого трафика генерируется в игровой индустрии — 60,5%
Файл с полным отчётом можно посмотреть по этой ссылке
Другие наши публикации про интернет-трафик и кибербезопасность:
— 10 сайтов с крупнейшим трафиком, 1993–2022
— Доли интернет-браузеров по количеству пользователей в мире, 1994–2022
— Самые распространённые языки в мире и в интернете, 2023/2024
— Объёмы убытков от киберпреступности, заявленные пользователями и компаниями в США, 2018–2023
— Крупнейшие утечки данных в мире, 2004–2022
Bad Bot Report — ежегодное издание об автоматизированном трафике в интернете от Imperva. Компания является крупным поставщиком продуктов для обеспечения кибербезопасности и защиты данных
В отчёте отдельно указана активность «хороших» и «плохих» ботов. Главное отличие в том, что «хорошие» боты выполняют ценные функции, например, индексируют сайты для поисковых систем или следят за производительностью разных ресурсов. Вредоносные же извлекают данные с сайтов без разрешения владельцев, используются в DDoS-атаках и мошенничестве
Главные числа из отчёта:
— 49,6% интернет-трафика в 2023 году генерировалась ботами
— в Ирландии ботами генерировалось 71,4% всего трафика
— 47% всех автоматизированных атак пришлось на США
— самая большая доля неживого трафика генерируется в игровой индустрии — 60,5%
Файл с полным отчётом можно посмотреть по этой ссылке
Другие наши публикации про интернет-трафик и кибербезопасность:
— 10 сайтов с крупнейшим трафиком, 1993–2022
— Доли интернет-браузеров по количеству пользователей в мире, 1994–2022
— Самые распространённые языки в мире и в интернете, 2023/2024
— Объёмы убытков от киберпреступности, заявленные пользователями и компаниями в США, 2018–2023
— Крупнейшие утечки данных в мире, 2004–2022
Популярность четырёхзначных ПИН-кодов (Nick Berry)
Визуализация основана на исследовании Ника Берри, который детально проанализировал 3,4 миллиона утёкших в сеть ПИН-кодов. По вертикали — первые две цифры, по горизонтали — вторые две. Например, код «1234» находится в 12 ряду снизу и 34 столбце слева. Всего существует 10000 возможных комбинаций
Облако в левом нижнем углу — даты рождения в формате ДД/ММ или ММ/ДД. Светлая полоса в 19 ряду снизу — годы рождения. Яркая диагональ по центру — коды из двух одинаковых чисел. Чёрные и серые квадраты — те самые редкие ПИН-коды. Снизу указаны 20 самых популярных и 20 самых редких комбинаций
Интересные числа из исследования:
— 61 комбинация составляет треть всех ПИН-кодов
— 26,83% всех кодов приходится на 20 самых популярных комбинаций
— 17,8% всех кодов — комбинации с одинаковыми парами цифр («XYXY»)
— лидирует по популярности пресловутый «1234» (11%)
— на 22 месте комбинация «2580» — четыре клавиши по центру цифровой клавиатуры сверху вниз
Больше интересных паттернов в больших данных:
— Пять интересных корреляций на картах мира
— Статистика по буквам русского языка
— Число новорождённых девочек с именем Алекса в США, 1985–2022
— Корреляция отзывов на ароматические свечи и заболеваемости коронавирусом в США, 2019–2022
— Частотность дней рождения в США
Визуализация основана на исследовании Ника Берри, который детально проанализировал 3,4 миллиона утёкших в сеть ПИН-кодов. По вертикали — первые две цифры, по горизонтали — вторые две. Например, код «1234» находится в 12 ряду снизу и 34 столбце слева. Всего существует 10000 возможных комбинаций
Облако в левом нижнем углу — даты рождения в формате ДД/ММ или ММ/ДД. Светлая полоса в 19 ряду снизу — годы рождения. Яркая диагональ по центру — коды из двух одинаковых чисел. Чёрные и серые квадраты — те самые редкие ПИН-коды. Снизу указаны 20 самых популярных и 20 самых редких комбинаций
Интересные числа из исследования:
— 61 комбинация составляет треть всех ПИН-кодов
— 26,83% всех кодов приходится на 20 самых популярных комбинаций
— 17,8% всех кодов — комбинации с одинаковыми парами цифр («XYXY»)
— лидирует по популярности пресловутый «1234» (11%)
— на 22 месте комбинация «2580» — четыре клавиши по центру цифровой клавиатуры сверху вниз
Больше интересных паттернов в больших данных:
— Пять интересных корреляций на картах мира
— Статистика по буквам русского языка
— Число новорождённых девочек с именем Алекса в США, 1985–2022
— Корреляция отзывов на ароматические свечи и заболеваемости коронавирусом в США, 2019–2022
— Частотность дней рождения в США