Рациональные числа
25.8K subscribers
7.57K photos
265 videos
235 files
3.66K links
Понимание мира через данные

Статистика и данные из разных областей. Минимум оценок и интерпретаций, максимум данных и фактов

Чат: @rationalchat

https://rationalnumbers.ru

По рекламе: @kgreenmedia
В реестре: vk.cc/cKf8WS

Автор: @kirillgreen
Download Telegram
В 21 веке национальный долг США (aka госдолг) растёт со скоростью примерно 1 трлн $ в год

Источник
Что будет, если распечатать ДНК человека на бумаге?

Ответ даёт проект The Wellcome genome bookcase — получится 118 книг по 1000 страниц каждая, суммарно в них 3,4 млрд букв, набранных мелким шрифтом (4,5 пункта).

Источник
Медианный возраст населения всех стран мира, 2017 год

Медианным возраст — возраст, который делит население страны на две равные половины, 50% младше и 50% старше.

Самые «старые» страны: Япония (47), Германия и Италия (45), Греция, Болгария и Португалия (44).

Самые «молодые» страны: Чад и Нигер (14), Афганистан, Ангола, Буркина-Фасо, Мали, Сомали, Южный Судан, Уганда (16).

В России медианный возраст 38 лет, на Украине и в Белоруссии 40.

Источник
This media is not supported in your browser
VIEW IN TELEGRAM
Как менялось число пользователей самых популярных социальных сайтов с 2003 по 2018 год

Источник
Как долго Apple поддерживает старые модели iPhone

Покупатели новых айфонов могут рассчитывать на 5-6 больших обновлений iOS.

Источник
Средняя цена 1 грамма конопли (канабиса) в $

Топ-3 страны по самым низким ценам на коноплю в Европе:

1. 🇲🇩 Молдова – $1,8
2. 🇺🇦 Украина – $1,8
3. 🇦🇱 Албания – $3,3

Источник: Управление ООН по наркотикам и преступности
Войны России с главными европейскими конкурентами, 982–1941

Источник
Динамика некоторых климатических изменений

По порядку, сверху вниз:

— Количество углерода в атмосфере выросло с 285 до 405 частей на миллион (+42%, 1840–2018)

— Поверхность океанов нагрелась с 17,8 до 18,4 °C (+3,4%, 1854–2018)

— Уровень океана поднялся на 22,6 см (1880–2015)

— Площадь арктического льда сократилась с 19,9 до 16,6 млн км² (-16,6%, 1979–2018)

— Океаны стали более кислыми — уровень pH сократился с 8,109 до 8,065 (-0,5%, 1988–2017)

Источник
Количество солнечных часов в Европе

Самые солнечные города:

1. 🇨🇾 Никосия – 3314 солнечных часов в год,
2. 🇬🇷 Афины – 2848,
3. 🇫🇷 Марсель – 2836,
4. 🇵🇹 Лиссабон – 2806,
5. 🇪🇸 Мадрид – 2769.

🇷🇺 Москва – 1901,
🇷🇺 Санкт-Петербург – 1628.
Возрастно-половая пирамида населения Земли с 1950 по 2018 и прогноз до 2100 года

Источник
Динамика доходной стратификации российского общества, 1994–2017

Источник
Структура российского общества по доходам, 2017

Медианный доход на члена семьи по истогам 2017 года составил 15800₽.

Менее 75% медианы — 31% населения.

От 0,75 до 1,25 медианы — 38%.

От 1,25 до 2 медиан — 20%.

От 2 до 4 медиан — 8%.

Более 4 медиан — 1%.

Источник
Теперь есть чатик, в котором можно обсудить посты этого канала, или предложить идеи для постов.

Присоединяйтесь: https://xn--r1a.website/rationalchat
Средняя цена клика в контекстной рекламе в Гугле и Яндексе и средний CTR, первый квартал 2019

Источник
Есть вещи вокруг, которые очень контринтуитивны. Cамый известный пример, это наверное Парадокс Монти Холла — не буду про него рассказывать, каждая книжка о статистике его упоминает. Если не слышали — поищите, очень поражает. Я до сих пор, понимая что к чему, не могу этот парадокс полностью осознать.

Еще одна похожая штука: закон Бе́нфорда.
Допустим вы взяли толстый глянцевый журнал. Вот если в этом журнале взять все-все числа, которые встречались во всех статьях, какая будет вероятность что первая цифра у этих чисел это например 1 или 2?

Первое, что приходит в голову, что так как цифр 10 и первая не может быть нулем, то вероятность ⅑. Это не так. Вероятность единицы — ~30%, двойки — ~17.6%, тройки — ~12.5% и вероятности потом постепенно убывают для каждой цифры. Минимальное значение у девятки — 4.6%. Это очень неожиданный результат.

Это правило справедливо для массивов чисел, основанных из данных из реальной жизни. Длина рек (причем не важно в чем измеряная), цены на акции, ваши расходы, смертность и так далее — для всего этого закон будет работать.

Эта штука работает для очень многих данных (особенно если темп роста величины пропорционален её текущему значению), но не для всех. Не сработает, если:
— У данных есть ограничения сверху или снизу
— Данных мало или же они покрывают только один-два порядка (например IQ)
— Числа назначаются искусственно: например индексы или номера заказов или маркетинговые цены в магазине ($9.99)
— В данных нет нормального распределения
Но если перемешать много таких разных данных, то результат уже будет подчинятся этому закону.

Интересно то, что эту штуку используют для нахождения мошенничества с финансами. Числа в финансовых отчетах как правило соотвествуют закону Бенфорда, поэтому если не соответствуют — скорее всего их подгоняли вручную с мыслью "надо сделать их похожими на случайные числа", что как раз приводит к обратной ситуации.
Распределение Бенфорда. По горизонтали — первые значащие цифры, по вертикали — вероятность их появления

Диаграмма из Вики-статьи