Рациональные числа
25.7K subscribers
6.83K photos
234 videos
231 files
3.25K links
Понимание мира через данные

Статистика и данные из разных областей. Минимум оценок и интерпретаций, максимум данных и фактов

Чат: @rationalchat

https://rationalnumbers.ru

По рекламе: @kgreenmedia
В реестре: vk.cc/cKf8WS

Автор: @kirillgreen
Download Telegram
Как устроены выборки и откуда берётся репрезентативность (Если быть точным)

Опросить всё население страны невозможно — так пытаются сделать во время переписей, которые проводятся раз в десятилетие и требуют очень много ресурсов. Например, в последней российской переписи участвовали 314 тысяч переписчиков, бюджет составил более 30 миллиардов рублей, но качество переписи всё равно вызвало много вопросов

Поэтому обычно опрашивают не всю группу людей (генеральную совокупность), а только её часть — выборку. Её формируют особым образом, чтобы она была репрезентативной, то есть позволяла делать выводы о генеральной совокупности

Самая точная выборка — случайная, которую ещё называют «вероятностной». Для такой выборки участников отбирают по правилам, при которых шанс попасть в выборку можно посчитать

Чтобы провести такой опрос, нужен список всей генеральной совокупности. Например, ВЦИОМ при своих опросах использует полный список телефонных номеров, а Росстат — данные переписей. Из таких списков случайным образом выбирают группы: сначала районы, затем населённые пункты, дома и отдельных людей. По такому же принципу формируют выборки «Левада-Центр» и Фонд общественного мнения

При таких методах размер выборки не зависит от численности населения генеральной группы. Формула расчёта подразумевает, что популяция может быть бесконечно большой

Иногда о генеральной совокупности вообще ничего не известно — например, сколько россиян уехало в 2022 году, их пол, возраст и страны проживания. Тогда делают неслучайные выборки:
стихийные, когда опрашивают тех, кто согласился участвовать
квотные, когда отбирают по заранее заданным пропорциям (мужчины, женщины, возрастные когорты)
снежный ком, когда респонденты сами приводят новых участников опроса

При таком методе шанс попадания в выборку рассчитать нельзя. Подобные выборки не дают точной картины, но смещения можно пытаться компенсировать. Например, взвешивать ответы, если, скажем, в выборке мало пенсионеров

Смещения могут быть и в случайных выборках, когда часть людей из выборки отказываются пройти опрос или подстраиваются под ожидания при ответах на вопросы. Например, в опросах ВЦИОМ, ФОМ и «Левада-Центра» часто перепредставлены пожилые люди, которые пользуются домашними телефонами

Смещения могут быть ещё сильнее, когда вопросы касаются «опасных» тем. В опросах россиян об отношении к войне на территории Украины работает «спираль молчания», когда люди боятся озвучить свою позицию, и начинает громче звучать позиция части населения, которой нечего бояться

@rationalnumbers
🔥31👍113🤡1
Выручка и издержки Nike в 2025 финансовом году (SankeyArt)

У Nike 2025 финансовый год закончился 31 мая 2025 года. При выручке в 46,4 миллиарда долларов чистая прибыль компании составила 3,2 миллиарда

Ещё мы писали про производителей спортивной одежды:
Два графика про Найк, 1976–2021
Объёмы мировой выручки Nike, 1976–2024
Что входит в цену кроссовок Найк
Что входит в цену кроссовок Адидас
Ежегодные чистые доходы и убытки Adidas в мире, 1992–2023
🔥5👍2
25 крупнейших компаний в США по объёмам выручки в 2025 году (Visual Capitalist)

Компании сгруппированы по секторам экономики:
— ритейл (оранжевый)
— здравоохранение (голубой)
— технологический сектор (синий)
— финансовый сектор (зелёный)
— энергетика (красный)
— автомобилестроение (жёлтый)

Источник данных — 50Pros

Больше данных по крупнейшим компаниям мира:
В каких странах находились топ-500 компаний Европы по годовой выручке, 2023
Топ-50 компаний мира по прибыли в 2024 году
50 компаний мира с крупнейшей капитализацией, 2024
Крупнейшие компании мира по числу поставленных смартфонов, 2024
8 компаний мира с крупнейшими выручками в игровой индустрии, 2023
👍10🔥2😱1
Беби-бум в семи графиках (Our World in Data)

Беби-бум — это резкий рост рождаемости в США и других странах после Второй мировой войны. Он начался примерно в 1946 году и завершился к середине 1960-х. Основные причины: возвращение солдат с войны, экономический рост, уверенность в будущем и доступное жильё. Людей, родившихся в этот период, называют поколением беби-бумеров или просто «бумерами»

Our World in Data собрали и проанализировали данные по рождаемости и бракосочетаниям, в которых видно проявление беби-бума. На графиках:

— Рождаемость в США по возрастным когортам, 1918–1970. По вертикали указан год рождения женщин, по горизонтали — возраст. Высотой дуги обозначен уровень рождаемости

— Рождаемость на 1000 человек населения в США, 1910–2024

— Рождаемость на 1000 человек населения в странах с высоким уровнем дохода, 1910–2025

— Среднее число детей, которое родили женщины одного поколения к концу фертильного возраста (≈49 лет). По горизонтали указан год рождения, по вертикали — среднее число рождённых детей

— Распределение женщин по числу рождённых детей к концу фертильного возраста в США, 1918–1971 годы рождения

— Средний возраст женщин в России на момент рождения первых пяти детей, 1959–2018

— Доля замужних женщин от 20 до 24 лет в странах с высоким уровнем дохода, 1930/1960

Больше данных по рождаемости в мире:
Рождаемость в мире, 1925–2023
Динамика рождаемости в мире, 1950–2020
Число рождений на одну женщину в странах Европы, 2025
Рождаемость и численность населения в странах мира, 2023
❤‍🔥8🕊4👍3👌1
Самая дорогая по рыночной капитализации компания в России, 1994–2025 (Stonks)

Никто уже не вернёт нам 2007 год, когда Газпром входил в топ-3 самых дорогих компаний мира

Ещё мы писали:
Капитализация крупнейший компаний и рост ВВП в регионах мира, 1973–2025
10 крупнейших компаний мира по рыночной капитализации, 2015–2025
50 крупнейших компаний по рыночной капитализации в мире, 2025
10 самых дорогих брендов, 2000–2022
🤣16👍3😢3👌3🤡1
Моделирование выбросов метана за последние 20 тысяч лет (European Geosciences Union)

#пост_читателя

20 000 лет назад закончился последний ледниковый период. Процессы, происходившие с тех пор:
— теплели и влажнели тропические зоны — там работали метаногенные археи, одноклеточные организмы, питающиеся метаном
— в Южно-Китайском море снизился уровень кислорода, что тоже очень нравится метаногенам
— в море Лаптевых начал выделяться накопленный ранее в мерзлоте метан
— около 10% всех этих выбросов были вызваны ферментацией растительности в организмах травоядных

На первой диаграмме — ежегодные выбросы метана на всей планете, в заболоченной и незаболоченной местностях. На картах — пиковые выбросы метана и динамика выбросов за 7000 лет. На последней диаграмме — концентрация метана в Антарктиде и Гренландии. По горизонтали — количество тысяч лет назад

Другие посты нашего читателя про климат:
Сколько ледниковых периодов пережили белые медведи
Арктика была безо льда, когда человечество начало осваивать земледелие
«Переход Мид-Брункс»
Опубликована очередная реконструкция палеоклимата, за последние 3,6 млн лет
Концентрации CO₂ и кислорода за последние полтора миллиарда лет
🔥6👍1
Какую долю всего текста на китайском можно прочитать со знанием разного числа иероглифов (Reddit)

В китайском языке более 80 тысяч иероглифов, но знание лишь 3000 из них позволяет прочитать 99,72% всех текстов на китайском

Другие наши публикации про языки мира:
100 самых распространённых языков мира, 2023
Распространённость языков в мире, 2023
Самые распространённые языки в интернете
Соотношение скорости и информативности речи в языках мира
🔥30👍5😱5🤯1