Рациональные числа
24.6K subscribers
5.96K photos
212 videos
225 files
2.85K links
Понимание мира через данные

Собираем статистику и данные из разных областей. Минимум оценок и интерпретаций, максимум данных и фактов

Чат канала: @rationalchat

Сайт: http://rationalnumbers.ru

По рекламе: @kgreenmedia

Автор канала: @kirillgreen
Download Telegram
Популярность четырёхзначных ПИН-кодов (Nick Berry)

Визуализация основана на исследовании Ника Берри, который детально проанализировал 3,4 миллиона утёкших в сеть ПИН-кодов. По вертикали — первые две цифры, по горизонтали — вторые две. Например, код «1234» находится в 12 ряду снизу и 34 столбце слева. Всего существует 10000 возможных комбинаций

Облако в левом нижнем углу — даты рождения в формате ДД/ММ или ММ/ДД. Светлая полоса в 19 ряду снизу — годы рождения. Яркая диагональ по центру — коды из двух одинаковых чисел. Чёрные и серые квадраты — те самые редкие ПИН-коды. Снизу указаны 20 самых популярных и 20 самых редких комбинаций

Интересные числа из исследования:
— 61 комбинация составляет треть всех ПИН-кодов
— 26,83% всех кодов приходится на 20 самых популярных комбинаций
— 17,8% всех кодов — комбинации с одинаковыми парами цифр («XYXY»)
— лидирует по популярности пресловутый «1234» (11%)
— на 22 месте комбинация «2580» — четыре клавиши по центру цифровой клавиатуры сверху вниз

Больше интересных паттернов в больших данных:
Пять интересных корреляций на картах мира
Статистика по буквам русского языка
Число новорождённых девочек с именем Алекса в США, 1985–2022
Корреляция отзывов на ароматические свечи и заболеваемости коронавирусом в США, 2019–2022
Частотность дней рождения в США
1 датасет, 100 визуализаций

Авторы проекта взяли за основу число объектов всемирного наследия в Норвегии, Дании и Швеции в 2004 и 2022 годах и представили их 100 разными способами. Целью было показать, насколько визуализация данных сложная и разнообразная дисциплина

Выше ряд примеров, остальные на сайте: 100.datavizproject.com

Ранее мы писали о другом проекте агентства Ferdio — Flag Stories. Там они сгруппировали флаги стран мира по цветам, формам, символам, пропорциям и многим другим признакам
Динамика стоимости 1 грамма кокаина и героина в 18 странах мира, 2000–2020 (Анастасия Кузнецова)

Цены указаны в американских долларах, напротив названия страны указана медианная стоимость

Другие наши публикации про наркотики:
Динамика смертности от передозировки наркотиками в США
Сколько наркотиков изымают в мире, 2007–2017
Динамика количества американцев, пробовавших марихуану, 1969–2021
Доля употребляющего марихуану населения в странах мира, 2017
Карта околоземных спутников GPS, OneWeb и Starlink в реальном времени (Satellite Map)

На интерактивном сайте можно отслеживать положение спутников в реальном времени, настроить отображение по типам спутников, найти наземные станции и проверить площадь покрытия систем

По состоянию на 22 мая 2024 года, всего на околоземную орбиту Земли было отправлено 6380 спутников Starlink, из них 4838 активны, 1145 неактивны, а 396 сгорели в атмосфере

Ещё мы писали про объекты на орбите Земли:
Кому и сколько искусственных спутников Земли принадлежало на конец 2022 года
Распределение объектов на орбите Земли
Запущенные в космос объекты по странам, 1957–2021
Количество космического мусора на разных орбитах Земли, 1961–2022
Сколько спят и как часто чувствуют себя отдохнувшими взрослые люди (Nathan Yau)

На первой диаграмме — долевое распределение взрослых американцев по средней продолжительности сна. 61% из опрошенных заявили, что спят от 7 до 8 часов в день, 30% — менее 7 часов в день

На второй картинке — доли опрошенных, которые чувствуют себя отдохнувшими после пробуждения:
— никогда
— иногда
— часто
— каждый день

На последнем изображении — те же данные с разбивкой на количество сна. Примечательно, что люди с 10+ часов сна чаще отвечали, что чувствуют себя отдохнувшими редко или никогда, чем те, кто спит по 9 часов в сутки

Источник данных — Национальный центр статистики здравоохранения США (2022)

Ещё мы писали о паттернах сна:
Как спит человек и некоторые виды животных
Сколько спят разные животные
Связь между временем отхода ко сну и сердечно-сосудистыми заболеваниями
Как меняется режим сна и бодрствования с возрастом
Как менялся топ-16 больших языковых моделей в рейтинге Chatbot Arena, май 2023 – апрель 2024 (Jianqi Pan)

Chatbot Arena — один из самых авторитетных рейтингов больших языковых моделей (LLM). Места в рейтинге определяются в полевых условиях: пользователи общаются с двумя анонимными моделями и голосуют за лучшую. На сайте собрано уже более миллиона голосов. Рейтинг LLM высчитывается по системе ELO, которая применяется также для определения рейтинга игроков в шахматы, шашки или го

Жанки Пэн в конце апреля 2024 года опубликовал анимированный топ моделей за последний год. В актуальной на тот момент версии рейтинга лидировала ChatGPT-4-Turbo, но уступила первенство недавно вышедшей ChatGPT-4o

Полный рейтинг с подробной статистикой по всем категориям можно посмотреть на сайте. Там же можно решить исход очередной дуэли и повлиять на общий рейтинг, бесплатно воспользовавшись передовыми LLM современности

Больше интересных данных из мира нейросетей:
Политическая ориентация 24 крупнейших языковых моделей
Число изображений, сгенерированных 5 популярными нейросетями, по состоянию на август 2023
Как менялось число параметров у больших языковых моделей, 2018–2023
Индустрия искусственного интеллекта в числах, 2010–2022
Как развивалась индустрия генеративного ИИ, 2014–2023
Как менялись возможности систем ИИ по распознаванию речи и изображений относительно способностей человека, 1998–2020