Рациональные числа
25.2K subscribers
6.28K photos
216 videos
228 files
3K links
Понимание мира через данные

Собираем статистику и данные из разных областей. Минимум оценок и интерпретаций, максимум данных и фактов

Чат канала: @rationalchat

http://rationalnumbers.ru

По рекламе: @kgreenmedia

Автор: @kirillgreen

№ 4939514230
Download Telegram
Топ-10 полезных приемов в SQL от тимлида аналитиков

Как аналитику стать лучшей версией себя?.. Научиться лайфхакам, которые ускоряют и облегчают работу с данными

Можно выработать их самому в решении рабочих задач, набивая шишки на ходу. А можно сэкономить время и силы и обратиться к более опытным коллегам, которые готовы делиться своим опытом.

Совсем скоро это можно будет сделать на бесплатном мастер-классе от Павла Беляева, тимлида аналитиков в сервисе eLama, где Павел покажет 10 приёмов в работе с SQL, которые использует его команда в реальной практике📊.

Что будет на мастер-классе:
🟠 Проведете проверку на повторяющиеся комбинации в таблице с данными
🟠 Найдете последний элемент в исторических данных
🟠 Сравните разные версии таблиц
🟠 Заполните пропущенные даты во входящих данных
На этом все спойлеры, остальное узнаете на мастер-классе!

🕘 Встреча 12 февраля в 19:00 по мск

Зарегистрироваться на бесплатный мастер-класс

#промо
Please open Telegram to view this post
VIEW IN TELEGRAM
Карта интернета в 1969 году (Amazing Maps)

На карте — система сети ARPANET, созданная в 1969 по заказу американского военного агентства DARPA. На основе её наработок в 1984 году Национальный научный фонд США создал сеть NSFNET для корпоративного пользования

Подключение к NSFNET было достаточно свободным, в отличие от закрытой ARPANET, и к 1992 году к ней уже было подключено 7500 мелких сетей, из которых 2500 находились за пределами США. Позже опорную сеть NSFNET передадут в коммерческое использование, и около 1994 года появится Интернет в современном понимании

В 2021 году мы публиковали карту физической структуры современного интернета с подводными кабелями, точками обмена данными и дата-центрами

Больше данных по устройству интернета:
50 крупнейших кластеров дата-центров по потреблению электроэнергии в мире, 2023
Распределение дата-центров по странам мира, 2018
Карта физической структуры интернета
Мировая карта подводных коммуникационных кабелей, 2022
Число смертей на миллион коммерческих авиарейсов, 1970–2024 (Julie Peasley)

На диаграмме отмечены даты знаковых авиакрушений и ключевых событий в авиастроении

Ещё мы писали про безопасность самолётов:
Авиационные происшествия, 1918–2022
Авиакатастрофы и их жертвы, 1946–2021
Все авиакатастрофы за 100 лет и 100 тысяч их жертв
Надоели шутки о зумерах на работе?

Во FutureToday о зумерах не шутят, во FutureToday зумеры комфортно работают.

А еще — FutureToday ищет стажеров по направлению «Маркетинговые исследования» 

Тебя ждет стажировка с з/п 50к и удаленкой в комфортном молодом коллективе!

Переходи на сайт и подавай заявку.

#промо
Как хорошо справляются с тестами DeepSeek-R1 и ChatGPT o1 (Tom Jones, David Crowther)

В конце января 2025 года китайская компания DeepSeek выпустила свою языковую модель DeepSeek-R1 с открытым исходным кодом, которая превосходит o1 от OpenAI в некоторых тестах. За выходом этой модели последовало падение стоимости акций на американском фондовом рынке примерно на триллион долларов. Сильнее всего пострадала компания Nvidia — её капитализация за день упала на 17% или почти 620 миллиардов долларов

На картинке — результаты прохождения моделями тестов по математике, естественным наукам, английскому языку и программированию

Ещё мы писали про возможности и влияние ИИ:
Как менялись возможности систем ИИ по распознаванию речи и изображений относительно способностей человека, 1998–2020
Как развивалась индустрия генеративного ИИ, 2014–2023
Как снизился спрос на фрилансеров после выхода ChatGPT и генераторов картинок, 2021-2023
Насколько выросла в мире доля научных статей с упоминанием искусственного интеллекта и машинного обучения, 1985–2022
Сколько стоит обработка миллиона токенов данных разными языковыми моделями ИИ, 2025 (Statista)

Токен — это часть текста, которая подаётся на вход модели или выдаётся в её ответе. Это могут быть слова, части слов, отдельные буквы или символы, но обычно их длина составляет около четырёх знаков

На диаграмме — стоимость обработки миллиона токенов входных и выходных данных шестью крупными моделями ИИ

Источник данных — DocsBot

Другие наши публикации про генеративные модели ИИ:
Сколько ресурсов тратят на обучение крупных моделей ИИ, 1950–2024
Политическая ориентация 24 крупнейших языковых моделей
Как хорошо справляются с экзаменами GPT-3.5 и GPT-4
Как менялось число параметров у больших языковых моделей, 2018–2023
Как часто модерация Meta применяла санкции к контенту, 2017–2024 (Tom Jones)

Графиками указано квартальное число принятых мер в отношении контента в Facebook и Instagram, которые модерация посчитала разжигающей ненависть

Ещё мы писали про цензуру в интернете и в мире:
Сколько книг в год пытались ограничить или запретить в США, 2000–2023
Снижение числа просмотров крупных российских блогеров на YouTube в начале августа
Динамика числа запросов российских чиновников в Google на удаление контента, 2011–2016
Статистика Твитера о запросах на цензуру за первое полугодие 2016
Пенсионные накопления стран мира, 2025 (Visual Capitalist)

На диаграмме указаны размеры активов государственных пенсионных фондов. Эти фонды включают различные финансовые активы: деньги на банковских счетах, облигации, акции, недвижимость и другие финансовые инструменты

Фонды могут работать по системе накопления, когда граждане делают взносы, которые накапливаются и увеличиваются за счёт инвестиций. При достижении пенсионного возраста они получают единовременные или регулярные выплаты в зависимости от правил пенсионной системы в стране. Некоторые государства также предоставляют систему гарантий, которая защищает пенсионные накопления от потерь в случае финансовых кризисов или банкротства пенсионного фонда

Также существует система распределения, как, например, в России, Германии или Японии, когда взносы работающих сегодня граждан идут на выплату сегодняшним пенсионерам

Источник данных — Global SWF

Ещё мы писали про пенсии и пенсионный возраст в мире:
Средний возраст фактического выхода на пенсию в странах Европы, 2020
Ожидаемая продолжительность жизни на момент выхода на пенсию в России и США, 1959–2023
Как соотносятся ожидаемая продолжительность жизни и пенсионный возраст в странах G20, 2023
Разница между пенсионным возрастом и ожидаемой продолжительностью жизни в европейских странах
Уровень заработной платы в зависимости от образования и часов работы в США, 2021 (Nathan Yau)

На первой диаграмме — доля тех, кто зарабатывает меньше (серый) и больше (зелёный) 100 тысяч $ с разбивкой на уровень образования. На второй — те же данные с разбивкой на число рабочих часов в неделю

Источник данных — 2021 American Community Survey

Другие данные по производительности труда:
Сколько часов в неделю в среднем работают американцы с различным уровнем дохода, 2022
Среднее число рабочих часов и средняя заработная плата в неделю в странах ОЭСР, 2022
Производительность труда и реальная медианная заработная плата в странах ОЭСР, 1995–2013