Рациональные числа
25.2K subscribers
6.25K photos
216 videos
228 files
2.99K links
Понимание мира через данные

Собираем статистику и данные из разных областей. Минимум оценок и интерпретаций, максимум данных и фактов

Чат канала: @rationalchat

http://rationalnumbers.ru

По рекламе: @kgreenmedia

Автор: @kirillgreen

№ 4939514230
Download Telegram
Политическая ориентация 24 крупнейших языковых моделей (David Rozado)

В статье приведено краткое изложение анализа политических предпочтений, заложенных в большие языковые модели (Large Language Models или LLMs). Исследователи провели 11 тестов с 24 крупнейшими разговорными ботами как с закрытым, так и с открытым исходным кодом

Согласно результатам, ответы большинства LLM на вопросы с политическим подтекстом демонстрируют левоцентристскую точку зрения (картинка 1)

В четырёх других тестах на политическую ориентацию, отражающих степень согласия с политическими партиями или идеологиями, аналогичные результаты (картинка 2)

Интересным исключением оказались результаты прохождения теста Нолана — ответы большинства LLM были политически умеренными (картинка 3). Другие тесты по-прежнему демонстрируют, что языковые модели дают ответы с левым уклоном

Также авторы статьи показывают, что LLM можно легко направлять в области политического спектра при помощи контролируемой тонкой настройки (supervised fine-tuning или SFT). При помощи файн-тюнинга исследователи создали три модели: LeftWingGPT, RightWingGPT и DepolarizingGPT. Каждая из моделей впоследствии давала ответы с явным уклоном в ту или иную идеологию (картинка 4)

Другие наши публикации про языковые модели и индустрию ИИ:
Индустрия искусственного интеллекта в числах, 2010–2022
Как развивалась индустрия генеративного ИИ, 2014–2023
Как хорошо справляются с экзаменами GPT-3.5 и GPT-4
Как менялось число параметров у больших языковых моделей, 2018–2023
Снижение числа просмотров крупных российских блогеров на YouTube в начале августа (New Media 1, 2)

В середине июля 2024 года российские власти начали «замедлять» работу YouTube на территории России без полной блокировки. Мотивируют они эту меру цензурой видеохостинга: руководство YouTube с 2020 года удалило более 200 каналов российских СМИ и блогеров. 173 из них были удалены за последние два года

New Media в своём исследовании сравнили число просмотров с 29 июля по 4 августа и с 5 по 11 августа. За этот период суммарное число просмотров 62 российских блогеров с 5+ миллионами подписчиков упало в среднем на 20%

Вот некоторые блогеры и процент падения их просмотров неделя к неделе:
— Miss Katy (25 млн подписчиков): -93%
— Познаватель (20 млн): -74%
— TheBrianMaps (18 млн): -62%
— tuzelity Shuffle (36 млн): -61%
— Хабиб (9 млн): -58%
— А4 (65 млн подписчиков): -55%
— Владус (9 млн): -51%
— Маша и Медведь (49 млн): -50%
— Дима Масленников (18 млн): -33%

Были и блогеры, просмотры которых упали незначительно или вовсе выросли за этот период:
— Wylsacom (11 млн): -8%
— Chapitosiki (26 млн): -3%
— EdisonPts (17 млн): +14%
— Compot (16 млн): +19%

В России уже применяли подобную меру: в 2021 году власти «замедлили» Twitter, а в 2022 году — Facebook и Instagram. Позже эти ресурсы были полностью заблокированы и стали доступны только из-под VPN

Источник данных — JagaJam

Ещё мы писали о влиянии блокировок соцсетей российскими властям на трафик в интернете:
Динамика месячных охватов российской аудитории в 6 соцсетях, октябрь 2021–2023
Как изменилась активность в социальных медиа в России за год с октября 2021 по октябрь 2022
Как менялось число активных авторов в 8 соцсетях, февраль 2022 – август 2023
Темпы роста Телеграма в России, 2017–2022
Как часто, кому и сколько чаевых оставляют американцы и европейцы, 2023 (YouGov)

На диаграммах — часть результатов опроса, проведённого в мае 2023 года среди 10162 людей из США и 7 стран Европы. Исследователи узнали, как часто люди из этих стран оставляют чаевые в зависимости от типа заведения и уровня обслуживания, чем мотивировано их желание оставлять чаевые, и какой % от чека обычно составляет размер их чаевых

Все результаты опроса — в исследовании

Ещё про культуру чаевых:
Чаевые таксистам в зависимости от пола
В каком возрасте мужчины и женщины заводили детей на протяжении 10000 поколений (Phys.org)

Сейчас учёные способны предсказать возраст, когда люди заводят детей, опираясь на типы мутаций в ДНК, которые дети наследуют у своих родителей. В исследовании они экстраполировали эти показатели, чтобы получить приближённые данные для людей, живших 250 тысяч лет назад

На первой диаграмме указан возраст, когда мужчины (синий) и женщины (красный) становились родителями. На второй — разница этого возраста между полами. По горизонтали указано количество поколений и лет тому назад

Ещё про рождаемость в мире:
Динамика рождаемости в мире, 1950–2020
В каком месяце рождается больше всего детей в странах мира
Динамика детской смертности по странам мира, 1990–2017
В каком возрасте рожают детей в США, 2016–2020
Эффект Даннинга-Крюгера — автокорреляция

Специально для читателей нашего канала мы перевели статью Блейра Фикса о том, почему эффект Даннинга-Крюгера — просто автокорреляция, то есть корреляция переменной с самой собой. Автор подробно объясняет природу автокорреляции, находит её в популярном эффекте, воспроизводит ошибку учёных, описывая каждый шаг, и наглядно демонстрирует причины, по которым эту ошибку не замечали более 15 лет

Читать на нашем сайте
лимиты-телеграма.png
1.1 MB
Все лимиты Телеграма в одном месте

Какой максимальный размер отправляемого файла? А количество видимых сообщений? Сколько можно создавать каналов? А ботов? Сколько можно добавлять участников в группы? Насколько премиум-подписка увеличивает эти лимиты?

Ответы на все аналогичные вопросы собраны командой @tginfo в одном месте и регулярно обновляются: limits.tginfo.me

Больше данных по Телеграму:
Доля 4 крупнейших мессенджеров на мировом рынке, 2018–2022
Как росло MAU (число активных пользователей в месяц) Телеграма, 2014–2024
Темпы роста Телеграма в России, 2017–2022
Исследование российской аудитории Телеграма, 2023
Рост числа российских телеграм-каналов по категориям, 2022
Влияние картинки на вёрстку файла MS Word

#рацкек
Как месяц рождения влияет на успехи в спорте (Тинькофф Журнал)

Эффект относительного возраста — это непропорциональное распределение спортсменов по месяцу рождения. Связано это с тем, что детей в спортивных академиях определяют в сборные по году рождения. Дети, родившиеся в январе и декабре, будут заниматься вместе при разнице в 11 месяцев. Для 30-летнего человека это всего 3% прожитой жизни, а для 5-летнего — 18%, поэтому разница в развитии часто бывает ощутимой. Позже эта разница может определять карьеру спортсмена

Впервые этот эффект обнаружили канадские учёные, которые обратили внимание, что среди квебекских хоккеистов непропорционально много родившихся в начале года. В 1985 вышла другая статья, в которой описывается аналогичная ситуация в американском хоккее. Такие же результаты дало исследование российских футболистов в 2019 году

На диаграммах — данные 11 тысяч российских спортсменов, родившихся после 1980 года. Примечательно, что эффект относительного возраста проявляется сильнее в командных видах спорта и особенно в детском возрасте. Ранее мы писали о таком же эффекте в образовательной системе

Источники данных: популярность дней рождения, расчёты Т⁠⁠—⁠⁠Ж

Больше статистики по спортсменам:
Распределение 1583 олимпийских спортсменов по росту
Распределение игроков НФЛ США по росту и весу, 1920–2014