ChatGPT стал работать хуже? Ответ исследователей. Часть 2
ChatGPT — основанный на работе нейросетей чат-бот — появился в ноябре 2022 года и быстро завоевал популярность у пользователей. Сейчас его даже официально используют в работе некоторые корпорации — например, Bing и Slack — а Coca-Cola тестирует возможности бота для помощи в маркетинге.
«Под капотом» у ChatGPT две языковых модели: пользователи могут выбирать между GPT-3.5 и GPT-4 (последняя, впрочем, доступна только по платной подписке). Про «третью» GPT мы подробно писали в этой статье, а четвертая версия была презентована создателями как более продвинутая — лучше отвечает на запросы, знает больше языков и даже может работать с изображениями. На момент выпуска (в марте этого года), согласно проведенным компанией-разработчиком тестам, GPT-4 действительно была гораздо эффективнее предыдущей версии. Однако уже спустя пару месяцев пользователи отметили, что чат-бот стал отвечать гораздо хуже. Проблемой заинтересовались исследователи из Стэнфорда и Беркли, и в июле вышла статья, согласно которой с новыми версиями поведение GPT-4 действительно может значительно меняться (не всегда — к лучшему). Авторы статьи связывают эти изменения с обновлениями нейросетей, которые проводила создавшая их компания OpenAI ради улучшения показателей в некоторых типах задач. В то же время, методология исследования вызывает некоторые вопросы, так что окончательного вердикта об эволюции (или деградации) GPT-4 придется еще подождать.
ChatGPT — основанный на работе нейросетей чат-бот — появился в ноябре 2022 года и быстро завоевал популярность у пользователей. Сейчас его даже официально используют в работе некоторые корпорации — например, Bing и Slack — а Coca-Cola тестирует возможности бота для помощи в маркетинге.
«Под капотом» у ChatGPT две языковых модели: пользователи могут выбирать между GPT-3.5 и GPT-4 (последняя, впрочем, доступна только по платной подписке). Про «третью» GPT мы подробно писали в этой статье, а четвертая версия была презентована создателями как более продвинутая — лучше отвечает на запросы, знает больше языков и даже может работать с изображениями. На момент выпуска (в марте этого года), согласно проведенным компанией-разработчиком тестам, GPT-4 действительно была гораздо эффективнее предыдущей версии. Однако уже спустя пару месяцев пользователи отметили, что чат-бот стал отвечать гораздо хуже. Проблемой заинтересовались исследователи из Стэнфорда и Беркли, и в июле вышла статья, согласно которой с новыми версиями поведение GPT-4 действительно может значительно меняться (не всегда — к лучшему). Авторы статьи связывают эти изменения с обновлениями нейросетей, которые проводила создавшая их компания OpenAI ради улучшения показателей в некоторых типах задач. В то же время, методология исследования вызывает некоторые вопросы, так что окончательного вердикта об эволюции (или деградации) GPT-4 придется еще подождать.
Будь мужиком! Маскулинность в эпоху цифровизации и новой этики
Развиваясь, общество постепенно меняет представления о мужественности и женственности. Сегодня «маскулинность» (от лат. masculinus, мужской) стала особенно острым предметом обсуждения и переосмысления. О том, как эпоха цифровизации повлияла на концепцию маскулинности, — в материале «Системного Блока».
Кратко: о чем статья?
В современном обществе существует множество гендерных стереотипов о том, каким «должен» быть «настоящий» мужчина. Согласно опросу ВЦИОМ, проведенному в 2021 году, 19% россиян считают самыми ценными мужскими качествами честность, искренность и прямоту. Не менее важные аспекты роли связаны с отцовством и военной службой.
Со временем стандарты мужества установились и в онлайн-среде, поэтому, согласно исследованию ученых из СПбГУ, мужчины часто создают в виртуальном пространстве «улучшенные образы себя». Как правило, они добавляют в описание своего профиля для онлайн-знакомств больше информации, чем женщины, но реже используют эмодзи: они присутствуют в 24% мужских профилей и 38% женских.
При этом в современном мире есть и «токсичная маскулинность», которая ассоциируется с брутальностью, жестокостью, цинизмом и высокомерием по отношению к женщинам. Новое понимание мужественности больше не сводится к силе, выносливости и воле, а, наоборот, делает акцент на созидании и создании чего-то нового. Теперь мужчине можно и нужно проявлять эмоции, быть чутким и заботливым.
Чтобы узнать о том, какие страхи свойственны мужчинам в интернет-среде, в какой стране мужчины обязательно уходят в декретный отпуск и можно ли сделать это в России (спойлер:можно, но этим мало кто пользуется ) — читайте полную версию статьи.
Время чтения: 8 минут.
Развиваясь, общество постепенно меняет представления о мужественности и женственности. Сегодня «маскулинность» (от лат. masculinus, мужской) стала особенно острым предметом обсуждения и переосмысления. О том, как эпоха цифровизации повлияла на концепцию маскулинности, — в материале «Системного Блока».
Кратко: о чем статья?
В современном обществе существует множество гендерных стереотипов о том, каким «должен» быть «настоящий» мужчина. Согласно опросу ВЦИОМ, проведенному в 2021 году, 19% россиян считают самыми ценными мужскими качествами честность, искренность и прямоту. Не менее важные аспекты роли связаны с отцовством и военной службой.
Со временем стандарты мужества установились и в онлайн-среде, поэтому, согласно исследованию ученых из СПбГУ, мужчины часто создают в виртуальном пространстве «улучшенные образы себя». Как правило, они добавляют в описание своего профиля для онлайн-знакомств больше информации, чем женщины, но реже используют эмодзи: они присутствуют в 24% мужских профилей и 38% женских.
При этом в современном мире есть и «токсичная маскулинность», которая ассоциируется с брутальностью, жестокостью, цинизмом и высокомерием по отношению к женщинам. Новое понимание мужественности больше не сводится к силе, выносливости и воле, а, наоборот, делает акцент на созидании и создании чего-то нового. Теперь мужчине можно и нужно проявлять эмоции, быть чутким и заботливым.
Чтобы узнать о том, какие страхи свойственны мужчинам в интернет-среде, в какой стране мужчины обязательно уходят в декретный отпуск и можно ли сделать это в России (спойлер:
Время чтения: 8 минут.
Системный Блокъ
Мужчина 21 века. Каким он должен быть?
Могут ли информационные технологии повлиять на традиционное представление о мужественности? Как сегодня меняется концепция маскулинности? Обо всём этом – в материале «Системного Блока».
Тест: Что вы знаете о проблеме домашнего и партнёрского насилия
Чем партнерское насилие отличается от домашнего? Как правильно называть того, кто его свершает? Почему кто-то сталкивается с насилием, а кто-то — нет? Пройдите тест и узнайте актуальную информацию о ситуации с домашним насилием в России.
Чем партнерское насилие отличается от домашнего? Как правильно называть того, кто его свершает? Почему кто-то сталкивается с насилием, а кто-то — нет? Пройдите тест и узнайте актуальную информацию о ситуации с домашним насилием в России.
Системный Блокъ
Тест: что такое домашнее насилие?
Пройдите тест и узнайте актуальную информацию о ситуации с домашним насилием в России.
Шесть рукопожатий Владимира Маяковского
В год 130-летия со дня рождения Владимира Маяковского «Системный Блокъ» представляет цифровое исследование сети социальных связей в эпоху Серебряного века. Узнайте, к кому был близок Маяковский и кто с кем общался столетие назад! При помощи Gephi мы подготовили интерактивный граф на основе материалов архива мемуарных бесед «Устная история».
Кратко: о чем статья?
Для этого материала мы исследовали социальные связи внутри культурного общества Серебряного века, сосредоточенного вокруг Маяковского. Чтобы это сделать, мы обратились к записям и транскрипциям бесед Виктора Дувакина — филолога и архивиста, который исследовал творчество поэта и общался со многими его современниками.
Благодаря ним на интерактивном графе с социальными связями Маяковского и его окружения оказались не только Лиля и Осип Брик, но и группа большевистстких лидеров. А ещё — придворное окружение Николая II.
Конечно, не все люди, оказавшиеся на графике, были приближены непосредственно к Маяковскому. Например, супруги Сосинские, как наиболее далёкие от общества Маяковского, организовали вокруг себя объёмный обособленный кластер связей, которые пересекаются с основной группой только через Максима Горького и Илью Эренбурга.
Создание такой «Сети рукопожатий» стало возможно благодаря применению цифровых методов к историко-литературному материалу, подробнее об этом — в полной версии материала.
Время чтения: 7 минут.
В год 130-летия со дня рождения Владимира Маяковского «Системный Блокъ» представляет цифровое исследование сети социальных связей в эпоху Серебряного века. Узнайте, к кому был близок Маяковский и кто с кем общался столетие назад! При помощи Gephi мы подготовили интерактивный граф на основе материалов архива мемуарных бесед «Устная история».
Кратко: о чем статья?
Для этого материала мы исследовали социальные связи внутри культурного общества Серебряного века, сосредоточенного вокруг Маяковского. Чтобы это сделать, мы обратились к записям и транскрипциям бесед Виктора Дувакина — филолога и архивиста, который исследовал творчество поэта и общался со многими его современниками.
Благодаря ним на интерактивном графе с социальными связями Маяковского и его окружения оказались не только Лиля и Осип Брик, но и группа большевистстких лидеров. А ещё — придворное окружение Николая II.
Конечно, не все люди, оказавшиеся на графике, были приближены непосредственно к Маяковскому. Например, супруги Сосинские, как наиболее далёкие от общества Маяковского, организовали вокруг себя объёмный обособленный кластер связей, которые пересекаются с основной группой только через Максима Горького и Илью Эренбурга.
Создание такой «Сети рукопожатий» стало возможно благодаря применению цифровых методов к историко-литературному материалу, подробнее об этом — в полной версии материала.
Время чтения: 7 минут.
Системный Блокъ
Компьютерный анализ окружения Маяковского: изучаем социальные связи при помощи Digital Humanities
Узнайте, к кому был близок Владимир Маяковский и кто с кем общался в эпоху Серебряного века! В материале «Системного Блока» представлено цифровое исследование на основе материалов проекта «Устная история». Результат сетевого анализа данных – интерактивный…
Что мы узнали об ударении в русском языке и о наивной поэзии из корпуса stihi.ru
Подкорпус Национального корпуса русского языка, в котором можно изучать ударения русских слов, содержит произведения поэтов-любителей с сайта Стихи.ру. Каким образом они могут быть полезны для науки — читайте в нашем материале.
Кратко: о чем статья?
Стихи.ру — старейший русскоязычный сайт, на котором могут публиковаться наивные (непрофессиональные) поэты. Их произведения не проходят специальной редактуры и находятся в открытом доступе, а ещё у них есть важная особенность — ориентация на школьные стихи. Авторы-любители зачастую создают нечто похожее на то, что проходят на уроках литературы, поэтому ученые предположили, что автоматически предсказывать ударение для таких текстов должно быть очень удобно. Так и оказалось.
Хотя в некоторых текстах силлабо-тоническое стихосложение нарушалось. Впрочем, объяснялось это не переменой размера внутри одного стихотворения, а простыми ошибками. Так что произведения, в которых больше 30% строк содержали нарушения метра, ученые просто не стали добавлять в корпус.
Подробнее об отборе текстов и о том, как специально обученная программа научилась расставлять ударения, можно узнать из полной версии материала на сайте.
Время чтения: 6,5 минут.
Подкорпус Национального корпуса русского языка, в котором можно изучать ударения русских слов, содержит произведения поэтов-любителей с сайта Стихи.ру. Каким образом они могут быть полезны для науки — читайте в нашем материале.
Кратко: о чем статья?
Стихи.ру — старейший русскоязычный сайт, на котором могут публиковаться наивные (непрофессиональные) поэты. Их произведения не проходят специальной редактуры и находятся в открытом доступе, а ещё у них есть важная особенность — ориентация на школьные стихи. Авторы-любители зачастую создают нечто похожее на то, что проходят на уроках литературы, поэтому ученые предположили, что автоматически предсказывать ударение для таких текстов должно быть очень удобно. Так и оказалось.
Хотя в некоторых текстах силлабо-тоническое стихосложение нарушалось. Впрочем, объяснялось это не переменой размера внутри одного стихотворения, а простыми ошибками. Так что произведения, в которых больше 30% строк содержали нарушения метра, ученые просто не стали добавлять в корпус.
Подробнее об отборе текстов и о том, как специально обученная программа научилась расставлять ударения, можно узнать из полной версии материала на сайте.
Время чтения: 6,5 минут.
Системный Блокъ
Как устроено ударение в русском языке: ученые разбираются на данных stihi ru
Акцентологический подкорпус Национального корпуса русского языка, в котором можно изучать ударения русских слов, пополнили произведениями с сайта Стихи.ру.
Плюс «спецоперация» минус «свобода»: пример количественного анализа корпусов СМИ
С 24 февраля 2022 прошло полтора года, которые оставили явный цифровой след, в том числе в новостных интернет-медиа. Если вы ежедневно читали хотя бы какие-то новости в Telegram, то количество слов, просмотренных вами за это время, будет равняться числу слов в романе Льва Толстого «***** и ***».
При этом какой бы источник вы ни выбрали, мы утверждаем, что он описывал явления и события иначе, чем другие СМИ. И у нас есть инструментарий, чтобы это доказать. О том, как исследовать такие различия с помощью самых простых средств вычислительной лингвистики, — в материале «Системного Блока».
Предварительное замечание: ни издание «Системный Блокъ», ни автор статьи не аффилированы с какими-либо СМИ, тексты которых стали материалом для этого корпусного исследования. При этом мы подчёркиваем, что анализировались не столько тексты, сколько декомпозированные множества слов и словосочетаний. Статья не содержит ни одной прямой цитаты и/или ссылки на материалы каких-либо нежелательных организаций.
Кратко: о чем статья?
Главный канон журналистики — объективность, но любое медиа выражает себя через текст и формирует собственный дискурс. Отказавшись от амбициозной задачи проанализировать весь ландшафт российских СМИ в период с августа 2020 до августа 2023 (т. е. полтора года до 24 февраля 2022 и полтора года после), мы решили выбрать и сравнить между собой одно государственное и одно либеральное медиа. При этом оба отвечали четырем одинаковым критериям.
Все четыре корпуса составили примерно 7,5 миллионов слов, но их распределение неравномерно. После февраля 2022 года провластное медиа выпустило меньше новостей, чем за то же время «до», хотя средняя длина новости немного возросла. В альтернативном СМИ — наоборот: и новостей, и текста стало больше.
И хотя многие наиболее частотные слова можно найти в обоих СМИ (среди них, например, «сообщать», «военный» и «российский»), у множества слов и фраз встречаемость в разных медиа отличалась в десятки и даже сотни раз. Более того, если визуализировать корпус каждого медиа в виде облака слов, мы увидим две совершенно разные языковые реальности.
Подробнее об очевидных и неочевидных выводах «Системного Блока», а также о том, по каким критериям подбирались СМИ, можно узнать из полного текста статьи. В ней же вы найдете заготовки, благодаря которым можно повторить, дополнить или опровергнуть наши выводы без необходимости писать код.
Время чтения: 24,5 минуты.
С 24 февраля 2022 прошло полтора года, которые оставили явный цифровой след, в том числе в новостных интернет-медиа. Если вы ежедневно читали хотя бы какие-то новости в Telegram, то количество слов, просмотренных вами за это время, будет равняться числу слов в романе Льва Толстого «***** и ***».
При этом какой бы источник вы ни выбрали, мы утверждаем, что он описывал явления и события иначе, чем другие СМИ. И у нас есть инструментарий, чтобы это доказать. О том, как исследовать такие различия с помощью самых простых средств вычислительной лингвистики, — в материале «Системного Блока».
Предварительное замечание: ни издание «Системный Блокъ», ни автор статьи не аффилированы с какими-либо СМИ, тексты которых стали материалом для этого корпусного исследования. При этом мы подчёркиваем, что анализировались не столько тексты, сколько декомпозированные множества слов и словосочетаний. Статья не содержит ни одной прямой цитаты и/или ссылки на материалы каких-либо нежелательных организаций.
Кратко: о чем статья?
Главный канон журналистики — объективность, но любое медиа выражает себя через текст и формирует собственный дискурс. Отказавшись от амбициозной задачи проанализировать весь ландшафт российских СМИ в период с августа 2020 до августа 2023 (т. е. полтора года до 24 февраля 2022 и полтора года после), мы решили выбрать и сравнить между собой одно государственное и одно либеральное медиа. При этом оба отвечали четырем одинаковым критериям.
Все четыре корпуса составили примерно 7,5 миллионов слов, но их распределение неравномерно. После февраля 2022 года провластное медиа выпустило меньше новостей, чем за то же время «до», хотя средняя длина новости немного возросла. В альтернативном СМИ — наоборот: и новостей, и текста стало больше.
И хотя многие наиболее частотные слова можно найти в обоих СМИ (среди них, например, «сообщать», «военный» и «российский»), у множества слов и фраз встречаемость в разных медиа отличалась в десятки и даже сотни раз. Более того, если визуализировать корпус каждого медиа в виде облака слов, мы увидим две совершенно разные языковые реальности.
Подробнее об очевидных и неочевидных выводах «Системного Блока», а также о том, по каким критериям подбирались СМИ, можно узнать из полного текста статьи. В ней же вы найдете заготовки, благодаря которым можно повторить, дополнить или опровергнуть наши выводы без необходимости писать код.
Время чтения: 24,5 минуты.
Системный Блокъ
Количественный анализ текстов российских СМИ до и после 24 февраля
Как анализировать публикации в СМИ с помощью вычислительной лингвистики? Можно ли сопоставить «цифровые следы» разных медиа? Обо всём этом – в материале «Системного Блока».
Программисток и программистов — с праздником!
13 сентября отмечается День программиста. Сегодня в этой профессии больше мужчин, чем женщин, но так было не всегда. Например, во времена Ады Лавлейс 100% программистов были женщинами 😆
Мы решили вспомнить тех программисток, которые положили начало развитию IT и вычислительной техники. Этим мы хотим вдохновить больше девушек и женщин пойти в програмирование.
Кроме Ады Лавлейс это адмирал и программистка Грейс Хоппер, разработчица кода для лунного «Аполлона-11» Маргарет Гамильтон, создательница автокода Кэтлин Бут, изобретательница протокола STP Радья Перлман и создательница одного из первых высокоуровневых языков программирования Екатерина Ющенко.
А каких женщин-программисток знаете вы? Напишите в комментариях
13 сентября отмечается День программиста. Сегодня в этой профессии больше мужчин, чем женщин, но так было не всегда. Например, во времена Ады Лавлейс 100% программистов были женщинами 😆
Мы решили вспомнить тех программисток, которые положили начало развитию IT и вычислительной техники. Этим мы хотим вдохновить больше девушек и женщин пойти в програмирование.
Кроме Ады Лавлейс это адмирал и программистка Грейс Хоппер, разработчица кода для лунного «Аполлона-11» Маргарет Гамильтон, создательница автокода Кэтлин Бут, изобретательница протокола STP Радья Перлман и создательница одного из первых высокоуровневых языков программирования Екатерина Ющенко.
А каких женщин-программисток знаете вы? Напишите в комментариях
Государственный музей Востока оцифровал Коран{ы}
«Московские Кораны» — digital-коллекция оцифрованных списков Корана XI–XIX вв., проект Государственного музея Востока. Все файлы доступны для скачивания, а тем, кто мало знает об арабской культуре, будет интересно заглянуть в лекторий и глоссарий.
Кратко: о чем статья?
Несмотря на монолитность текста Священного Писания мусульман, художественные традиции оформления Корана варьируются в зависимости от региона. В 2022 году Государственный музей Востока открыл выставку «Московские Кораны», на которой были представлены 40 коранических списков различных редакций X–XIX вв. Дополнением к выставке стал одноимённый виртуальный проект, который позволяет увидеть 17 списков Корана в художественных редакциях Ирана, Индии, Турции, Узбекистана и Средней Азии.
Благодаря проекту оцифрованные редакции Корана можно напечатать, скачать и рассмотреть детально. А ещё любой желающий может посмотреть мини-лекции куратора выставки, прочитать сопутствующий каждому видео текст и познакомиться с глоссарием арабских слов, часто встречающихся в контексте Корана.
Подробнее о «Московских Коранах» и возможностях, которые они открывают для исследователей и других посетителей, узнаете из полного текста статьи.
Время чтения: 3,5 минуты.
«Московские Кораны» — digital-коллекция оцифрованных списков Корана XI–XIX вв., проект Государственного музея Востока. Все файлы доступны для скачивания, а тем, кто мало знает об арабской культуре, будет интересно заглянуть в лекторий и глоссарий.
Кратко: о чем статья?
Несмотря на монолитность текста Священного Писания мусульман, художественные традиции оформления Корана варьируются в зависимости от региона. В 2022 году Государственный музей Востока открыл выставку «Московские Кораны», на которой были представлены 40 коранических списков различных редакций X–XIX вв. Дополнением к выставке стал одноимённый виртуальный проект, который позволяет увидеть 17 списков Корана в художественных редакциях Ирана, Индии, Турции, Узбекистана и Средней Азии.
Благодаря проекту оцифрованные редакции Корана можно напечатать, скачать и рассмотреть детально. А ещё любой желающий может посмотреть мини-лекции куратора выставки, прочитать сопутствующий каждому видео текст и познакомиться с глоссарием арабских слов, часто встречающихся в контексте Корана.
Подробнее о «Московских Коранах» и возможностях, которые они открывают для исследователей и других посетителей, узнаете из полного текста статьи.
Время чтения: 3,5 минуты.
Системный Блокъ
Государственный музей Востока оцифровал Коран{ы} - Системный Блокъ
«Московские Кораны» — digital-коллекция оцифрованных списков Корана XI–XIX вв., проект Государственного музея Востока. Все файлы доступны для скачивания, а тем, кто мало знает об арабской культуре, будет интересно заглянуть в лекторий и глоссарий
Персоналистcкие диктатуры, как они живут и как погибают
Половина диктатур в мире — персоналистские. Именно они наименее склонны к демократизации и чаще других режимов начинают и эскалируют вооруженные конфликты.
Что мы знаем о персоналистских авторитарных режимах, диктатурах и возможностях перехода к демократии? Разбираемся с политологом Эрикой Франц, специалисткой по авторитарным режимам.
Половина диктатур в мире — персоналистские. Именно они наименее склонны к демократизации и чаще других режимов начинают и эскалируют вооруженные конфликты.
Что мы знаем о персоналистских авторитарных режимах, диктатурах и возможностях перехода к демократии? Разбираемся с политологом Эрикой Франц, специалисткой по авторитарным режимам.