Системный Блокъ
8.83K subscribers
239 photos
2 videos
1 file
800 links
«Системный Блокъ» — издание о цифровых технологиях в культуре, искусстве, образовании и обществе.

Финалист премии «Просветитель»

sysblok.ru
vk.com/sysblok
fb.com/sysblok
instagram.com/sysblok/

Присоединяйтесь к команде: sysblok.ru/join
Download Telegram
«Системному Блоку» 5 лет! Итоги работы — в цифрах

Системному Блоку исполнилось 5 лет. За это время мы превратились из маленького паблика в немаленькое медиа, которое вещает из каждого утюга. В разных соцсетях к нам суммарно пришли около 150000 читателей (спасибо вам, что вы с нами!).

Мы опубликовали на нашем сайте больше 1000 материалов, устроили практику для сотен студентов, помогли провести десятки пар в университетах… И все это с нулем бюджета и на чистом волонтерстве. На карточках — итоги 5 лет нашей работы. Если хотите поучаствовать — подключайтесь.
Тест: какая летняя открытка вам подходит?

Есть два способа сохранить на память уходящее лето: приготовить варенье и получить открытку. Варенье мы вам подарить не можем, а открытку можем. В первый осенний день пройдите наш серьезный психологический тест и получите послание из лета из коллекции проекта «Пишу тебе». Мы подобрали их специально для вас!
Фонограммархив для науки: Светлана Подрезова о коллекции аудиозаписей Пушкинского Дома и работе с источниками

Как связаны Блок, Есенин, Ахматова и Гумилёв с историей крупнейшей коллекции этнографических аудиозаписей? Что происходит, если идеология вмешивается в научный процесс? Почему ученые, собирающие звуковые свидетельства культуры, не стремятся публиковать свои материалы? Где вступают в противоречия этические принципы и идеология открытых данных? Об этом в интервью «Системному Блоку» рассказывает Светлана Подрезова, заведующая Фонограммархивом Пушкинского Домаа (ИРЛИ РАН).

Кратко: о чём интервью?

Существует стереотипное представление о скучной архивной работе: груды однотипных документов, пыль прошлых десятилетий, выцветающие рукописи, состоящие из непонятных закорючек, и маленькие открытия, интересные узким специалистам. Но Светлана Подрезова представляет историю и работу одного из самых необычных научно-исследовательских отделов Пушкинского Дома как увлекательный исследовательский опыт.

Первый шаг при каталогизации любой из звуковых коллекций (особенно самых ранних ― конца XIX–начала XX веков) ― обращение к истории ее появления. И уже здесь можно сделать открытие. Например, что идея изучить живое слово, художественную речь и интонацию через авторское чтение поэтов и писателей принадлежала Гумилеву, но реализовали её в 1920 году, записав Блока.

Сам фонограммархив был основан в 1927 году, а в конце 1938-го было окончательно установлено, что фольклористика — раздел литературоведения, не этнографии. При этом в работу архива постоянно вмешивалась политика. Например, в середине 1930-х сотрудники Отдела фольклора и Фонограммархива работали над большими темами, посвященными песням народов СССР (были подготовлены несколько антологий), фольклору рабочих, русской революционной песне. А в 2000-ые годы сотрудники Фонограммархива практически перестали ездить в экспедиции.

О том, с чем были связаны эти изменения, какие ещё эпохи были в истории архива и почему людям иногда кажется, что работники архива — «злодеи-музыковеды», читайте в полном тексте интервью.

Время чтения: 29 минут.
ChatGPT стал работать хуже? Часть 1

В марте этого года вышла новая версия популярного чат-бота от компании OpenAI. Разработчики представляли ее как прорыв в сфере текстовых помощников и даже сделали доступ к новой технологии платным (более старая версия является бесплатной с момента появления). Однако сейчас главные новости про ChatGPT — это многочисленные сообщения пользователей о том, что новая версия вскоре после выхода стала работать намного хуже.

Мы решили проверить, заметны ли отличия между разными версиями ChatGPT, и задали им вопрос: «Как научиться скорочтению?», попросив сократить ответ до семи строк и включить туда только неочевидные советы. Результаты запросов вы можете увидеть ниже; попробуйте угадать, где ответ более новой версии, а где — «старой».

Текст №1
Скорочтение требует практики и осознанности:
1. Минимизируйте подвижки глаз, используя указатель.
2. Читайте целыми фразами, а не слово за словом.
3. Избегайте произношения слов в уме (субвокализация).
4. Используйте специализированные инструменты и приложения для тренировки.
5. Постепенно увеличивайте сложность материалов чтения.
6. Регулярно оценивайте своё понимание текста, а не только скорость.
7. Будьте настойчивы и терпеливы в обучении.

Текст №2
1. Уберите субвокализацию: Прекратите произносить слова в уме.
2. Используйте палец: Ведите им под текстом, это ускоряет движение глаз.
3. Развивайте периферийное зрение: Смотрите на целые фразы, не только на слова.
4. Практикуйте периодически: Регулярная практика улучшает скорость.
5. Увеличивайте темп постепенно: Не жертвуйте пониманием.
6. Изучайте слова: Расширьте словарный запас для быстрого распознавания.
7. Выбирайте подходящий текст: Структурированный и понятный контекст облегчит чтение.
Более новая версия ChatGPT написала
Anonymous Quiz
45%
Текст №1
55%
Текст №2
ChatGPT стал работать хуже? Ответ исследователей. Часть 2

ChatGPT — основанный на работе нейросетей чат-бот — появился в ноябре 2022 года и быстро завоевал популярность у пользователей. Сейчас его даже официально используют в работе некоторые корпорации — например, Bing и Slack — а Coca-Cola тестирует возможности бота для помощи в маркетинге.

«Под капотом» у ChatGPT две языковых модели: пользователи могут выбирать между GPT-3.5 и GPT-4 (последняя, впрочем, доступна только по платной подписке). Про «третью» GPT мы подробно писали в этой статье, а четвертая версия была презентована создателями как более продвинутая — лучше отвечает на запросы, знает больше языков и даже может работать с изображениями. На момент выпуска (в марте этого года), согласно проведенным компанией-разработчиком тестам, GPT-4 действительно была гораздо эффективнее предыдущей версии. Однако уже спустя пару месяцев пользователи отметили, что чат-бот стал отвечать гораздо хуже. Проблемой заинтересовались исследователи из Стэнфорда и Беркли, и в июле вышла статья, согласно которой с новыми версиями поведение GPT-4 действительно может значительно меняться (не всегда — к лучшему). Авторы статьи связывают эти изменения с обновлениями нейросетей, которые проводила создавшая их компания OpenAI ради улучшения показателей в некоторых типах задач. В то же время, методология исследования вызывает некоторые вопросы, так что окончательного вердикта об эволюции (или деградации) GPT-4 придется еще подождать.
Будь мужиком! Маскулинность в эпоху цифровизации и новой этики

Развиваясь, общество постепенно меняет представления о мужественности и женственности. Сегодня «маскулинность» (от лат. masculinus, мужской) стала особенно острым предметом обсуждения и переосмысления. О том, как эпоха цифровизации повлияла на концепцию маскулинности, — в материале «Системного Блока».

Кратко: о чем статья?

В современном обществе существует множество гендерных стереотипов о том, каким «должен» быть «настоящий» мужчина. Согласно опросу ВЦИОМ, проведенному в 2021 году, 19% россиян считают самыми ценными мужскими качествами честность, искренность и прямоту. Не менее важные аспекты роли связаны с отцовством и военной службой.

Со временем стандарты мужества установились и в онлайн-среде, поэтому, согласно исследованию ученых из СПбГУ, мужчины часто создают в виртуальном пространстве «улучшенные образы себя». Как правило, они добавляют в описание своего профиля для онлайн-знакомств больше информации, чем женщины, но реже используют эмодзи: они присутствуют в 24% мужских профилей и 38% женских.

При этом в современном мире есть и «токсичная маскулинность», которая ассоциируется с брутальностью, жестокостью, цинизмом и высокомерием по отношению к женщинам. Новое понимание мужественности больше не сводится к силе, выносливости и воле, а, наоборот, делает акцент на созидании и создании чего-то нового. Теперь мужчине можно и нужно проявлять эмоции, быть чутким и заботливым. 

Чтобы узнать о том, какие страхи свойственны мужчинам в интернет-среде, в какой стране мужчины обязательно уходят в декретный отпуск и можно ли сделать это в России (спойлер: можно, но этим мало кто пользуется) — читайте полную версию статьи.

Время чтения: 8 минут.
Тест: Что вы знаете о проблеме домашнего и партнёрского насилия 

Чем партнерское насилие отличается от домашнего? Как правильно называть того, кто его свершает? Почему кто-то сталкивается с насилием, а кто-то — нет? Пройдите тест и узнайте актуальную информацию о ситуации с домашним насилием в России.
Шесть рукопожатий Владимира Маяковского

В год 130-летия со дня рождения Владимира Маяковского «Системный Блокъ» представляет цифровое исследование сети социальных связей в эпоху Серебряного века. Узнайте, к кому был близок Маяковский и кто с кем общался столетие назад! При помощи Gephi мы подготовили интерактивный граф на основе материалов архива мемуарных бесед «Устная история». 

Кратко: о чем статья?

Для этого материала мы исследовали социальные связи внутри культурного общества Серебряного века, сосредоточенного вокруг Маяковского. Чтобы это сделать, мы обратились к записям и транскрипциям бесед Виктора Дувакина — филолога и архивиста, который исследовал творчество поэта и общался со многими его современниками.

Благодаря ним на интерактивном графе с социальными связями Маяковского и его окружения оказались не только Лиля и Осип Брик, но и группа большевистстких лидеров. А ещё — придворное окружение Николая II.

Конечно, не все люди, оказавшиеся на графике, были приближены непосредственно к Маяковскому. Например, супруги Сосинские, как наиболее далёкие от общества Маяковского, организовали вокруг себя объёмный обособленный кластер связей, которые пересекаются с основной группой только через Максима Горького и Илью Эренбурга.

Создание такой «Сети рукопожатий» стало возможно благодаря применению цифровых методов к историко-литературному материалу, подробнее об этом — в полной версии материала.

Время чтения: 7 минут.
Что мы узнали об ударении в русском языке и о наивной поэзии из корпуса stihi.ru

Подкорпус Национального корпуса русского языка, в котором можно изучать ударения русских слов, содержит произведения поэтов-любителей с сайта Стихи.ру. Каким образом они могут быть полезны для науки — читайте в нашем материале.

Кратко: о чем статья?

Стихи.ру — старейший русскоязычный сайт, на котором могут публиковаться наивные (непрофессиональные) поэты. Их произведения не проходят специальной редактуры и находятся в открытом доступе, а ещё у них есть важная особенность — ориентация на школьные стихи. Авторы-любители зачастую создают нечто похожее на то, что проходят на уроках литературы, поэтому ученые предположили, что автоматически предсказывать ударение для таких текстов должно быть очень удобно. Так и оказалось.

Хотя в некоторых текстах силлабо-тоническое стихосложение нарушалось. Впрочем, объяснялось это не переменой размера внутри одного стихотворения, а простыми ошибками. Так что произведения, в которых больше 30% строк содержали нарушения метра, ученые просто не стали добавлять в корпус.

Подробнее об отборе текстов и о том, как специально обученная программа научилась расставлять ударения, можно узнать из полной версии материала на сайте.

Время чтения: 6,5 минут.
Плюс «спецоперация» минус «свобода»: пример количественного анализа корпусов СМИ

С 24 февраля 2022 прошло полтора года, которые оставили явный цифровой след, в том числе в новостных интернет-медиа. Если вы ежедневно читали хотя бы какие-то новости в Telegram, то количество слов, просмотренных вами за это время, будет равняться числу слов в романе Льва Толстого «***** и ***».

При этом какой бы источник вы ни выбрали, мы утверждаем, что он описывал явления и события иначе, чем другие СМИ. И у нас есть инструментарий, чтобы это доказать. О том, как исследовать такие различия с помощью самых простых средств вычислительной лингвистики, — в материале «Системного Блока».

Предварительное замечание: ни издание «Системный Блокъ», ни автор статьи не аффилированы с какими-либо СМИ, тексты которых стали материалом для этого корпусного исследования. При этом мы подчёркиваем, что анализировались не столько тексты, сколько декомпозированные множества слов и словосочетаний. Статья не содержит ни одной прямой цитаты и/или ссылки на материалы каких-либо нежелательных организаций.

Кратко: о чем статья?

Главный канон журналистики — объективность, но любое медиа выражает себя через текст и формирует собственный дискурс. Отказавшись от амбициозной задачи проанализировать весь ландшафт российских СМИ в период с августа 2020 до августа 2023 (т. е. полтора года до 24 февраля 2022 и полтора года после), мы решили выбрать и сравнить между собой одно государственное и одно либеральное медиа. При этом оба отвечали четырем одинаковым критериям.

Все четыре корпуса составили примерно 7,5 миллионов слов, но их распределение неравномерно. После февраля 2022 года провластное медиа выпустило меньше новостей, чем за то же время «до», хотя средняя длина новости немного возросла. В альтернативном СМИ — наоборот: и новостей, и текста стало больше.

И хотя многие наиболее частотные слова можно найти в обоих СМИ (среди них, например, «сообщать», «военный» и «российский»), у множества слов и фраз встречаемость в разных медиа отличалась в десятки и даже сотни раз. Более того, если визуализировать корпус каждого медиа в виде облака слов, мы увидим две совершенно разные языковые реальности.

Подробнее об очевидных и неочевидных выводах «Системного Блока», а также о том, по каким критериям подбирались СМИ, можно узнать из полного текста статьи. В ней же вы найдете заготовки, благодаря которым можно повторить, дополнить или опровергнуть наши выводы без необходимости писать код.

Время чтения: 24,5 минуты.
Программисток и программистовс праздником!

13 сентября отмечается День программиста. Сегодня в этой профессии больше мужчин, чем женщин, но так было не всегда. Например, во времена Ады Лавлейс 100% программистов были женщинами 😆

Мы решили вспомнить тех программисток, которые положили начало развитию IT и вычислительной техники. Этим мы хотим вдохновить больше девушек и женщин пойти в програмирование.

Кроме Ады Лавлейс это адмирал и программистка Грейс Хоппер, разработчица кода для лунного «Аполлона-11» Маргарет Гамильтон, создательница автокода Кэтлин Бут, изобретательница протокола STP Радья Перлман и создательница одного из первых высокоуровневых языков программирования Екатерина Ющенко.

А каких женщин-программисток знаете вы? Напишите в комментариях
Государственный музей Востока оцифровал Коран{ы}

«Московские Кораны» — digital-коллекция оцифрованных списков Корана XI–XIX вв., проект Государственного музея Востока. Все файлы доступны для скачивания, а тем, кто мало знает об арабской культуре, будет интересно заглянуть в лекторий и глоссарий. 

Кратко: о чем статья?

Несмотря на монолитность текста Священного Писания мусульман, художественные традиции оформления Корана варьируются в зависимости от региона. В 2022 году Государственный музей Востока открыл выставку «Московские Кораны», на которой были представлены 40 коранических списков различных редакций X–XIX вв. Дополнением к выставке стал одноимённый виртуальный проект, который позволяет увидеть 17 списков Корана в художественных редакциях Ирана, Индии, Турции, Узбекистана и Средней Азии.

Благодаря проекту оцифрованные редакции Корана можно напечатать, скачать и рассмотреть детально. А ещё любой желающий может посмотреть мини-лекции куратора выставки, прочитать сопутствующий каждому видео текст и познакомиться с глоссарием арабских слов, часто встречающихся в контексте Корана.

Подробнее о «Московских Коранах» и возможностях, которые они открывают для исследователей и других посетителей, узнаете из полного текста статьи.

Время чтения: 3,5 минуты.