Системный Блокъ
10.8K subscribers
241 photos
2 videos
1 file
846 links
«Системный Блокъ» — издание о цифровых технологиях в культуре, искусстве, образовании и обществе.

Финалист премии «Просветитель»

sysblok.ru
vk.com/sysblok
fb.com/sysblok
instagram.com/sysblok/

Присоединяйтесь к команде: sysblok.ru/join
Download Telegram
Что мы узнали об ударении в русском языке и о наивной поэзии из корпуса stihi.ru

Подкорпус Национального корпуса русского языка, в котором можно изучать ударения русских слов, содержит произведения поэтов-любителей с сайта Стихи.ру. Каким образом они могут быть полезны для науки — читайте в нашем материале.

Кратко: о чем статья?

Стихи.ру — старейший русскоязычный сайт, на котором могут публиковаться наивные (непрофессиональные) поэты. Их произведения не проходят специальной редактуры и находятся в открытом доступе, а ещё у них есть важная особенность — ориентация на школьные стихи. Авторы-любители зачастую создают нечто похожее на то, что проходят на уроках литературы, поэтому ученые предположили, что автоматически предсказывать ударение для таких текстов должно быть очень удобно. Так и оказалось.

Хотя в некоторых текстах силлабо-тоническое стихосложение нарушалось. Впрочем, объяснялось это не переменой размера внутри одного стихотворения, а простыми ошибками. Так что произведения, в которых больше 30% строк содержали нарушения метра, ученые просто не стали добавлять в корпус.

Подробнее об отборе текстов и о том, как специально обученная программа научилась расставлять ударения, можно узнать из полной версии материала на сайте.

Время чтения: 6,5 минут.
Плюс «спецоперация» минус «свобода»: пример количественного анализа корпусов СМИ

С 24 февраля 2022 прошло полтора года, которые оставили явный цифровой след, в том числе в новостных интернет-медиа. Если вы ежедневно читали хотя бы какие-то новости в Telegram, то количество слов, просмотренных вами за это время, будет равняться числу слов в романе Льва Толстого «***** и ***».

При этом какой бы источник вы ни выбрали, мы утверждаем, что он описывал явления и события иначе, чем другие СМИ. И у нас есть инструментарий, чтобы это доказать. О том, как исследовать такие различия с помощью самых простых средств вычислительной лингвистики, — в материале «Системного Блока».

Предварительное замечание: ни издание «Системный Блокъ», ни автор статьи не аффилированы с какими-либо СМИ, тексты которых стали материалом для этого корпусного исследования. При этом мы подчёркиваем, что анализировались не столько тексты, сколько декомпозированные множества слов и словосочетаний. Статья не содержит ни одной прямой цитаты и/или ссылки на материалы каких-либо нежелательных организаций.

Кратко: о чем статья?

Главный канон журналистики — объективность, но любое медиа выражает себя через текст и формирует собственный дискурс. Отказавшись от амбициозной задачи проанализировать весь ландшафт российских СМИ в период с августа 2020 до августа 2023 (т. е. полтора года до 24 февраля 2022 и полтора года после), мы решили выбрать и сравнить между собой одно государственное и одно либеральное медиа. При этом оба отвечали четырем одинаковым критериям.

Все четыре корпуса составили примерно 7,5 миллионов слов, но их распределение неравномерно. После февраля 2022 года провластное медиа выпустило меньше новостей, чем за то же время «до», хотя средняя длина новости немного возросла. В альтернативном СМИ — наоборот: и новостей, и текста стало больше.

И хотя многие наиболее частотные слова можно найти в обоих СМИ (среди них, например, «сообщать», «военный» и «российский»), у множества слов и фраз встречаемость в разных медиа отличалась в десятки и даже сотни раз. Более того, если визуализировать корпус каждого медиа в виде облака слов, мы увидим две совершенно разные языковые реальности.

Подробнее об очевидных и неочевидных выводах «Системного Блока», а также о том, по каким критериям подбирались СМИ, можно узнать из полного текста статьи. В ней же вы найдете заготовки, благодаря которым можно повторить, дополнить или опровергнуть наши выводы без необходимости писать код.

Время чтения: 24,5 минуты.
Программисток и программистовс праздником!

13 сентября отмечается День программиста. Сегодня в этой профессии больше мужчин, чем женщин, но так было не всегда. Например, во времена Ады Лавлейс 100% программистов были женщинами 😆

Мы решили вспомнить тех программисток, которые положили начало развитию IT и вычислительной техники. Этим мы хотим вдохновить больше девушек и женщин пойти в програмирование.

Кроме Ады Лавлейс это адмирал и программистка Грейс Хоппер, разработчица кода для лунного «Аполлона-11» Маргарет Гамильтон, создательница автокода Кэтлин Бут, изобретательница протокола STP Радья Перлман и создательница одного из первых высокоуровневых языков программирования Екатерина Ющенко.

А каких женщин-программисток знаете вы? Напишите в комментариях
Государственный музей Востока оцифровал Коран{ы}

«Московские Кораны» — digital-коллекция оцифрованных списков Корана XI–XIX вв., проект Государственного музея Востока. Все файлы доступны для скачивания, а тем, кто мало знает об арабской культуре, будет интересно заглянуть в лекторий и глоссарий. 

Кратко: о чем статья?

Несмотря на монолитность текста Священного Писания мусульман, художественные традиции оформления Корана варьируются в зависимости от региона. В 2022 году Государственный музей Востока открыл выставку «Московские Кораны», на которой были представлены 40 коранических списков различных редакций X–XIX вв. Дополнением к выставке стал одноимённый виртуальный проект, который позволяет увидеть 17 списков Корана в художественных редакциях Ирана, Индии, Турции, Узбекистана и Средней Азии.

Благодаря проекту оцифрованные редакции Корана можно напечатать, скачать и рассмотреть детально. А ещё любой желающий может посмотреть мини-лекции куратора выставки, прочитать сопутствующий каждому видео текст и познакомиться с глоссарием арабских слов, часто встречающихся в контексте Корана.

Подробнее о «Московских Коранах» и возможностях, которые они открывают для исследователей и других посетителей, узнаете из полного текста статьи.

Время чтения: 3,5 минуты.
Персоналистcкие диктатуры, как они живут и как погибают

Половина диктатур в мире — персоналистские. Именно они наименее склонны к демократизации и чаще других режимов начинают и эскалируют вооруженные конфликты.

Что мы знаем о персоналистских авторитарных режимах, диктатурах и возможностях перехода к демократии? Разбираемся с политологом Эрикой Франц, специалисткой по авторитарным режимам.
Что вы знаете об абьюзерах: тест об участниках домашнего насилия

Некоторое время назад мы предлагали вам пройти тест о домашнем и партнерском насилии и вспомнить, кто и как часто с ним сталкивается. В новом тесте разбираемся с абьюзом и с авторами насилия.

Что заставляет человека жестоко обращаться с близкими? Какие предпосылки могут быть у такого поведения? Неужели абьюзер — это приговор?
Юдифь и Саломея: как мифические девицы искусство делили

Помните ли вы истории двух библейских героинь Юдифь и Саломеи? C помощью Викиданных мы выяснили, какая из двух героинь пользуется большей популярностью, и попытались понять почему. Всё самое главное — в наших карточках, а подробности — в этом посте.