Системный Блокъ
8.84K subscribers
239 photos
2 videos
1 file
800 links
«Системный Блокъ» — издание о цифровых технологиях в культуре, искусстве, образовании и обществе.

Финалист премии «Просветитель»

sysblok.ru
vk.com/sysblok
fb.com/sysblok
instagram.com/sysblok/

Присоединяйтесь к команде: sysblok.ru/join
Download Telegram
Как поздравляли с Рождеством 100, 50 и 10 лет назад?

7 января в России празднуют Рождество Христово — один из главных христианских праздников. Вспоминаем подборку открыток, которую «Пишу тебе» подготовил к прошлому рождеству. В этом посте делимся с вами текстами двух открыток, которые собрали волонтёры проекта.

🤓 Лучший совет

«Многоуважаемый Андрей Михайлович и Матрена Григорьевна! Поздравляю вас с праздником Р[ождеством] – Х[ристовым] и с наступающим Новым Годом, желаю в веселье и радости провести их и не нажить, опохмелившись, головной боли. Искренний доброжелатель, Иосиф Чернявский».

😎 Открытка из Бразилии

«Hi, my name is Ariane. I’m 11 years old and from Brazil-SC. My hobbies are swimming, reading, whatching [^watching] movies and sports. I love Harry Potter books. Happy Christmas».

Чтобы почитать ещё больше поздравлений, рассмотреть открытки и узнать комментарии участников «Пишу тебе» — смотрите полную подборку на сайте.
Милан или Тегеран: где отдыхали россияне в 2022 году

Россияне летают за границу, несмотря на санкции и ограниченное авиасообщение.  Помимо привычных и всегда популярных стран, в 2022 году прибавились и новые туристические направления. 

Кратко: о чём статья?

В 2022 году в разгар туристического сезона (июль, август, сентябрь) самыми часто посещаемыми странами стали: Турция, ОАЭ и Египет. Еще три года назад ситуация была иной: помимо Турции, россияне чаще всего посещали Грецию, Испанию, Италию и Тунис. 

Посещение шенгенских стран в туристический сезон упало на 99,6%, по сравнению с 2019 годом — даже несмотря на то, что сейчас все еще есть возможность получить шенгенскую визу, а курс евро упал до показателей 2017 года.

Туристическим открытием года можно считать Иран и Ирак: увеличение турпотока на 421% и 100%.

Узнать больше о причинах популярности этих направлений и посмотреть, насколько популярнее для туризма стали страны СНГ, можно в полной версии статьи на сайте.

Время чтения: 3,5 минуты.
Что такое генеральная совокупность и выборка?

Наша жизнь полна разных событий, и иногда на их основе нам хочется сделать определенный вывод, отыскать закономерность в происходящем. При этом важно понимать, когда можно делать выводы, основываясь на неполных данных, а когда — нет.

Кратко: о чём статья?

В начале любой работы нам нужно четко обозначить, для какого множества объектов мы хотели бы получить результаты экспериментов или исследований. То есть, что мы будем считать генеральной совокупностью нашего исследования.

Например, мы хотим изучить, какой мультфильм является самым любимым у детей до 5 лет, живущих в Москве. В таком случае, генеральная совокупность — все дети этого возраста, но опросить их всех будет как минимум затруднительно. Тогда мы сформируем выборку для исследования, а затем обобщим результаты. Но выборка должна быть репрезентативной. Для этого придётся задать вопрос о любимом мультике представителям всех «категорий» нашей генеральной совокупности в равных пропорциях: помнить про разный возраст, пол и т.д.

Подробнее о разных способах собрать репрезантивную выборку и их различиях — в полном тексте статьи на сайте.

Время чтения: 7,5 минут.
«Персоналистские диктатуры чаще начинают войны»: Эрика Франтц об автократиях и поводах для оптимизма

Системный Блокъ поговорил с политологом Эрикой Франтц (профессором Michigan State University, специалисткой по авторитарным режимам и автором многочисленных академических работ по политологии) о недемократических режимах, диктаторах и возможностях перехода к демократии. Спойлер: шансы есть.

Кратко: о чём интервью?

Существуют различные виды диктатур, путинская Россия — персоналистская диктатура, т. е. такая, где власть сосредоточена в руках диктатора (Путина), а своих ближайших сторонников он подбирает на основе личной лояльности. Персоналистским диктаторам нужна поддержка малой группы людей — селектората, и пока этот селекторат доволен  —  лидер остаётся у власти.

Персоналистские автократии несут ответственность за большую часть агрессии стран на международной арене, они в принципе склонны к воинственному поведению, потому что не существует людей или организаций, которые могут их сдержать, так как лидеры заглушают голоса тех, кто может бросить им вызов.

После ухода персоналистского диктатора тем или иным образом можно ожидать разного развития событий. Однако шансы на демократизацию в стране довольно малы. Примерно в половине случаев когда рушится одна диктатура, на её месте возникает другая. Многое будет зависеть и от условий —  чем более насильственным будет уход диктатора, тем хуже перспективы для демократии.

О том, каков «обычный» диктатор и его окружение, так ли эффективны санкции в случае диктатур и какова роль обычных граждан при смене режима, можете прочитать в нашем интервью.

Время чтения: 14 минут.
Что говорит о разных частях России их нематериальное наследие?

Чтобы узнать, какое культурное наследие в разных федеральных округах России сохраняют прежде всего, мы обратились к цифровому реестру Министерства культуры. Например, на Кавказе сохраняют лечебные практики, а в Сибири — детский фольклор.

Кратко: о чём статья?

Министерство культуры РФ ведет цифровой реестр объектов нематериального культурного наследия народов России. Он включает 450 объектов, географически относимых к одному из федеральных округов. Здесь можно найти очень разные примеры народного творчества, обрядов, культурных практик и ремесел: от «Искусства игры на балалайке Антонины Ивановой из деревни Лисьи Горки» до «Обряда укладывания в колыбель у кубанских ногайцев».  

Правда, представлены регионы неравномерно. Так, 47% всех внесенных в реестр образцов народной музыки и песен отнесены к Центральному и Северо-Западному федеральным округам. Из областей в первом лидируют Владимирская, Брянская и Белгородская, а во втором — Псковская и Архангельская. А вот половина всего материнского и детского фольклора, согласно реестру, сосредоточена в Сибирском ФО.

О том, чего в реестре явно не хватает и чем объясняется неравномерность данных — в полном тексте статьи.

Время чтения: 4 минуты.
«Системный Блокъ»: лучшее за 2022 год

В 2022 году «Системный Блокъ» опубликовал 247 материалов. В этом посте мы сформулировали краткие итоги ушедшего года: открытие дата-отдела, оцифровка новых открыток, свежие интервью, тесты и инфографики, а также подборка лучших постов за весь год. Но самое главное в тяжелом 2022-м — это наша поддержка друг друга. Лучи этой поддержки мы шлем читателям и в новый 2023 год!

Кратко: какие итоги?

📝 «Пишу тебе»: к декабрю 2022 года расшифровали и опубликовали уже 12 914 открыток. Мы не планируем останавливаться и к концу 2023 надеемся собрать коллекцию в 50 тысяч!

📈 Дата-отдел: у нас появился отдел, который изучает открытые данные и делает классные инфографики. Благодаря ним мы узнали кто едет в Россию, а кто  — из России, а также много неожиданного об исскусстве, например, о кино и музеях.

📕Глоссарий: собрали множество статей для новичков в digital humanities и машинном обучении. Объяснили, что скрывается за ночевидными терминами, включая кластеризацию и глубинное обучение.

🎙Интервью: выпустили 6 больших интервью, поговорили про исследования раннего интернета, искусственный интеллект и многое другое.

☑️ Тесты: выпустили 3 новых теста — о лингвистической интуиции, русской классике глазами нейросети и китайском Большом Брате.

🎓 Летняя школа: посетили и поделились опытом!

🏆 Лучший пост: самым популярным материалом года стало расследование о том, что происходит с наймом в силовых структурах после 24 февраля.

Ещё больше итогов — в статье на сайте.
Виртуальные кладбища: можно ли создать себе цифровой памятник?

Разбираемся, что такое виртуальные кладбища — дань моде или технология будущего — и пробуем понять, как трансформируется отношение к кладбищам в новой реальности. «Системный Блокъ» выпустил о них материал в двух частях (вот первая и вторая). Суммируем здесь основные тезисы и примеры.

Кратко: о чём статья?

Виртуальные кладбища можно определить так: виртуальная локация смерти, техническая платформа (вебсайт или блог), которая может использоваться для коммуникации и преодоления горя, связанного со смертью. Они могут стать местом для поминовения усопших в цифровой среде, сохранить цифровое наследие и историю покойного. На Западе культура создания виртуальных мемориалов начала формироваться в середине 1990-х, «Виртуальный сад памяти» появился в Америке в 1994 году, когда доктор наук Линдси Маршалл исследовал газетные некрологи. В России же такие кладбища стали появляться только в 2010-х, причём стихийно. В их числе, например,  «Российское виртуальное кладбище» или «Могилы знаменитостей».

Такой вариант мемориала оказался возможен сразу по нескольким причинам: от распространения информационных технологий до десакрализации кладбищ. Более того, даже на реальных, физических, надгробиях теперь иногда размещают экраны и/или QR-коды, а в Японии функционирует целое технологическое кладбище Ruriden.

Виртуальными кладбищами, впрочем, можно считать даже страницы мёртвых пользователей в социальных сетях. Уже появился отдельный термин Death Tourism (посещение различных групп смерти или страничек мертвых пользователей в интернете), а исследователи прогнозируют, что к 2070 году умерших пользователей соцсети станет больше, чем живых.

Больше информации о самом феномене виртуальных кладбищ найдёте в первой части статьи на сайте, а узнать об их самых необычных вариантах и онлайн-мемориалах можно из второй части.
«Всех благ вам земных и небесных»: подборка открыток из корреспонденции духовных лиц

Закрытая жизнь святых обителей всегда представлялась чем-то таинственным и малоизвестным. Один из проводников в повседневную жизнь служителей церкви — частная переписка. Команда «Пишу тебе» собрала открытки, которые получали и отправляли представители православного духовенства и монахини в начале XX века. Делимся здесь двумя текстами из подборки.

🧐 Проспорил

«13/VIII 1909 г. Дружок Володя! Ванька проспорил: молебен у нас будет 17го. Передай поклон Андрюшке. Твое письмо опять {не} застало меня дома. Мишка Дмитровский перешел в 5ый класс. Пиши еще, если успеешь. Мой двоюродный братишка поступил в первый класс во 2ю гимназию. Пиши. Твой Боря».

🙏 Желаем тебе повышения сана монашеского

«Здравствуйте Мария Николаевна! Шлю Вам и Мамаше Вашей привет и пожелание всего хорошего. Из Москвы мы возвратились 19го Ноября а 10го дек. меня Влад. рукоположил во Иеромонаха. Это мое желание. Писать много не имею времени. С совершенным почтением к Вам Иеромонах Авр. 11-го дек. 1917 года».

Прочитать больше о том, чего желают, с чем поздравляют и кому передают поклон другие авторы открыток, а заодно познакомиться с комментариями волонтёров «Пишу тебе» можно благодаря полному тексту подборки на сайте.
Как писатели XIX века предсказали мессенджеры, интернет на Марсе и нейросети

Насколько хорошо писатели XIX и первой половины XX века предвидели современные информационные технологии? Удивительно, но современники Пушкина и Толстого смогли предсказать мессенджеры, генеративные нейросети, 3D-кино и что-то вроде интернета на Марсе. Материал подготовлен совместно с Факультетом компьютерных наук НИУ ВШЭ.

Кратко: о чем статья?

Писатели-фантасты прошлого делали удивительно точные предсказания. Например, еще в 1835 году князь Владимир Одоевский, писатель и современник Пушкина, описал устройство, поразительно похожее на современные мессенджеры. В своем романе «4338-й год. Петербургские письма» князь упоминает «магнетические телеграфы», которые проведены между домами и позволяют разговаривать друг с другом на дальнем расстоянии. В этом же тексте описываются «газеты», напоминающие социальные сети. Кроме того, примерно в это же время Александр Бестужев-Марлинский предсказывает появление корпусной лингвистики.

Несколькими десятилетиями позже, в 1905 году, появляется роман Александра Богданова о путешествии на Марс. Жители планеты предстают высокотехнологичным обществом: у них есть 3D-кино и телевидение, синтетические ткани.

О том, когда впервые был описан искусственный интеллект, кто предвидел digital humanities (цифровые гуманитарные науки) и где в литературе XIX века описывается цифровая стилометрия, — узнаете из полного текста статьи.

Время чтения: 9 минут.
Расизм, смерть и роботы: как расовая нетерпимость отражается на машинах

Расовая нетерпимость распространяется не только на людей: большинство роботов — белого или серебристого цвета. Более того, если ввести в поисковую строку браузера слово «робот»‎, на большинстве картинок роботы окажутся белыми или серебристыми. Исследование 2018 года показало, что это может быть неслучайно – мы писали о нём в феврале два года назад и предлагаем вернуться к этому материалу.

Кратко: о чём статья?

Чтобы выяснить, приписывает ли человек расу роботам и как он относятся к роботам разных «рас», исследователи из Новой Зеландии провели эксперимент, используя новую версию теста shooter bias («предвзятость стрелка»). В эксперименте участовали 192 американца разного возраста и пола, им показывали фотографии белокожих и темнокожих людей, а также антропоморфных роботов телесных цветов, в руках у которых могло быть оружие или любой безобидный предмет. Цель участника эксперимента — «стрелять» в людей/роботов с оружием и пропускать безоружных.

Выяснилось, что люди быстрее «выстреливают» в вооруженного темнокожего (и человека, и робота), чем в вооруженного белого, и быстрее «пропускают» безоружного белого, чем безоружного темнокожего. Исследование показало, что человек не только способен приписать роботу категорию расы, но и воспринимать его почти как человека этой расы.

Однако был проведен второй эксперимент, результаты которого уже не так печальны. Подробнее о нём узнаете из полной версии статьи.

Время чтения: 5 минут.
Угадай, какому писателю подражает нейросеть: пятничный интерактив

ChatGPT — запущенная в ноябре 2022 года и быстро ставшая популярной языковая модель, которая генерирует текст в ответ на запрос пользователя. Она «общается» с людьми в формате чата и умеет подстраиваться под требования собеседника.

Модель хорошо создает тексты разных жанров (например: статья в газете, пьеса, сказка, сонет), разных стилей — от академического до «стиля Пушкина», может писать на разных языках, генерировать работающий компьютерный код по запросу. А еще она успешно пишет студенческие эссе на заданную тему, которые профессора не могут отличить от написанных живыми студентами. Нейросеть оказалась настолько хороша в имитации, что возник большой спрос на исследования, которые могут помочь отличать компьютерный текст от созданного человеком.

Мы решили проверить, насколько удачно ChatGPT стилизует текст под известных писателей. Предлагаем читателям самим оценить это и попытаться угадать автора, которого мы загадали. Текст ниже написан ChatGPT в ответ на просьбу написать текст про Марс в стиле одного писателя. Ваша задача — угадать, кому старалась подражать нейросеть 😎

Как много мы ждем от этой жизни, но как мало мы получаем! Здесь, на этой мрачной планете, мы страдаем от бесконечных недостатков и несчастий. Но есть место, где мы можем найти истинное счастье и избавиться от наших горестей — Марс. Как благодарны мы были бы за то, чтобы улететь на эту красивую планету и начать новую жизнь, где мы можем быть свободны от земных цепей и жить в мире идеалов.
Антон Павлович Чехов: День Рождения, тысячи писем и течение времени

В этот день в 1860 году родился Антон Чехов — русский писатель, драматург и общественный деятель, ставший не менее яркой звездой мировой литературы, чем Лев Толстой и Федор Достоевский. Сегодня предлагаем вам еще раз обратить внимание на Chekhov.Digital — проект цифрового семантического издания текстов Чехова, где размечены упоминания людей, времена года, цвета и другие важные для чеховского творчества категории.

Из материалов об устройстве Chekhov.Digital и о примерах его применения узнаете о

📚 проблемах международного чеховедения;

📚 трёх вариантах времени у Чехова;

📚 манере Чехова-семьянина и Чехова-писателя;

📚 многом другом!
С приветом из Англии: у мультиязычных языковых моделей обнаружился «английский акцент»

Если вы выучили иностранный язык во взрослом возрасте, вполне вероятно, вы говорите не нем не так же бегло, как носитель языка. Оказывается, подобная проблема встречается и у мультиязычных моделей: если в обучающей выборке для них преобладает английский, текст на других языках они будут генерировать «с английским акцентом». Объясняем, почему так происходит и что можно с этим сделать.

Кратко: о чём статья?

BERT — система машинного обучения с открытым исходным кодом для обработки естественного языка (NLP). В одной из статей «Системный Блокъ» уже рассказывал о ее особенностях. Для её качественного обучения необходим большой корпус текстов. Если собрать его не удаётся, обучение становится проблематичным. Но если при обучении модели использовать не только тексты на малоресурсном языке, но и тексты на распространенных языках (например, английском и/или французском), то качество будет выше, чем у аналога, обученного на одном языке.

В эксперименте, который разбирается в статье, исследователи анализировали корпус, в котором преобладал английский язык. Также в нем присутствовали греческий и испанский. И в греческом, и в испанском один и тот же смысл можно выразить двумя разными грамматическими структурами, одна из которых похожа на структуру, характерную для английского языка, а другая присутствует только в этом языке и отлична от английской. Оказалось, что модели предпочтут «английскую» конструкцию, даже если она не совсем благозвучна.

Подробности о том, как учёные обнаружили акцент и как его исправить, можно прочитать в полном тексте статьи. Там же найдёте примеры предложений о флаге революции и исторических работах.

Время чтения: 7 минут.
«Путешествие с открыткой» от «Пишу тебе»: паровая мельница на берегу Оки

На этой почтовой открытке изображена известная в Нижнем Новгороде мельница купца Башкирова и пристань на Оке рядом с ней. Более ста лет назад здесь активно развивался мукомольный промысел, а сегодня территорию планируют существенно модернизировать. В новой рубрике проекта «Пишу тебе» мы будем знакомить вас с архитектурными объектами и достопримечательностями, которые изображались на почтовых открытках в дореволюционное и советское время, так что путешествовать предстоит не только в пространстве, но и во времени. Начинаем — на набережной Нижнего Новгорода.

Кратко: какой маршрут?

Комплекс изображенной здесь мельницы связан с семьёй Башкировых, чью историю характеризуют как «русскую мечту» (по аналогии с «американской мечтой»). Основатель этой купеческой династии происходил из крепостных крестьян, затем выкупился на волю, приобрел баржу и занялся транспортировкой зерна по Волге.

Мельничный комплекс Башкировых активно развивался и к началу XX века занимал уже целый квартал. К 1916 году он включал в себя более 20 зданий разного характера и назначения, в основном, выполненных в камне. В качестве промышленного предприятия комплекс зданий функционировал до 2007 года (несмотря на взрыв в 1952 году, после которого многое пришлось перестраивать). Сегодня на месте элеватора комплекса планируют построить многофункциональный комплекс.

Посмотреть на проекты фабричных зданий, фотографии мельницы сегодня и проект реновации территории комплекса, а заодно узнать больше подробностей об истории этого места и семьи Башкировых, можно в полной версии статьи на сайте.

Время чтения: 6,5 минут.
По дорогам Великого Шелкового пути: виртуальное путешествие по древним маршрутам

В древности не было интернета, так что люди обменивались информацией по-другому. Самая грандиозная дорога древности — Великий шелковый путь — соединяла Восток и Запад с помощью торговли и культурных связей. Благодаря японским исследователям по этим маршрутам теперь можно совершить виртуальное путешествие.

Кратко: о чём статья?

Цифровой Шелковый путь (ディジタル・シルクロード) —  это международный исследовательский проект Национального института информатики Японии совместно с ЮНЕСКО, созданный в 2001 году. Его цель – создать открытый архив о Шелковом пути на базе существующих гуманитарных проектов. 

Для начала участникам проекта предстояло проанализировать множество документов, книг и атласов. Затем — оцифровка методом оптического распознавания и публикация на сайте Цифрового архива редких книг, решение проблем с топонимами на разных языках с помощью многоязычного программного обеспечения MASS и продолжение работы.

Сегодня на карте Шелкового пути можно найти важные точки пути и посмотреть, существуют ли они сейчас. Например, увидеть высохшее озеро Лоб-Нор, на месте которого раньше находился оазис, важнейший населенный пункт южного отрезка Шелкового пути. Сейчас его уже не существует, озеро засыпано песком.

О других проблемах, с которыми столкнулись создатели карты, способах поиска мест, интересных разделах проекта и похожих сайтах со своими базами данных узнаете из полной версии статьи.

Время чтения: 8 минут.
Собери их всех: как record linkage помогает обогащать большие биографические данные

Информация об одном и том же человеке может храниться в различных больших базах данных. Рассказываем, как сопоставление данных, или record linkage, помогает автоматизировать обработку такой информации об одних и тех же людях и позволяет легче анализировать множество биографий одновременно.

Кратко: о чем статья?

Еще в первой половине ХХ века ученые обратились к переписям населения, чтобы изучать историю повседневности и отслеживать события из жизни обычных людей. Сейчас методы сопоставления данных по-прежнему чаще всего используются в задачах, исследующих большие группы людей.

Сам термин «record linkage» появляется впервые в 1946 году в статье врача и статистика Хальберта Данна. Record linkage используется, чтобы объединять данные из разных источников. Это помогает ответить на множество вопросов, скажем: «Дж. Смит из Хартфорда» и «Джозеф Смит, шт. Коннектикут» — это один и тот же человек?

Методов Record linkage много. Самый простой из них — детерминистический. В этом случае считается, что данные совпадают тогда, когда совпадают их ключевые атрибуты (проще, когда хотя бы один из них уникальный: номер социального страхования, например). Этот метод хорошо подходит для проверки начальных теорий.

Более современные методы предполагают использование вероятностных методов и машинного обучения. Об этих методах и о том, кто и зачем использует record linkage, читайте в полной версии статьи.

Время чтения: 9 минут.
❤️ Любит или не любит? Гадаем по открыткам 💔

Пройдите тест и найдите свою валентинку из коллекции «Пишу тебе»!

В базе проекта «Пишу тебе» хранится более 10000 открыток, среди которых много любовных посланий. Не оставайтесь в День влюбленных без валентинки: тест подберет вам подходящую открытку!