Системный Блокъ
10.7K subscribers
241 photos
2 videos
1 file
854 links
«Системный Блокъ» — издание о цифровых технологиях в культуре, искусстве, образовании и обществе.

Финалист премии «Просветитель»

sysblok.ru
vk.com/sysblok
fb.com/sysblok
instagram.com/sysblok/

Присоединяйтесь к команде: sysblok.ru/join
Download Telegram
Тупой пофигизм вместо преглупого индефферентизма: как изменился русский язык за 100 лет

Знаете ли вы, кто такие кокотки, мазурики и филистеры? А кого называли рамольным? Часто ли вам приходится пикироваться или охорашиваться? Все эти слова активно использовались 100 лет назад, но сегодня практически вышли из употребления. И это легко обнаружить статистически.

Чтобы найти слова, которые были популярны в прошлом, но вышли из употребления сегодня, надо сравнить два корпуса текстов — старых и новых. Желательно иметь тексты одного жанра и типа — нельзя же сравнивать законы с рецептами пирогов. В двух корпусах можно посчитать частотности слов и выделить те слова, которые в одном употребляются часто, а в другом редко или вообще не встречаются.

На днях вышло исследование, где ровно так и сделали. Язык прошлого представляли дневниковые записи проекта «Прожито», созданные с 1900 по 1940 годы. Язык настоящего — тексты блогеров «Дзена». Исследователи смотрели на то, какие слова резко потеряли в популярности у авторов, а какие эту популярность приобрели.

Сначала изучим потери. Вместе с исследованием была выложена таблица из 1000 слов, которые сегодня употребляются в 10 и более раз реже, чем в дневниках первых 4 десятилетий XX века. И надо сказать, что среди этой тысячи есть очень обидные утраты. Например, слово «мазурик». Так называли мошенников: «и к чему тут речь о мазуриках и жуликах?», вопрошал в одной из своих статей Салтыков-Щедрин. Или вот слово «дрянность» — им пользовались Добролюбов, Писарев, Достоевский. А теперь оно исчезло. И предсказать такие исчезновения обычно нельзя.

Разумеется, есть и приобретения. Скажем, слово «неадекватный». В краткой форме оно есть уже у Льва Толстого: «употребляемое мною слово неадекватно понято». Но и в XIX, и в XX веке слово использовалось только для несоответствия чему-то терминов, идей, вещей и прочих неодушевленных объектов. Называть неадекватными людей, да еще и без указания, чему именно эти люди неадекватны, начали только в XXI веке. 

Больше примеров ушедших, пришедших и изменившимся до неузнаваемости слов ищите на сайте «Системного Блока»:

https://sysblok.ru/news/tupoj-pofigizm-vmesto-preglupogo-indefferentizma-kak-izmenilsja-russkij-jazyk-za-100-let/
Отличите ли вы живого поэта от электронного?

Сегодня пятница, а значит, можно уже отложить работу и поразвлекаться. Например, поиграть в наш поэтический тест Тьюринга! Вот посмотрите:

спит годами боль из детства
лишь слова кружат и слышат


Кто это написал? Кожаный мешокживой человек — или бездушная машина? Идите по ссылке — и узнаете! Пока одни шутят, что нейросети «пишут лучше Гришковца», а другие занудно твердят, что «компьютер никогда не достигнет высот творчества, на которые способен человек», вы можете поэкспериментировать на себе. Пишите в комментах, сколько угадали:

https://sysblok.ru/test/nejroset-vs-stihi-ru-otlichite-li-vy-zhivogo-pojeta-ot-jelektronnogo/
​​Приложения, которые сделают из вас эксперта в области искусства — помогут блеснуть эрудицией или даже вовремя заметить украденный шедевр

1. Узнать всё о понравившейся картине или скульптуре

Наведите камеру на произведение искусства, и вы сразу узнаете его название, автора, период создания и несколько интересных фактов.

Приложение Smartify работает на оцифрованных версиях картин, и пока в его базе есть далеко не всё. Например, «Аленушку» Васнецова угадать не получится, потому что Третьяковская галерея не сотрудничает с разработчиками. Зато можно исследовать шедевры Эрмитажа, Петергофа и Пушкинского музея. Кстати, приложение хорошо справляется не только с фотографиями в музее, но ещё с открытками и экраном компьютера.

2. Увидеть своего двойника на картине

Сделайте селфи, и нейросеть Art Selfie от Google Arts & Culture сравнит ваши черты лица с изображениями людей на картинах. На выходе вы получите коллаж со всеми возможными совпадениями и степенью сходства в процентах. Портреты кликабельны, и можно больше узнать о заинтересовавшей картине.

Кстати, приложение улавливает родственные связи: недавно оно сравнило Кейт Стюарт из Сент-Луиса с её прабабушкой, изображённой на картине Джорджа Беллоуза «Эмма в фиолетовом платье».

3. Заняться розыском украденных произведений искусства

Приложение ID-Art от Интерпола открывает доступ к списку украденных картин и скульптур с иллюстрациями и подробными описаниями. Искать можно по фотографии и списку критериев или только по списку критериев — в их числе вид произведения искусства, техника, материал и другие.

Чтобы сообщить о том, где вы столкнулись с пропавшей ценностью, нужно нажать кнопку «Report to Interpol». С момента запуска в мае 2021 года приложение уже помогло найти две скульптуры и две картины, которые были украдены и выставлены на продажу.

Все приложения можно скачать в App Store и Google Play.

Автор: Анастасия Денгаза
Какими видели женщин писатели из школьной программы?

Создательницы проекта «Толстой сексист? А Пушкин?» проанализировали 19 текстов Льва Толстого, Александра Пушкина, Владимира Набокова, Михаила Булгакова и Федора Достоевского.

Оказалось, что:
• Женщины у русских классиков почти не участвуют в диалогах.
• Женские персонажи у Пушкина чаще мужских показывают слабость — «устают», «плачут», «бледнеют» и «исчезают».
• Для мужчин Пушкин выбирает прилагательные, которые описывают скорее их внешность, чем чувства. Самые эмоциональные прилагательные классик раздаёт женщинам — это «роковая», «глубокая», «прелестная» и «святая».
• Героини Достоевского более смешливы, чем герои: писатель часто использует глаголы «смеяться» и «засмеяться» в отношении своих героинь.
• В произведениях Толстого женщины более сентиментальны и податливы, а мужчины властны и описываются активными глаголами.

https://sysblok.ru/philology/tolstoj-i-pushkin-seksisty-korpusnoe-issledovanie-russkoj-klassiki/
Как телефонный ассистент Олег издевается над социологами, и чем цифровая модель художественного текста отличается от волшебной карты Гарри Поттера — обзор блогов «Системного Блока»

Эксперты «Системного Блока» продолжают постить в блоги. В этот раз наши авторы рассказали о культурных искажениях в больших данных, неоднозначности результатов исследований Digital Humanities и влиянии голосовых ассистентов на общественное мнение. Посмотрите:

— Как связана статистика попаданий зениток по бомбардировщикам во времена Второй Мировой и состав Национального корпуса русского языка? И почему дошедшие до нас в цифровой форме стихи — «это и есть вернувшийся бомбардировщик, выбравшийся из зенитного огня истории»? Об этом и о том, почему стандартные статистические критерии репрезентативности не решают проблем филолога, рассказывает специалист по культурной эволюции и количественному стиховедению Артем Шеля.

Сбитые самолеты, русские стихи и другие жестокие вещи

— Вносят ли Digital Humanities однозначность и доказательность в гуманитарные исследования? (спойлер: НЕТ). Почему лингвисты исследуют обширные языковые системы, а филологи стремятся изучать единичные объекты? Опасаются ли традиционные филологи — цифровых? Новый пост в блоге Бориса Орехова — с ответами на вопросы о цифровой филологии.

Digital Humanities: где сидит стрекоза?

— Определители спам-номеров и голосовые ассистенты-автоответчики помогают отбиться от спамеров и телефонных мошенников. Но страдают в этой войне и невинные жертвы — социологи, которым становится все труднее исследовать общественное мнение. Вместо респондентов им все чаще отвечают боты, разработчики которых порой специально глумятся над исследователями, либо не отвечает никто. О том, как переход с домашних телефонов на мобильные влияет на опросы общественного мнения, рассказывает социолог Константин Глазков, автор канала WrongTech.

Как технологии меняют общественное мнение
Сегодня проходит суд о ликвидации «Мемориала» — старейшей правозащитной организации России, главного хранителя памяти о репрессиях. Мы хотим напомнить о данных, которые все эти годы собирал «Мемориал» и которым угрожает его ликвидация.

Решением Минюста «Международный Мемориал» внесен в реестр НКО, выполняющих функции «иностранного агента»
Кто первым в России решил посчитать размеры стихотворений Пушкина? Что такое «дальнее чтение»? И для чего литературе нужен «сетевой анализ»?

Знаете ответы на эти вопросы? Проверьте себя в новом тесте про цифровое литературоведение. Заодно вспомните, что некоторые методы цифровых исследований придумали задолго до изобретения ЭВМ 🙊

А для тех, кто не искушён, это нескучная возможность узнать, как связан автор романа «Что делать?» с цифровой филологией.

https://sysblok.ru/test/naskolko-horosho-vy-znaete-istoriju-cifrovogo-literaturovedenija/
Кто делает «Системный Блокъ»? Что движет этими людьми?

Медиапроект «Системный Блокъ» существует уже больше трех лет. Мы независимый и полностью волонтерский некоммерческий проект. У нас нет больших бюджетов, зато у нас много свободы.

Мы делаем интервью с интересными людьми и рассказываем о том, что нам интересно, без политической цензуры и коммерческих интересов. А еще нам просто интересно друг с другом — спорить в чатах и зумах, устраивать пикники, отмечать дни рождения и Новый год 🎉

Мы открытая команда, распределенная по разным странам, из людей с совершенно разным бэкграундом. К нам может присоединиться любой желающий. В чем вы можете проявить себя в «Системном Блоке» в 2022 году?

1. Писать тексты в рубрики «Общество», «Урбанистика», «Цифровая история», «Новости» и даже «Мемы»!
2. Делать тик-токи.
3. Продюсировать спецпроекты.
4. Монтировать видео. Мы не ограничиваемся текстами и выходим на новые платформы, приходите делать ролики вместе с нами.
5. Курировать направления — от IT проектов, проектов по оцифровке до спецматериалов и проектов с учеными.
6. Программировать и анализировать данные. Мы ведем разработку сайта, автоматизируем работу редакции, делаем инструменты оцифровки культурного наследия.
7. Помогать с продвижением в соцсетях и SEO сайта, выстраивать партнерские отношения с другими изданиями.
8. Создавать иллюстрации/дизайн/визуализации.
9. Вести соцсети: у нас уже семь соцсетей, каждую из которых надо вести по-своему
10. Редактировать тексты, превращать непонятный материал в понятный.

📝 Присоединяйтесь: goo.gl/qbPJuK

Видео про нас: https://youtu.be/1WwdFtYO5bo
Первого виртуального собеседника Элизу написали в 1966 году, а история компьютерного зрения началась ещё в 1951-м. Так почему возможности искусственного интеллекта до сих пор уступают футуристичным картинкам из фильмов и книг?

Спойлер: всему виной недостаток вычислительных мощностей. Ещё какие-то три-четыре десятилетия назад оперативную память компьютеров измеряли в килобайтах. А процессоры компьютеров, при помощи которых запускали людей на Луну, были в миллион раз слабее тех, что стоят в ваших компьютерах.

К счастью, быстрый прогресс в этой области обеспечил закон Мура, согласно которому память и скорость компьютеров удваиваются каждый год. Но лишь недавно машины смогли обрабатывать достаточный объём информации, чтобы начали сбываться технологические мечты человечества.

Роботов Boston Dynamics, алгоритмы подбора любимых видосов на Youtube и другие «плюшки» современного ИИ подготовили десятилетия трудной работы в прошлом. И вот какие:

• В 50-х и 60-х годах учёные открыли возможности ИИ — машинный перевод, компьютерное зрение, первую искусственную нейросеть.
• К концу 70-х разработки застопорились из-за недостатка вычислительных мощностей и других препятствий. Но случались проблески — например, успешная посадка автоматической станции «Луноход-1» на поверхность Луны в 1970 году.
• ИИ вернулся в мейнстрим в конце 90-х, когда IBM Deep Blue победил в шахматы действующего чемпиона мира Гарри Каспарова.

https://sysblok.ru/linguistics/otmorozhennyj-iskusstvennyj-intellekt-zima-ne-blizko/
Помните ли вы, какой президент России провёл первую онлайн-конференцию? Выбор невелик, но ответ вас удивит.

Пройдите тест о том, как информационные технологии проникали в политическую, общественную и личную жизнь. Вспомним вместе, когда вооруженные конфликты превратились в онлайн-войны, какие хэштеги мелькали в социальных сетях и что такое киберпреступление.

Ссылка на тест: https://sysblok.ru/test/znaete-li-vy-kak-informacionnye-tehnologii-povlijali-na-obshhestvenno-politicheskie-processy/

Этот тест — часть большого спецпроекта WWW вместо СССР: 30 лет спустя — мы сделали его к годовщине крушения Советского Союза. Таймлайны и комментарии экспертов проведут вас по 30-летнему пути от первых дней интернета — до эпохи блокировок и искусственного интеллекта. Вы узнаете о том, почему социальные сети появились именно в нулевых, какими проблемами страдает электронная демократия и наблюдаем ли мы сегодня закат мировой политической стабильности.

🤔А как онлайн повлиял на ваши отношения с политикой? Пишите в комментариях!
Сегодня Верховный суд ликвидировал «Международный Мемориал». Но пока российские власти ведут борьбу с «Мемориалом» и с собственным неудобным прошлым, сам «Мемориал» переходит в новое агрегатное состояние — «НКО в облаке»:

— Оцифровку данных о репрессиях ведут волонтеры, разбросанные по всему миру
— Архивы переводятся в электронное состояние и хранятся распределенно
— Сайты и базы данных ведутся так, чтобы не быть утраченными даже в случае стихийных бедствий (не говоря уже о репрессивных решениях судов и прокуратур).

Глава красноярского «Мемориала» и программист с почти полувековым опытом Алексей Бабий рассказал в интервью «Системному Блоку», как происходит оцифровка и публикация сведений о жертвах репрессий, почему он называет себя «иностранным агентом Шрёдингера», что заставляет программистов превращаться в общественных деятелей, а также почему современным «облачным НКО» не страшны угрозы ликвидации

https://sysblok.ru/interviews/virtualnye-nko-jeto-budushhee-intervju-s-rukovoditelem-krasnojarskogo-memoriala
✍️ Независимые исследователи и аналитики ОВД-Инфо признали седьмой созыв Госдумы самым «продуктивным» — несмотря на сокращения заседаний в пандемию.

По статистике, каждый созыв Госдумы принимает больше законов и работает быстрее. Яркий пример — в марте 2020 года «коронавирусные поправки» к статье 236 УК прошли все три чтения за один день, обсуждения заняли меньше десяти минут. Закон вступил в силу через неделю после того, как его законопроект внесли в Госдуму.

Депутаты седьмого созыва приняли 2673 закона — больше, чем кто-либо раньше. Из них только два закона в итоге отклонил президент.
Подборка лучших материалов 2021 года
По традиции 31 декабря мы публикуем подборку лучших материалов уходящего года 🎅.

• Спецпроект «WWW вместо СССР». К 30-летию крушения Советского Союза «Системный Блокъ» сделал свой первый большой спецпроект. Мы рассказали о трёх постсоветских десятилетиях через историю IT и интернета. Кстати, вместе со спецпроектом вышел тест, где можно проверить, хорошо ли вы помните новейшую историю IT.

• Блог-пост года: сбитые самолеты, русские стихи и другие жестокие вещи. Авторские блоги — еще одна инновация 2021 года. Блоги ведут эксперты, которые разбираются в том, что нам интересно: от цифровых исследований литературы до биологии. Цифровой стиховед Артем Шеля рассказал, как «ошибка выжившего» влияет на филологические исследования и почему дошедшие до нас стихи — это «бомбардировщик, выбравшийся из зенитного огня истории».

• Тьюториал: как превратить текст в генеалогическое древо с помощью Python. Здесь мы рассказываем, как автоматизировать довольно сложную процедуру — визуализацию генеалогического древа по текстовому описанию. Собрать такую штуку на Python оказывается довольно легко — благодаря использованию готовых библиотек для NLP и отрисовки графов.

• Визуализация года: как инвалидность оказывается токсичной в глазах HR-алгоритмов. Алгоритмы отбора кандидатов считают «токсичными» упоминания глухоты, слепоты и других физических ограничений. Это может стать большой проблемой в эпоху, когда роботы заменят людей в качестве первой линии HR-рекрутеров.

• Цифровая история года: что показывает сетевой анализ византийских писем. Мы рассказали о том, как математическая теория графов (network theory) помогает историку-медиевисту опознать разобщённость элит, за которой последовал политический кризис.

• Тест: кто такой педель и как получить матпомощь в XIV веке? В этом году мы сделали сложный тест, в котором вы можете проверить знания об университетской жизни в Средневековье. А быть студентом в Средние века — это вам не с айфона шпоры списывать.

• Шуточный тест года: какой ты цифровой гуманитарий? Здесь можно узнать, на кого из известных деятелей цифровых гуманитарных исследований вы похожи. И заодно узнать что-то об их удивительных биографиях.

• Дата-журналистика года: исследование зарплат российских учителей. «Системный Блокъ» решил узнать, насколько учитель средней школы в России подходит под критерий среднего класса. Наш автор — дата-журналист Артур Хисматуллин — собрал и визуализировал статистику по доходам и рабочей нагрузке учителей, чтобы показать, что до мировых стандартов среднего класса все это точно не дотягивает.

• MVP года: определяем дату написания картины онлайн без регистрации и СМС. Авторы этой статьи — студенты МИСиС, которые разработали систему датировки картин на нейросетях. Их разработка умеет определять дату как для известных полотен вроде «Звездной ночи» или «Мона Лизы», так и для картин малоизвестных художников. Читайте у нас о принципах работы сервиса.

• Аудио: почему искусственный интеллект врёт и как его от этого отучить? В выпуске подкаста «Неопознанный искусственный интеллект» с Давидом Дале (Сколтех, экс-Яндекс) сочетаются истории из жизни датасаентистов, популярный рассказ о раскрученных технологиях вроде GPT-3, а также весьма глубокие рассуждения о науке и ИИ будущего.

• Видео года: «Мы — Системный Блокъ». Если вам интересно, кто делает наше абсолютно волонтерское и некоммерческое издание, что движет этими людьми и какие у нас планы на будущее — смотрите этот ролик.

• Оцифровка года: проект «Пишу тебе». Под конец вспомним о том, с чего начался 2021 год для команды «Системного Блока». Мы запустили собственный проект по оцифровке культурного наследия под названием «Пишу тебе». В этом проекте мы собираем, расшифровываем и публикуем в открытом доступе старые почтовые открытки. В нашей коллекции уже больше 3 тысяч открыток.

А если вы просто хотите стать частью команды «Системного Блока» — то заполните эту форму. В будущем году мы сделаем еще больше классных штук — и вы можете внести вклад в общее дело. Присоединяйтесь!

С Новым годом! 🥂
Любители пофоткать природу помогают большой науке

Международные платформы типа eBird или iNaturalist становятся всё популярнее. После регистрации на такой платформе вы делитесь своими наблюдениями за живой природой, общаетесь с единомышленниками и узнаёте что-то новое. А специалисты берут данные, накопленные «гражданской наукой», и делают на их основе настоящие исследования.

Что делают с данными, собранными любителями?
• Определяют с их помощью ареал обитания редких видов животных и растений.
• Составляют карты, визуализирующие вероятность получить укус ядовитой змеи.
• Изучают влияние урбанизации на биоразнообразие и находят проблемы на урбанизированных территориях — например, частые столкновения птиц с окнами зданий.
• Выясняют степень распространённости болезней — например, постодиплостомоза у рыб.
• Обучают нейросети распознавать животных на изображениях.

https://sysblok.ru/biologija/mne-nuzhny-tvoja-geolokacija-kamera-i-telefon-dlja-chego-uchenym-vashi-foto-ptic-i-rastenij/
Движения глаз выдают неуверенного читателя
Исследователи Центра языка и мозга Высшей школы экономики и Городского университета Нью-Йорка применили новый метод айтрекинга к русскоязычным текстам.

Традиционные методы айтрекинга описывают локальные параметры того, как двигаются глаза читающего при чтении отдельных слов. Благодаря им мы узнали, что глаз не скользит по предложению, а скачет по словам, а ещё часто возвращается к предыдущим словам и перечитывает их.

Сканпаф (от англ. scanpath) — новый метод, который описывает глобальный рисунок чтения целых предложений в разных группах. При анализе составляется график движения глаз каждого участника исследования, сравниваются их паттерны чтения, а затем похожие паттерны объединяют в кластеры (группы) .

Что стало известно после применения сканпафа к чтению на русском языке?
• Русскоязычные подростки и молодые люди в возрасте 13-24 лет, которые живут в США и усваивают язык через родителей, читают по-разному — настолько, что их невозможно объединить в один кластер.
• Если человек быстро читает вслух, то про себя он тоже читает бегло — и наоборот.
• Дети с риском дислексии достигают беглого уровня чтения, но для этого им нужно больше времени, чем сверстникам.

https://sysblok.ru/neuroscience/ajtreking-i-skanpafy-kak-dvizhenija-glaz-vydajut-neuverennogo-chitatelja/