DH CLOUD
740 subscribers
81 photos
5 videos
6 files
243 links
Делаем то, что считаем нужным, не теряя того, что считаем ценным
Download Telegram
«Кладя количест­венный учет и микроанализ в основу исследования, я только предлагаю сделать для литературоведения то, что полтораста лет тому назад сделал Лавуазье для химии, и не сомневаюсь, что результаты не заставят себя ждать»…

В «Системном Блоке» вышло посмертное «интервью» с пионером статистического литературоведения Б. И. Ярхо. Борис Ярхо — один из самых недооцененных филологов знаменитого поколения «русских формалистов» 1910-х — 1920-х. В отличие от куда более известных Проппа, Шкловского, Тынянова и Эйхенбаума, Ярхо оставался неизвестен на Западе и малоизвестен в России вплоть до начала XXI века, когда его пионерские работы по количественному литературоведению стали актуальны с приходом цифровых методов.

Переработав текст главного научного завещания Ярхо — книги «Методология точного литературоведения» — в формат диалога, авторы «интервью» попытались показать, каким ученый видел будущее литературоведения, какие принципы легли в основу его метода и как наука и жизнь оказались переплетены в его исследовательской практике. А еще из книги были извлечены и инкрустированы в текст интервью конкретные примеры количественных исследований и экспериментов Ярхо — как проделанных, так и только намеченных, но не осуществленных
18🔥2👍1👏1
Не только и не просто презентация проекта Пушкин Digital, но еще и важный разговор о чтении и восприятии в цифровой среде - такая социология пользователя цифровых продуктов. Присоединяйтесь!
картинка смешная, но рассказывать будем не про наш труд, а про то:

- что такое цифровая среда для гуманитарного проекта, почему некоторые проекты — цифровее других

- как институции воспроизводят читателей А. С. Пушкина и сколько тысяч выпускников гуманитарных направлений работают по специальности

- все ли читатели на самом деле читают, и что они делают вместо этого

- чем образ Пушкина отличается в медиа, науке и учебниках, и могут ли цифровые гуманитарные проекты могут изменить ситуацию (и хотят ли),

- и конечно, рассказы о том, как люди пользуются pushkin.digital, и что мы будем исследовать дальше.

можно прийти завтра в 13.00 в зум, а ещё можно почитать отчёт (немного черновой, зато большой). про это можно у меня в личке спросить.

https://tttttt.me/pushkin_digital/62
5
Открыто голосование за номинантов премии DH Awards 2024. В этом году снова номинировано несколько работ от участников DH CLOUD и ближайших единомышленников сообщества. «Наши» представители есть почти в каждом разделе:

BEST DH DATA VISUALIZATION

“Таймлайн жизни русских писателей XVIII века”: Timeline of Russian writers of the 18th century от Бориса Орехова и Лаборатории цифровых исследований русской литературы и фольклора

Classroom reading (Systemniy Block media) от команды «Системного Блок{ъ}а»

BEST DH DATASET OR MODEL

Geocoding of Russian prose of the 19th century от Бориса Орехова и Даниила Скоринкина

Pulse of time от Сибирского федерального университета

BEST DH SHORT PUBLICATION

Сразу два текста от Бориса Орехова:

“You shall know a piece by the company it keeps. Chess plays as a data for word2vec models”

“Does Burrows’ Delta really confirm that Rowling and Galbraith are the same author?”

BEST DH TRAINING MATERIALS

Computer Text Analysis: HSE Master’s Degree Course ‘Digital Humanities’ от Ольги Алиевой

Stay up to date with digital humanities от Сибирского федерального университета

BEST DH RESOURCE

Digital Humanities, или Цифровые методы в гуманитарных науках: точка входа от команды «Системного Блок{ъ}а»

Digital Humanities’ journal in Russian от редакции журнала «Цифровые гуманитарные исследования»

Голосование продлится до 4 апреля.
8👍2🔥2
🙂 С особым трепетом поздравляем коллег, ставших призерами DH Awards 2024:

🔜 «Системный Блокъ» получил награды сразу за два проекта – дата-исследование «Классное чтение» о школьном литературном каноне и портал с полезной подборкой DH-материалов «Digital Humanities, или Цифровые методы в гуманитарных науках: точка входа» (3 места в номинациях DH DATA VISUALIZATION и DH RESOURCE)

🔜 Борис Орехов – за препринт «You shall know a piece by the company it keeps. Chess plays as a data for word2vec models» (2 место в номинации DH SHORT PUBLICATION)

🔜 Ольга Алиева – за курс для магистерской программы «Компьютерный анализ текста» (3 место в номинации BEST DH TRAINING MATERIALS)

Напомним, основная цель этой премии — популяризировать цифровые методы в гуманитарных науках и продемонстрировать, какими разными и интересными могут быть проекты в этой сфере. Приятно, что в списке номинантов и призеров появляется все больше знакомых названий и имен!

Список победителей DH AWARDS 2024
Подробнее о премии
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥336👏1
На этой неделе состоится два DH мероприятия в Центральной Азии, оба гибридные:

🇰🇿 15 апреля, круглый стол "Кросскультурная коммуникация в цифровом глобальном мире", организатор: Алматинский
гуманитарно-экономический университет, Казахстан.

🇰🇬 19 апреля, симпозиум "Цифровые методы и инструменты в гуманитарных науках", организатор: Американский университет в Центральной Азии, Бишкек, Кыргызстан (ссылку добавим позже)
🔥6👍2
Недавно мы делились новостью о том, что раздел Digital Humanities на платформе “Системный Блокъ” стал призёром DH Awards 2024, получив признание в качестве одного из лучших цифровых научных ресурсов.

Раздел продолжает последовательно развиваться как авторитетный источник для исследователей. На портале собрано всё, что необходимо начинающему цифровому гуманитарию:

📖 Методические материалы по ключевым DH-инструментам
📊 Аналитические обзоры актуальных исследований
🎓 Базу образовательных программ с экспертными комментариями

Особое внимание уделяется практической применимости — все материалы адаптированы для использования в учебной и научной деятельности.

Приглашаем вас ознакомиться и воспользоваться материалами!
https://sysblok.ru/dh/
14👍1
🎶 Uncovering Marion Scott: цифровые методы в музыкальной истории
📅 22 мая, 15:00–16:00 (BST)
🌐 Онлайн | Нужна регистрация

В рамках серии Bodleian Bytes пройдет лекция Антонины Пучковской (King’s College London), посвящённая применению методов Digital Humanities к архивным материалам о Мэрион Скотт — влиятельной, но малоизвестной фигуре музыкальной сцены Британии начала XX века.

Проект, реализуемый в сотрудничестве с Royal College of Music, сочетает архивные исследования и анализ социальных сетей для реконструкции профессиональных связей Скотт. Такой подход позволяет оспорить устоявшиеся представления и переосмыслить роль женщин в культурной истории.

📊 Как цифровые методы помогают «увидеть» скрытые сети и забытые имена в архивных фондах — узнайте на лекции!

🔗 Регистрация по ссылке
5👍2
«Системный Блокъ» запускает набор в мастерскую дата-журналистики на «Летней Школе» второй сезон подряд!

Вы тоже любите данные, исследования, еду на костре и сосны? В июле «Летняя школа» на Волге открывает новый сезон. Во второй раз в ее программе и мастерская «Системного Блока» по дата-журналистике, и мы приглашаем участников.

Что такое дата-журналистика?

Дата-журналистика — это направление в журналистике, основанное на анализе и визуализации данных. 
Сырые данные мало что значат для человека. Чтобы они приобрели смысл, их нужно обработать, обобщить, найти в них закономерности и связи, а потом объяснить понятным языком. Именно этим и занимается дата-журналистика. Так появляются истории о причинах смертности среди бездомных, о гендерном балансе учителей или о составе школьного литературного канона. Если вы хотите научиться делать так же, то приезжайте к нам на мастерскую. 

🎓Кто может участвовать в мастерской?

Подать заявку могут как опытные, так и начинающие журналисты, а также все, кто хочет попробовать себя в новой сфере: студенты, выпускники, программисты, аналитики данных, визуализаторы.

✍🏼 Что будет на мастерской?

На мастерской будет два блока: образовательный и проектный.

Образовательный блок будет состоять из трех разделов: работа с данными, основы визуализации, дата-журналистика. Вы узнаете, где искать данные, как их собирать и обрабатывать, как превращать их в красивые и понятные визуализации, и как из всего этого создавать журналистские истории.

Во время проектного блока вас ждет хакатон. Наши партнеры привезут реальные задачи и данные, и команды участников смогут пройти полный цикл создания дата-истории от гипотез до выводов. В прошлом году команды исследовали состав школьных программ по литературе, российские кинофестивали, влияние профиля и престижности вуза на трудоустройство выпускников. Лучшие материалы вы сможете опубликовать у нас или на площадках наших партнеров. 

🧑🏻‍💻 Кто делает мастерскую? 

Партнеры мастерской: 
• платформа «Если быть точным» @tochno_st, которая исследует данные о социальных проблемах в России;
• благотворительная организация «Ночлежка» @nochlezhka, помогающая бездомным;
• центр научной коммуникаций ИТМО @scicomm.
• научно-популярный журнал «Кот Шрёдингера» @kot_sh

📍Когда и где пройдет мастерская?

Мастерская дата-журналистики пройдет с 19 июля по 3 августа 2025 года на Волге недалеко от Дубны.

❗️Как к нам попасть?

Подать заявку на участие можно на странице мастерской до 18 мая. Обучение бесплатное, на питание и проживание участников «Летняя школа» собирает добровольные взносы (рекомендованная сумма от 800 рублей в день с человека). Подробности можно прочитать в FAQ.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥53
Еще одна летняя школа (или точнее бабье-летняя) пройдет в Кельне с 8 по 11 сентября, участие бесплатное, приглашаются студенты и аспиранты для погружения в использование LLM для DH исследований.
❗️Дедлайн для регистрации - 1 июня
http://ml-school.uni-koeln.de/
🔥3
🚀Не пропустите! Альянс цифровых гуманитарных проектов запускает свой первый открытый конкурс!!
open call
проект <—> исследование

Альянс цифровых гуманитарных проектов запускает конкурс проект <—> исследование для тех, кто хочет сделать DH-проекты частью живой инфраструктуры науки, образования и культуры.

🟢 в чём суть конкурса?

Символ <—> в названии конкурса означает, что проекты и исследования связаны. Идея конкурса в том, чтобы делать эту связь между проектами и исследованиями более ощутимой и полезной.

Наша цель — усилить практическую пользу существующих цифровых гуманитарных проектов через исследования, мероприятия или образовательные инициативы.

🔮 кто может участвовать?

— Учёные, преподаватели вузов
— Студенты, аспиранты
— Независимые исследователи
— Сотрудники музеев, библиотек, архивов, галерей
— Культурные менеджеры, урбанисты
— Креативные продюсеры, медиа-менеджеры, журналисты

🟪 в чём задачи участников?

Для участия нужно разработать и описать реализуемую идею, использующую материалы одного или нескольких DH-проектов Альянса, в одной из номинаций:

1. Классическое исследование
2. Интернет-исследование
3. Выставочный/библиотечный/архивный проект
4. Медийный/просветительский проект/мероприятие
5. Образовательная инициатива
6. Critical DH Studies / Ресантимент-анализ

✏️ как поучаствовать?

1. Изучите номинации и проекты Альянса.
2. Разработайте свою идею.
3. Заполните анкету и шаблон заявки на сайте.
4. Ждите обратную связь до 1 августа.

> подробности — на сайте <

что получат победители?

— Консультационную поддержку от ведущих экспертов Альянса.
— Тьюторскую поддержку (помощь в подготовке публикаций).
— Продюсерскую поддержку для реализации вашего плана.
— Рекомендательное письмо для поступления в магистратуры организаторов.

Заявки принимаются до 16 июля 2025 года.

Если у вас есть вопросы о конкурсе, Пишите нам на почту dh.alliance@yandex.ru.
Please open Telegram to view this post
VIEW IN TELEGRAM
Борис Орехов опубликовал word2vec-модель, обученную на русскоязычных художественных текстах объемом 13 млрд словоупотреблений (doi: 10.57967/hf/5921).

Общеизвестно, что расположение векоров в векторном пространстве модели зависит от жанровых особенностей обучающего корпуса. Исходя из этих соображений представляется полезным обучить модель только на художественных текстах, чтобы иметь под рукой инструмент как академического исследования векторной семантики в художественной литературе, так и основу для инженерных решений в области автоматической обработки художественных текстов.


Обучающий корпус составил 13 981 681 569 слов или 1 357 318 182 предложения. Корпус был лемматизирован с помощью программы Mystem.

Модель доступна по ссылке: https://huggingface.co/nevmenandr/w2v-russian-fiction

В описании есть код для инициализации и обращения к модели на языке Python.

Библиографическая ссылка:

@misc{boris_orekhov_2025,
author = { Boris Orekhov },
title = { w2v-russian-fiction (Revision 34453d9) },
year = 2025,
url = { https://huggingface.co/nevmenandr/w2v-russian-fiction },
doi = { 10.57967/hf/5921 },
publisher = { Hugging Face }
}
13🔥10👍3
Борис Орехов опубликовал новый датасет, основанный на коллекции Google Ngrams (doi: 10.57967/hf/5987). Из оригинального набора данных отобраны биграммы на русском языке и их частотности с 1918 до 2010 год. Биграммы лемматизированы и представлены в виде таблиц. Частотность нормализована относительно общего количества биграмм за год и посчитана до 10-го знака после запятой. Финальный объем данных составил 87 537 955 записей.

Данные полезны для проведения исследований в области культуромики:

📚 Michel, J. B., Shen, Y. K., Aiden, A. P., Veres, A., Gray, M. K., Google Books Team, Pickett, J. P., Hoiberg, D., Clancy, D., Norvig, P., Orwant, J., Pinker, S., Nowak, M. A., & Aiden, E. L. (2011). Quantitative analysis of culture using millions of digitized books. Science (New York, N.Y.), 331(6014), 176–182. https://doi.org/10.1126/science.1199644
📚 Бонч-Осмоловская, А. А. (2023). Глава 4. Культуромика: исследование клуьтуры и языка с помощью текстовых данных Цифровые гуманитарные исследования: монография, Красноярск, 57–99.
📚 Бонч-Осмоловская, А. А. (2018). Имена времени: эпитеты десятилетий в Национальном корпусе русского языка как проекция культурной памяти. Шаги/Steps, 4(3-4), 115-146.
📚 Бонч-Осмоловская, А. А. (2015). Культуромика в национальном корпусе русского языка, к постановке задачи: три века русских дорог. Труды Института русского языка им. В. В. Виноградова, (6), 605-641.

@misc{boris_orekhov_2025,
author = { Boris Orekhov },
title = { russian-20th-century-bigrams (Revision 8ef57d3) },
year = 2025,
url = { https://huggingface.co/datasets/nevmenandr/russian-20th-century-bigrams },
doi = { 10.57967/hf/5987 },
publisher = { Hugging Face }
}
Please open Telegram to view this post
VIEW IN TELEGRAM
👍112
«Системному Блоку» — 7️⃣лет.
7️⃣ — третье счастливое число.
Желаем счастья и впредь! 😉

🖥 «Системный Блокъ» — лучшее издание о цифровых технологиях в гуманитарных науках, искусстве, образовании и не только. Кстати, всегда можно присоединиться к сообществу авторов или сообществу читателей.

🔜 Именно СБъ подготовил полезную «Точку входа» в цифровые гуманитарные исследования.

Для тех цифровых гуманитариев, которые любят всё считать, сообщаем:
7 лет = 1392 публикации ❗️

А для тех цифровых гуманитариев, которые любят всё читать, передаем: про другие промежуточные итоги, актуальные тренды и почетные награды СБъ можно узнать в специальном материале. 🎁

Иллюстрация Жени Родиковой.

#dh #цги #СБъ
Please open Telegram to view this post
VIEW IN TELEGRAM
11🔥4👏1
В день рождения Льва Толстого проект «Слово Толстого» открывает новые возможности исследования жизни и творчества писателя и публикует карту Толстого, на которой отмечены места, где бывал писатель в течение жизни, с описаниями и цитатами. Карта не только интегрирована в интерфейс портала, но и содержит ссылки на письма и дневники Толстого из других разделов портала. А совместный проект «Слова Толстого» и Яндекса придает толстовским местам в Москве современное звучание.
👍6
Media is too big
VIEW IN TELEGRAM
Обедал дома. Шереметева прогулял. В эрмитаже — цыгане. Саша кривляка.
<…> В клубе нашло на меня дикое веселье.
(Дневник, 18 сентября 1858 года)


Как бы жил Лев Николаевич в 2025 году? Сегодня с Яндекс Картами представляем один день из жизни писателя в современной Москве. Толстой бы точно сходил на занятие йогой, подстригся в местном барбершопе и посмотрел фильм в «Художественном».

Да и вообще — был бы популярным блогером. Ведь прошло больше ста лет, а его отзывы не теряют актуальности!

Пойдете по следам классика?
8🔥1
На сайте Пушкинского Дома доступен новый номер журнала «Цифровые гуманитарные исследования» (2025. № 1).

В свежем номере представлено три исследовательских статьи — об именах исторических персоналий в русской прозе XIX века, о выявлении авторской речи в прозе Стругацких, об интерфейсах цифровых архивов. Кроме исследовательских текстов есть материал, описывающий историю цифрового гуманитарного проекта (Параллельный корпус переводов «Слова о полку Игореве»), продолжение начатой в прошлом номере дискуссии о Digital Humanities в России, хроника значимых для сообщества событий (круглый стол по базам данных для социальных и гуманитарных наук) и рецензия на книгу (Crymble Adam. Technology and the Historian. Transformations in the Digital Age).

Полная версия номера — по ссылке.
👍42🔥2👎1