Гуманитарии в цифре
2.57K subscribers
690 photos
21 videos
7 files
566 links
Сообщество гуманитариев, которым интересны цифровые технологии. Инициатива цифровых гуманитарных исследований СФУ (Digital Humanities Research Initiative)
Download Telegram
⚡️Опубликованы материалы докладов V международной научно-практической конференции «Информационные технологии в гуманитарных исследованиях».

Напомним: конференция проходила в Сибирском федеральном университете 10-13 ноября 2025 года. В ней приняли участие 50 специалистов разного профиля – лингвистов, историков, литературоведов, программистов – из 17 городов России, Кыргызстана и Узбекистана.

Организаторами конференции выступили Институт цифровых гуманитарных исследований, (Digital Humanities Research Institute) и Гуманитарный институт СФУ совместно с Ассоциацией цифровых гуманитарных наук.
241110
Можно ли анализировать музыку как текст?

Этим вопросом задались ученые СПбГУ, ИТМО и Университета Виктории (Канада). В ноябре вышло исследование, в котором методы лингвистической стилометрии были применены к музыкальным данным – прежде всего для решения задач классификации и определения авторства произведений.

В качестве материала исследователи использовали корпус классической музыки MusicNet. Произведения в формате MIDI они представили как последовательности токенов и протестировали два подхода: 1) статистический анализ частот токенов (методы delta) 2) статистические векторные эмбеддинги (Word2Vec и Doc2Vec).

Результат: инструменты, привычные для лингвистов, действительно работают на музыкальном материале – пусть и не идеально. Частотные модели демонстрируют устойчивые результаты в задачах классификации, а эмбеддинги оказываются перспективными для кластеризации. Отдельно отмечается, что лемматизация аккордов повышает качество анализа.

DH-специалисты расширяют рамки: применять лингвистические методы анализа можно не только к музыке, но и, например, к шахматам. Препринт Бориса Орехова, в котором записи шахматных партий рассматриваются как тексты (последовательности «слов»), стал победителем DH AWARDS 2024 в номинации «DH SHORT PUBLICATION».

Иллюстрация: Nano Banana
178👾6🔥421
#DeepSeekшутит на этот раз о том, как DH-специалист может провести 14 февраля.

🔜Можно оцифровать старинный любовный роман, прогнать его через NER-систему и выяснить, что главный злодей появляется в тексте чаще, чем объект воздыхания. После этого визуализировать токсичные отношения в Gephi и отправить возлюбленной со словами: «Дорогая, наши чувства — кластерный анализ чистой воды».

🔜Стоит отметить День всех влюбленных, как полагается: разметить валентинки коллег в TEI, добавить теги <emotion> и <flirt type=“ironic”/>, а затем провести сентимент-анализ подписей в открытках.

🔜Подарите партнеру датасет вашей переписки за последние пять лет. Если он (или она) начнет строить на этих данных прогнозную модель следующей ссоры, значит, это настоящая любовь на стыке алгоритмов и семиотики.

🔜Устройте романтический диспут на тему: «Ромео и Джульетта — это трагедия ошибок в коммуникации или классический кейс отсутствия NLP в XVI веке?». Проигравший весь вечер вручную вычищает стоп-слова из корпуса поздравительных стихов.

🙂 Несмотря на #шуткИИ и самообучающиеся алгоритмы, пусть ваши отношения будут чистыми, как хорошо структурированные данные, а чувства — валидными без дополнительной нормализации!

🙂 Пусть ваша вторая половинка всегда находит вас по ключевому запросу, а визуализация совместного будущего будет убедительной!

Иллюстрация: Nano Banana
Please open Telegram to view this post
VIEW IN TELEGRAM
14🤣1473
🍸 Гремучий коктейль гуманитарных знаний и технических возможностей

Монография «Парад цифровых гуманитарных проектов» предлагает обзор современных российских исследований на пересечении цифровых технологий и гуманитарных наук. Это попытка зафиксировать состояние Digital Humanities сегодня — с её методами, инструментами и исследовательскими стратегиями.

Главный редактор издания Андрей Юрьевич Володин в интервью подробнее рассказал о том, чем уникальна эта книга и почему она важна для научного сообщества.

А для самых заинтересованных напоминаем: у нас есть целый выпуск подкаста «Пища для ума» с Андреем Володиным, где мы также обсуждали Digital Humanities и значение цифровых технологий для гуманитарных наук. Послушать выпуск можно ВКонтакте или на Яндекс.Музыке 🎧

Не забудьте «выпить коктейль», чтобы оставаться в курсе последних научных проектов и достижений.
🔥19984
10 UX-принципов для цифровых гуманитарных проектов

В свежей статье журнала Digital Humanities Quaterly (DHQ) пишут о недооцененности пользовательского опыта (UX) в цифровых гуманитарных исследованиях. Практики UX в DH часто игнорируются или упоминаются вскользь – и напрасно. Именно они помогают проектам не только соответствовать академическим стандартам, но и быть понятными, доступными и полезными как для исследователей, так и для широкой аудитории.

Авторы подчеркивают: UX-подход должен быть встроен во все этапы разработки – от планирования до реализации и дальнейшего развития проекта.

Ниже – десять эвристических принципов, которые можно использовать как ориентир при создании и оценке цифровых гуманитарных проектов.

1. Уважайте формат. В цифровой среде мы читаем иначе: скроллим, переходим по ссылкам, взаимодействуем с мультимедиа. Проект не должен быть просто электронной копией книги или PDF. Контент важно структурировать в соответствии с логикой цифрового восприятия.

2. Продумайте информационную архитектуру. Навигация должна быть интуитивной: от общего к деталям, с понятными разделами и логичными связями. Это помогает пользователям ориентироваться и находить нужную информацию, не теряясь в «лабиринте» интерфейса.

3. Главная страница – это аннотация. С первых секунд должно быть ясно, что это за проект и зачем он нужен. Четкое позиционирование помогает вовлечь пользователя и сформировать правильные ожидания.

4. Учитывайте фактор удовольствия. UX – это не только про эффективность, но и про приятный опыт. Эстетика, продуманные элементы взаимодействия, интересные детали делают работу с проектом комфортной и мотивируют возвращаться к нему.

5. Стремитесь к инклюзивности. Язык, метаданные, визуальные решения должны быть понятны максимально широкой аудитории. Стоит избегать профессионального жаргона, учитывать культурные контексты и разные способы восприятия информации.

6. Избегайте разрастания функциональности. Большое количество функций не всегда делает проект лучше. Важно фокусироваться на целях пользователей и миссии проекта, добавляя только те элементы, которые действительно необходимы.

7. Будьте внимательны к визуализации. Карты, графики и диаграммы должны быть четкими и соответствовать задачам проекта. Не перегружайте инфографику: контекст, подписи и понятные легенды помогают корректно интерпретировать данные.

8. Устраняйте раздражающие элементы. Непредсказуемые всплывающие окна, автоматические загрузки и резкие переходы снижают доверие и мешают пользователям.

9. Проектируйте доступный дизайн. Подумайте о потребностях пользователей. Субтитры для видео, высококонтрастные цвета, поддержка экранных читалок, навигация без мыши…

10. Показывайте развитие. Важно демонстрировать, что уже есть, а не акцентировать внимание на ожидании «будущих обновлений». Люди хотят возвращаться к проектам, которые растут и развиваются.

🙂 Что почитать?

🔜 Статья «User Experience (UX) Heuristics for the Digital Humanities» в Digital Humanities Quaterly

🔜 Статья «UX в(c) DH. Интервью про UX-исследования, Human-Computer Interaction и связь юикса с цифровой гуманитаристикой» в «Системном Блоке»
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥1497💯4
Сегодня ректор Сибирского федерального университета Максим Румянцев и доцент кафедры исторической информатики МГУ, ведущий научный сотрудник DHLab СФУ Андрей Володин приняли участие в круглом столе Российского исторического общества, посвящённом вопросам информационного суверенитета и применения отечественных моделей искусственного интеллекта в сферах истории и культуры.

В ходе обсуждения затронули и использование актуальных цифровых инструментов и подходов в образовании студентов-гуманитариев.

«Мы считаем, что гуманитарий должен быть профессионально ориентирован и в сфере цифровых компетенций: такая подготовка должна вестись системно, на протяжении всего цикла обучения. Наряду с фундаментальными знаниями необходимо формировать и навыки, которые позволят решать исследовательские задачи на новом уровне»


Максим Валерьевич также акцентировал внимание на значимых проектах Института цифровых гуманитарных исследований СФУ «Сибириана» и «Отчеты губернаторов Енисейской Губернии».
18👍128🤣3
🙂 ещё одна секция про ИИ

На XXIV международной конференции молодых учёных «Векторы» в Москве DH-центр ИТМО проведет «ещё одну секцию про ИИ».

На секцию приглашают исследователей, изучающих искусственный интеллект – как критически, так и эмпирически. Состоится разговор об ИИ не как об абстрактной технологии, а как о сложном социотехническом феномене: кто и как создаёт ии-системы, какие практики складываются вокруг них, кто и что остаётся за кадром этих процессов.

«Нас интересуют этнографии разработчиков и пользователей, анализ интерфейсов и датасетов, исследования инфраструктур и трудовых практик, методологические эксперименты по изучению алгоритмических систем».


Подробности, список литературы и форма подачи заявки на секцию – по ссылке.

Формат: гибридный (очно и онлайн)
Заявки принимаются до 28 февраля.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍107🤔32
🙂 25 февраля на очередном [№44] заседании научного семинара «Цифровая среда» выступит доктор физико-математических наук, профессор РАН, руководитель лаборатории машинного обучения и семантического анализа Института искусственного интеллекта МГУ Константин Вячеславович Воронцов.

🎁 Тема доклада «Машинное обучение и семантический анализ».

🕓 Встречаемся 25 февраля 2026 в 15:00 (Москва) / 19:00 (Красноярск)

🔜 Аннотация доклада и форма регистрации на семинар здесь

#цифроваясреда #смотреть #ИИ #цифровыегуманитарныеисследования
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13128🔥3
🙂 Китайский новый год (17 февраля – 3 марта) шагает по планете.

😉 По случаю праздничных торжеств китайский #DeepSeekшутит и предлагает 10 чэнъюев, которые метафорически объединяют многовековую традицию и точность DH-вычислений.
(Чэнъюй — китайский фразеологизм, чаще всего состоящий из четырёх иероглифов.)

🔜 数往知来
Подсчитывая прошлое, знать будущее.
Основа DH: использование вычислительных методов для анализа исторических данных, чтобы выявить скрытые закономерности и тренды.

🔜 文理相通
Гуманитарные и точные науки проникают друг в друга.
Отражает суть междисциплинарности DH, где филологи и программисты работают в одной связке в цифровых гуманитарных проектах.

🔜 钻坚研微
Проникать в твердое, исследовать мельчайшее.
Описывает процесс добычи данных, когда компьютер помогает увидеть детали, скрытые в огромных корпусах текстов.

🔜 辨章学术
Обсуждать статуты, изучать науки.
Создание онтологий и цифровых каталогов, которые позволяют структурировать хаотичное знание.

🔜 左图右史
Слева чертежи, справа хроники.
Символизирует геоинформационные системы (ГИС) и пространственный анализ в истории, когда текст неразрывен с картой.

🔜 千载一合
Тысяча дел соединяются воедино.
Уникальная возможность, которую дают современные технологии для сохранения и реконструкции утраченного культурного наследия в цифровых архивах.

🔜 寻章摘句
Искать главы, вырывать фразы.
В положительном смысле — работа корпусных менеджеров и систем конкордансов, автоматический поиск цитат и коллокаций.

🔜 格物致知
Исследовать вещи, чтобы достичь знания.
Философия DH — изучая цифровые следы, мы постигаем природу человека и общества.

🔜 纲举目张
Основная сеть натянута — ячейки раскрыты.
Принцип работы гипертекста и ассоциативных ссылок, когда один документ (узел сети) открывает доступ к тысяче других.

🔜 杞宋无征
Отсутствие подтверждений (букв. нет документов Ци и Сун).
Проблема отсутствия данных и цифрового разрыва: вызов для DH-специалистов, как изучать эпохи, от которых не сохранилось машинописных источников.

Иллюстрация: Nano Banana
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥7👍65🦄1
🙂 Уже завтра ждем вас на научно-методическом семинаре «Цифровая среда» ИЦГИ СФУ. С докладом выступит Константин Воронцов – доктор физико-математических наук, профессор РАН, руководитель лаборатории машинного обучения и семантического анализа Института искусственного интеллекта МГУ, лауреат Yandex ML Prize 2025.

Константин Вячеславович расскажет о некоторых исследовательских проектах своей лаборатории и обсудит с участниками семинара актуальные вопросы на стыке машинного обучения и гуманитарных исследований:

🎁 Вероятностное тематическое моделирование и его применение в цифровых гуманитарных исследованиях. Почему задача мягкой кластеризации больших текстовых корпусов не теряет актуальности в эпоху LLM?

🎁 Автоматизация контент-анализа. Можно ли обучить модели находить нужные смыслы в миллионах текстов? Возможно ли построить одну универсальную модель для любых задач контент-анализа в разных предметных областях? 

🎁 «Мастерская знаний». Как выстраивать взаимодействие человека и ИИ в научных исследованиях? Какими могут быть системы будущего для поиска и анализа научной информации? Как научить ИИ выделять главное, если нам самим это удается далеко не всегда?

Дискутантом по докладу «Машинное обучение и семантический анализ» выступит доктор технических наук, заведующий кафедрой программной инженерии ИКИТ, профессор кафедры информационных технологий в креативных и культурных индустриях ГИ СФУ Олеслав Антамошкин.

Ведущий семинара «Цифровая среда» – доцент кафедры исторической информатики МГУ, ведущий научный сотрудник DHLab СФУ Андрей Володин.

🕓 Встречаемся 25 февраля 2026, 15:00 (Москва) / 19:00 (Красноярск)

🔜 Регистрируемся на семинар здесь.

Подробнее

#цифроваясреда #смотреть #слушать #машинноеобучение #семантическийанализ
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥118👍75❤‍🔥2
Невидимое влияние технологий: что случится, если я откажусь от Google?

😉 Уверены, что это вы управляете поиском, а не он вами? На сайте The Digital Orientalist вышел интересный текст о трехмесячном опыте частичного отказа от излюбленной поисковой системы. Автор попробовал заменить привычный поиск в Google и зафиксировал несколько наблюдений:

🔜 Результаты поиска в альтернативном сервисе – DuckDuckGo – действительно отличаются: иногда удается обнаружить источники, которые не попадали в поле зрения раньше. А еще оказалось, что альтернативный поисковик предлагает меньше рекламы, больше приватности и позволяет отключать ИИ-результаты.

🔜 И все же полностью отказаться от Google не удалось. Такие сервисы как Google Books, Google Drive, Gmail слишком глубоко встроены в повседневную исследовательскую практику.

Главный вывод: поисковая система – не нейтральный посредник. Она влияет на то, какие источники мы находим, читаем и в конечном итоге считаем знанием.

James Harry Morris, Three Months of DuckDuckGo: Reflections after Partially “De-Googling”
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1275🤣1
🙂 Встречаемся на «Цифровой среде» уже через час. Тема сегодняшнего заседания научно-методического семинара о DH – «Машинное обучение и семантический анализ».

У нас в гостях доктор физико-математических наук, профессор РАН, руководитель лаборатории машинного обучения и семантического анализа Института искусственного интеллекта МГУ, лауреат Yandex ML Prize 2025 Константин Воронцов.

🕓 Начинаем в 15:00 (мск) / 19:00 (крск)

🔗 Успейте зарегистрироваться на семинар по ссылке

Присоединяйтесь!
Please open Telegram to view this post
VIEW IN TELEGRAM
965👍2
В подкасте факультета мировой экономики и мировой политики НИУ ВШЭ «Мировой факультет» обсуждают актуальные вызовы современности: что происходит в мире, чему учиться и как учить, чтобы быть ко всему этому готовым.

В новом выпуске о пугающем технологическом будущем и истории взаимоотношений человека с техникой и технологиями беседуют

доцент кафедры исторической информатики исторического факультета МГУ и ведущий научный сотрудник DHLab СФУ Андрей Володин

главный редактор журнала «Россия в глобальной политике», председатель Совета по внешней и оборонной политике, профессор-исследователь НИУ ВШЭ Фёдор Лукьянов

😉 Слушаем!
Please open Telegram to view this post
VIEW IN TELEGRAM
👏1097👍3
Спешим номинировать любимые проекты – свои и коллег – на премию DH Awards 2025 🙂

Сегодня последний день подачи заявок.

🔜 Заполнить форму
Please open Telegram to view this post
VIEW IN TELEGRAM
94👍3
Февраль.
Достать ноутбук —
Печатать!


📆Сегодня 1 марта, а #DeepSeekшутит про календарь, потому что в этом году подозрительно нет 29 февраля...
Что же делать в таком случае цифровому гуманитарию? Придется решать экзистенциальную проблему отсутствующей даты.

🔜Пропатчить календарь. Весь день писать в техподдержку Вселенной баг-репорты о том, что в хронологической базе данных «2026» обнаружен пропуск индекса. Требовать горячее исправление (hotfix) или хотя бы заглушку в виде 30 февраля.

🔜Оцифровать 29 февраля. Провести сеанс высоконаучной магии: взять 28 февраля, применить к нему оптическое распознавание символов (OCR), а затем с помощью нейросети сгенерировать текст за 29-е, чтобы корпус текстов февраля был полным.

🔜Провести квантитативный анализ. Весь день грустить, глядя на график частотности событий в феврале, потому что теперь в столбце с 29-м числом зияет пустота, и цикл тепловых карт (heatmap) безвозвратно испорчен.

🔜 Написать научную статью. Срочно подготовить исследование на тему: «Концептуализация отсутствия: дискурсивный анализ високосного разрыва в не-високосные годы. На материале пустых JSON-файлов и ошибок 404».

🔜Провести латентно-семантический анализ. Перечитывать «Год 2026: если бы да кабы...», пытаясь найти скрытые упоминания 29 февраля в газетах 2025 года, чтобы доказать, что заговор календарных издателей существует.

🔜И, конечно, в этот день можно наконец-то запустить тот самый код на Python, который ждёт своего часа с 29 февраля 2024 года, и с удивлением обнаружить, что он работает.

🎁 Иллюстрация: SeeDream.

🙂 Такие вот #шуткИИ в ожидании весны. Хорошего настроения!
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣11104👍1
🙂 Запись семинара «Цифровая среда» с Константином Воронцовым – уже в сети

В новом выпуске научно-методического семинара СФУ «Цифровая среда» доктор физико-математических наук, профессор РАН, руководитель лаборатории машинного обучения и семантического анализа Института искусственного интеллекта МГУ, лауреат Yandex ML Prize 2025 Константин Воронцов рассказал о

тематическом моделировании в цифровых гуманитарных исследованиях
автоматизации контент-анализа с использованием LLM
и концепции «Мастерской знаний» – информационно-поисковой системы для ученых-исследователей.

🔜 RuTube
🔜 VK video
🔜 YouTube

🔜 Презентация доклада «Машинное обучение и семантический анализ»

Делаем пометку в календаре: следующее заседание «Цифровой среды» состоится уже 11 марта.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥138👏41
🙂 Что произойдет, если дать ИИ-агентам реальные полномочия?

В свежей статье с поучительным названием «Агенты Хаоса» исследователи протестировали автономных LLM-агентов, интегрированных в реалистичную цифровую среду – с доступом к почте, чатам, файлам и системным командам.

Агенты функционировали в условиях, имитирующих реальные рабочие процессы: они выполняли как прикладные, так и провокационные задачи, взаимодействуя с 20 исследователями в течение двух недель.

Результат оказался предсказуемо тревожным. Агенты выдавали конфиденциальные данные, выполняли команды от неавторизованных пользователей, нарушали работу системы, вводили собеседников в заблуждение («задача выполнена» – но не тут-то было), самовольно решали, что делать «можно», а что «нельзя».

Мы на всех скоростях движемся к миру, где ИИ не просто генерирует тексты, а управляет процессами. Однако на сегодняшний день автономный агент – непредсказуемый участник системы, и его поведение в реальных условиях потенциально небезопасно.

🔜 Читать «Agents of Chaos»

Иллюстрация: Nano Banana
Please open Telegram to view this post
VIEW IN TELEGRAM
👍654💯31
🙂 Можно ли по названиям книг увидеть, как менялась литература?

11 марта приглашаем вас на очередное заседание научно-методического семинара «Цифровая среда». У нас в гостях — аспирантка Школы филологических наук НИУ ВШЭ Дарья Челнокова с докладом «Эволюция заглавий русских романов (1763–1917): вычислительный анализ преемственности и новаторства».

С помощью методов компьютерной лингвистики разберемся, как менялись названия русских романов от зарождения жанра до его расцвета на материале корпуса из 2000 заглавий. Обсудим ключевые результаты, интересные находки и возможные интерпретации.

🕓 Встречаемся 11 марта 2026 в 15:00 (Москва) / 19:00 (Красноярск)

🔜 Зарегистрироваться на семинар по ссылке

#цифроваясреда #смотреть #литература #лингвистика #тексты
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍64