DH CLOUD
721 subscribers
77 photos
4 videos
6 files
239 links
Делаем то, что считаем нужным, не теряя того, что считаем ценным
Download Telegram
Культурная аналитика, открытая лекция Льва Мановича

Понедельник, 31 октября |18:00 мск | Онлайн | Регистрация

В рамках проекта DH CLOUD и семинара по DH для студентов Вышки профессор Лев Манович прочтет лекцию о культурной аналитике. Именно он ввел в обращение этот термин и институционализировал само направление. Культурная аналитика или Cultural Analytics — область исследований, которая занимается изучением больших объемов культурных данных, используя для этого методы визуализации и вычисления. Объектом исследований являются как оцифрованные культурные артефакты, так и цифровой медиа-контент.

Модераторы встречи: Динара Гагарина, Анастасия Бонч-Осмоловская.

https://dhcloud.timepad.ru/event/2214083/
6
Напоминаем, что уже завтра в 18:00 мск состоится лекция Льва Мановича "Культурная аналитика".

Регистрация
👍6
Прямо сейчас идет лекций Льва Мановича "Культурная аналитика", присоединяйтесь!
👍3👎2
Лев Манович, лекция и дискуссия "Культурная аналитика" // DH CLOUD

Выложили видео вчерашней встречи.

https://youtu.be/A-eBieVu3RQ
16
Forwarded from DHRussia Новости
16 ноября (среда) 2022 года в 16:00 (msk) / 20:00 (krsk) на семинаре «Цифровая среда» DHRI@СФУ Куинн Домбровски (Стэнфордский университет) представит доклад “Directories as Utopian Infrastructure” («Каталоги как утопическая инфраструктура») — будут рассмотрены современные подходы к каталогизации ресурсов цифровых гуманитарных наук.
Доклад пройдет в Zoom на английском языке.
Регистрация и аннотация доступны по адресу: https://dhri.timepad.ru/event/2224905/
👍1
Сегодня начался симпозиум "Building Digital Humanities". Мероприятие проводится онлайн, участие бесплатное. Сессии симпозиума продлятся до 25 ноября.

https://web.cvent.com/event/811e389e-78de-46cd-877d-b20b9ae9ed85
👍4
Евгений Глазунов: Госкаталог РФ и унификации данных в нем

Понедельник, 14 ноября |18:00 мск | Онлайн | Регистрация

14 ноября на открытом мероприятии DH CLOUD выступит Евгений Глазунов с рассказом об унификации данных в Госкаталоге РФ, централизованном ресурсе, отражающем музейные экспонаты. Сотрудники музеев заполняют соответствующие поля в базе не всегда последовательно, и для поиска по этому ресурсу нужно произвести предварительную обработку с помощью методик NLP.

Дискутант: Иван Бегтин, директор, соучредитель АНО «Информационная культура», один из ведущих российских экспертов в области открытых данных (OpenData) и открытого государства (OpenGovernment), автор общественных проектов «Госзатраты», «Открытые НКО», «Понятный русский язык», «Цифровое сохранение».
🔥7👍1
Сегодня произошло важное событие в области цифрового сохранения культурного наследия: состоялся запуск электронного ресурса Слово Толстого, результата многолетней работы группы Tolstoy Digital. Ресурс представляет собой поисковую систему по текстам Толстого из «Юбилейного» собрания сочинений в 90 томах. Основная идея состояла в том, чтобы, сохраняя весь критический аппарат 90 томника, организовать пространство текстов концептуально новым образом, ориентированным на чтение и исследование наследия Толстого в цифровой среде. Более 15000 файлов были размечены в TEI формате. Кроме текстов были подготовлены справочники. На основе метаданных произведений Толстого был создан каталог произведений, в котором тексты Толстого, их черновики и варианты, комментарии к этим текстам объединены в единые сущности. В справочник людей включены 3000 имен, упомянутых в текстах. Редкие слова, размеченные в текстах, объясняются в словаре. Сами файлы в формате xml будут выложены в открытый доступ в ближайшее время.
🔥30👍2
Forwarded from DHRussia Новости
В следующую среду 14 декабря 2022 года в 16:00 (msk) / 20:00 (krsk) состоится очередное заседание научно-методического семинара «Цифровая среда» Института цифровых гуманитарных исследований (DHRI) Сибирского федерального университета. На семинаре выступит Анастасия Александровна Бонч-Осмоловская (DH Cloud) с докладом «Слово Толстого: путеводитель по наследию писателя на основе полного собрания сочинений в 90 томах».
Анонс и регистрация доступны по адресу: https://dhri.timepad.ru/event/2250328/
🔥52
Полина Колозариди От этики до метода: работа с данными как социальное действие

Понедельник, 19 декабря, 18:00 | Онлайн | Регистрация

На семинаре Полина Колозариди расскажет о том, какие подходы к этике работы с онлайн-данными есть в гуманитарных и социальных научных практиках, и какие есть проблемы с этими подходами. Мы поговорим о том, почему слово «этика» часто обескураживает учёных, как возможны этические споры и какие отношения между исследователями, дисциплинами и объектами они формируют. Полина покажет базовую схему превращения материалов в данные, а данных — в политически значимые явления. На примерах мы разберёмся с тем, какие действия становятся возможными, а какие — осложняются в ситуациях озабоченности последствиями интеллектуальных проектов.
8🔥3
Мы стартовали, еще не поздно присоединиться. Сегодня с нами Полина Колозариди
Продолжаем разговор про цифровые издания. Завтра в доме творчества Переделкино состоится конференция «От буквы к цифре: наследие писателя в цифровую эпоху». Можно приехать в Переделкино или присоединиться к онлайн трансляции. Регистрация на трансляцию и программа конференции по ссылке. https://tolstoymuseum.timepad.ru/event/2265169/
🔥4
Основательница DH магистратуры в пермской Вышке Динара Гагарина дала интервью «Системному Блоку». В октябре из-за антивоенных постов Динару отстранили от руководства магистратурой, а саму магистратуру попытались закрыть. В интервью Динара рассказала, как ей удалось отстоять магистратуру, а еще поделилась своим взглядом на то, что происходит с Digital Humanities в России после 24 февраля 2022

https://sysblok.ru/interviews/govorit-o-vojne-nebespolezno-dinara-gagarina-o-digital-humanities-v-rossii-posle-24-fevralja/
🔥105
Forwarded from Ivan Begtin (Ivan Begtin)
К вопросу о том как искать данные, ключевой проект в этой области - это Google Dataset search [1] который до сих пор имеет статус исследовательского и "не вышел из инкубатора". Он всем хорош, например, использует разметку Dataset из Schema.org для идентификации наборов данных на сайтах и позволяет получать нужные данные быстро если владелец их разметил. Но у него есть системная проблема, она заключается в том что для наборов данных не работает ранжирование теми же методами что для других поисковых индексов, они редко ссылаются друг на друга. Так как определить данные по значимости при поиске? По ключевым словам? Поиск быстро "замусоривается"․ Что и произошло с ним в данном случае. Например, когда ищешь стат показатели по множеству запросов вылезают ссылки на коммерческий проект CEIC. Вроде такого [2], выдаётся первым на запрос "European statistics". Разметка на странице там есть, а вот содержания нет. Нет там и лицензий CC-BY, ни многого другого. Это типичная SEO страница для тех кто торгует данными. Это если мы ищем любые данные, не только бесплатные. А если сделаем фильтр на бесплатные и поищем "Russian statistics" то первым вылезет ссылка на набор данных Linkedin users in Russian Federation [3] сервиса NapoleonCat где нет никаких данных, только график картинкой.

Краткий вывод неутешителен, хороших поисковиков по данным сейчас нет. Задачи data discovery требуют больших усилий, с одной стороны, с другой это не рынок услуг, поскольку платить кому-то за целенаправленный поиск мало кто готов. Только рынок продуктов. Интересно когда появятся достойные альтернативы?

Ссылки:
[1] https://datasetsearch.research.google.com
[2] https://www.ceicdata.com/en/european-union/eurostat-trade-statistics-by-sitc-european-union-russia
[3] https://napoleoncat.com/stats/linkedin-users-in-russian_federation/2022/01/

#datadiscovery #datasets #opendata #searchengines #google
👍4
Дорогие коллеги - те, кто ведет курсы по DH в российских университетах,

пишу как модератор от России на DH Course Registry https://dhcr.clarin-dariah.eu/. К сожалению, практически вся имеющаяся там информация по российским DH программам не актуальна (и скрыта по истечении сроков).

Будет здорово, если вы добавите свои отдельные курсы или целые программы (бак, маг) на эту платформу. Принимаются курсы/программы по Digital Humanities в целом или по отдельным направлениям DH, в том числе компьютерной лингвистике, цифровой истории, исторической информатике.

Готова ответить на вопросы или помочь при необходимости.

Ну и в целом рекомендую https://dhcr.clarin-dariah.eu/ как самый большой международный каталог программ по Digital Humanities.
👍3