Полина Колозариди От этики до метода: работа с данными как социальное действие
Понедельник, 19 декабря, 18:00 | Онлайн | Регистрация
На семинаре Полина Колозариди расскажет о том, какие подходы к этике работы с онлайн-данными есть в гуманитарных и социальных научных практиках, и какие есть проблемы с этими подходами. Мы поговорим о том, почему слово «этика» часто обескураживает учёных, как возможны этические споры и какие отношения между исследователями, дисциплинами и объектами они формируют. Полина покажет базовую схему превращения материалов в данные, а данных — в политически значимые явления. На примерах мы разберёмся с тем, какие действия становятся возможными, а какие — осложняются в ситуациях озабоченности последствиями интеллектуальных проектов.
Понедельник, 19 декабря, 18:00 | Онлайн | Регистрация
На семинаре Полина Колозариди расскажет о том, какие подходы к этике работы с онлайн-данными есть в гуманитарных и социальных научных практиках, и какие есть проблемы с этими подходами. Мы поговорим о том, почему слово «этика» часто обескураживает учёных, как возможны этические споры и какие отношения между исследователями, дисциплинами и объектами они формируют. Полина покажет базовую схему превращения материалов в данные, а данных — в политически значимые явления. На примерах мы разберёмся с тем, какие действия становятся возможными, а какие — осложняются в ситуациях озабоченности последствиями интеллектуальных проектов.
dhcloud.timepad.ru
Полина Колозариди: От этики до метода: работа с данными как социальное действие / События на TimePad.ru
Встреча в рамках проекта DH CLOUD
❤8🔥3
Продолжаем разговор про цифровые издания. Завтра в доме творчества Переделкино состоится конференция «От буквы к цифре: наследие писателя в цифровую эпоху». Можно приехать в Переделкино или присоединиться к онлайн трансляции. Регистрация на трансляцию и программа конференции по ссылке. https://tolstoymuseum.timepad.ru/event/2265169/
tolstoymuseum.timepad.ru
Конференция «От буквы к цифре: наследие писателя в цифровую эпоху» / События на TimePad.ru
Группа Tolstoy Digital и Дом творчества Переделкино приглашает вас принять участие в конференции «От буквы к цифре: наследие писателя в цифровую эпоху», приуроченной к запуску проекта “Слово Толстого” и посвященной проблемам цифровизации литературного наследия…
🔥4
Полина Колозариди: От этики до метода: работа с данными как социальное действие
Выложили запись последнего семинара DH CLOUD
https://youtu.be/4ehvRnuBQNo
Выложили запись последнего семинара DH CLOUD
https://youtu.be/4ehvRnuBQNo
YouTube
Полина Колозариди: От этики до метода: работа с данными как социальное действие //DH CLOUD, 19.12.22
На семинаре Полина Колозариди расскажет о том, какие подходы к этике работы с онлайн-данными есть в гуманитарных и социальных научных практиках, и какие есть проблемы с этими подходами. Мы поговорим о том, почему слово «этика» часто обескураживает учёных…
❤5
Forwarded from Вестник Digital Humanities
Основательница DH магистратуры в пермской Вышке Динара Гагарина дала интервью «Системному Блоку». В октябре из-за антивоенных постов Динару отстранили от руководства магистратурой, а саму магистратуру попытались закрыть. В интервью Динара рассказала, как ей удалось отстоять магистратуру, а еще поделилась своим взглядом на то, что происходит с Digital Humanities в России после 24 февраля 2022
https://sysblok.ru/interviews/govorit-o-vojne-nebespolezno-dinara-gagarina-o-digital-humanities-v-rossii-posle-24-fevralja/
https://sysblok.ru/interviews/govorit-o-vojne-nebespolezno-dinara-gagarina-o-digital-humanities-v-rossii-posle-24-fevralja/
Системный Блокъ
«Говорить о войне небесполезно»: Динара Гагарина о Digital Humanities в России после 24 февраля
Динара Гагарина основала магистратуру по цифровым методам в гуманитарных науках в пермской Вышке. Из-за антивоенных постов Динары магистратуру попытались закрыть. Мы поговорили с Динарой о том, как ей удалось отстоять магистратуру и что будет с Digital Humanities…
🔥10❤5
Forwarded from Ivan Begtin (Ivan Begtin)
К вопросу о том как искать данные, ключевой проект в этой области - это Google Dataset search [1] который до сих пор имеет статус исследовательского и "не вышел из инкубатора". Он всем хорош, например, использует разметку Dataset из Schema.org для идентификации наборов данных на сайтах и позволяет получать нужные данные быстро если владелец их разметил. Но у него есть системная проблема, она заключается в том что для наборов данных не работает ранжирование теми же методами что для других поисковых индексов, они редко ссылаются друг на друга. Так как определить данные по значимости при поиске? По ключевым словам? Поиск быстро "замусоривается"․ Что и произошло с ним в данном случае. Например, когда ищешь стат показатели по множеству запросов вылезают ссылки на коммерческий проект CEIC. Вроде такого [2], выдаётся первым на запрос "European statistics". Разметка на странице там есть, а вот содержания нет. Нет там и лицензий CC-BY, ни многого другого. Это типичная SEO страница для тех кто торгует данными. Это если мы ищем любые данные, не только бесплатные. А если сделаем фильтр на бесплатные и поищем "Russian statistics" то первым вылезет ссылка на набор данных Linkedin users in Russian Federation [3] сервиса NapoleonCat где нет никаких данных, только график картинкой.
Краткий вывод неутешителен, хороших поисковиков по данным сейчас нет. Задачи data discovery требуют больших усилий, с одной стороны, с другой это не рынок услуг, поскольку платить кому-то за целенаправленный поиск мало кто готов. Только рынок продуктов. Интересно когда появятся достойные альтернативы?
Ссылки:
[1] https://datasetsearch.research.google.com
[2] https://www.ceicdata.com/en/european-union/eurostat-trade-statistics-by-sitc-european-union-russia
[3] https://napoleoncat.com/stats/linkedin-users-in-russian_federation/2022/01/
#datadiscovery #datasets #opendata #searchengines #google
Краткий вывод неутешителен, хороших поисковиков по данным сейчас нет. Задачи data discovery требуют больших усилий, с одной стороны, с другой это не рынок услуг, поскольку платить кому-то за целенаправленный поиск мало кто готов. Только рынок продуктов. Интересно когда появятся достойные альтернативы?
Ссылки:
[1] https://datasetsearch.research.google.com
[2] https://www.ceicdata.com/en/european-union/eurostat-trade-statistics-by-sitc-european-union-russia
[3] https://napoleoncat.com/stats/linkedin-users-in-russian_federation/2022/01/
#datadiscovery #datasets #opendata #searchengines #google
👍4
Дорогие коллеги - те, кто ведет курсы по DH в российских университетах,
пишу как модератор от России на DH Course Registry https://dhcr.clarin-dariah.eu/. К сожалению, практически вся имеющаяся там информация по российским DH программам не актуальна (и скрыта по истечении сроков).
Будет здорово, если вы добавите свои отдельные курсы или целые программы (бак, маг) на эту платформу. Принимаются курсы/программы по Digital Humanities в целом или по отдельным направлениям DH, в том числе компьютерной лингвистике, цифровой истории, исторической информатике.
Готова ответить на вопросы или помочь при необходимости.
Ну и в целом рекомендую https://dhcr.clarin-dariah.eu/ как самый большой международный каталог программ по Digital Humanities.
пишу как модератор от России на DH Course Registry https://dhcr.clarin-dariah.eu/. К сожалению, практически вся имеющаяся там информация по российским DH программам не актуальна (и скрыта по истечении сроков).
Будет здорово, если вы добавите свои отдельные курсы или целые программы (бак, маг) на эту платформу. Принимаются курсы/программы по Digital Humanities в целом или по отдельным направлениям DH, в том числе компьютерной лингвистике, цифровой истории, исторической информатике.
Готова ответить на вопросы или помочь при необходимости.
Ну и в целом рекомендую https://dhcr.clarin-dariah.eu/ как самый большой международный каталог программ по Digital Humanities.
dhcr.clarin-dariah.eu
The Digital Humanities Course Registry
The Digital Humanities Course Registry is a curated platform that provides an overview of the growing range of teaching activities in the field of digital humanities worldwide.
👍3
Круглый стол "Digital Humanities в Центральной Азии"
📍15 марта, 10:00 - 16:00 (GMT +5) / Онлайн / Регистрация
DH CLOUD совместно с экспертами Digital Humanities из ведущих университетов Центральной Азии проводят круглый стол.
Цель мероприятия — обсуждение цифровой трансформации гуманитарных исследований и образования в университетах стран Центральной Азии, актуализация таких исследований и проектов, формирование сообщества для развития Digital Humanities в регионе.
К участию приглашаются исследователи, преподаватели и студенты университетов, сотрудники архивов, музеев и библиотек, все, кто интересуется или занимается цифровой трансформацией гуманитарных наук.
Круглый стол будет состоять из трех полуторачасовых панельных дискуссий, где эксперты представят свое видение и ответят на вопросы модераторов и участников:
✔ Цифровые исследования истории, культуры и языков народов и стран Центральной Азии;
✔ Цифровое сохранение и репрезентация культурного наследия и исторической памяти;
✔ Образовательные программы и инфраструктурное развитие Digital Humanities в Центральной Азии.
Сайт круглого стола: https://ca.dhcloud.org/
📍15 марта, 10:00 - 16:00 (GMT +5) / Онлайн / Регистрация
DH CLOUD совместно с экспертами Digital Humanities из ведущих университетов Центральной Азии проводят круглый стол.
Цель мероприятия — обсуждение цифровой трансформации гуманитарных исследований и образования в университетах стран Центральной Азии, актуализация таких исследований и проектов, формирование сообщества для развития Digital Humanities в регионе.
К участию приглашаются исследователи, преподаватели и студенты университетов, сотрудники архивов, музеев и библиотек, все, кто интересуется или занимается цифровой трансформацией гуманитарных наук.
Круглый стол будет состоять из трех полуторачасовых панельных дискуссий, где эксперты представят свое видение и ответят на вопросы модераторов и участников:
✔ Цифровые исследования истории, культуры и языков народов и стран Центральной Азии;
✔ Цифровое сохранение и репрезентация культурного наследия и исторической памяти;
✔ Образовательные программы и инфраструктурное развитие Digital Humanities в Центральной Азии.
Сайт круглого стола: https://ca.dhcloud.org/
ca.dhcloud.org
Digital Humanities в Центральной Азии
Онлайн круглый стол, 15 марта 2023
🔥2
Колонка Бориса Орехова в «Известиях», посвященная нашумевшей истории о защите диплома, написанного нейросетью.
В тексте для газеты пришлось пожертвовать примерами абсурдных ответов chatGPT. А они бывают. Несмотря на то, что с широким спектром задач нейросеть справляется блестяще, это далеко не всесильный разум.
Комментарий к вопросу о великих романах Достоевского: у литературоведов даже есть специальный термин «великое пятикнижие», под которым подразумевают «Преступление и наказание», «Идиот», «Бесы», «Подросток», «Братья Карамазовы».
В тексте для газеты пришлось пожертвовать примерами абсурдных ответов chatGPT. А они бывают. Несмотря на то, что с широким спектром задач нейросеть справляется блестяще, это далеко не всесильный разум.
Комментарий к вопросу о великих романах Достоевского: у литературоведов даже есть специальный термин «великое пятикнижие», под которым подразумевают «Преступление и наказание», «Идиот», «Бесы», «Подросток», «Братья Карамазовы».
🔥7👍6👎1
Forwarded from DHRussia Новости
В эту среду 22 февраля 2023 года в 15:00 (msk) / 19:00 (krsk) / 13:00 (CET) состоится очередное заседание научно-методического семинара «Цифровая среда» Института цифровых гуманитарных исследований (DHRI) Сибирского федерального университета. На семинаре выступит Дмитрий Олегович Жаров (Центрально-Европейский университет) с докладом «„Пишу тебе“. Цифровой корпус открыток».
Приглашенный дискутант — доцент исторического факультета МГУ, доктор исторических наук Александр Сергеевич Медяков, автор монографии «Война формата 9х14. Открытки в немецкой „культуре войны“ 1914-1918 гг.» (М., 2021).
Анонс и регистрация доступны по адресу: https://dhri.timepad.ru/event/2325300/
Приглашенный дискутант — доцент исторического факультета МГУ, доктор исторических наук Александр Сергеевич Медяков, автор монографии «Война формата 9х14. Открытки в немецкой „культуре войны“ 1914-1918 гг.» (М., 2021).
Анонс и регистрация доступны по адресу: https://dhri.timepad.ru/event/2325300/
dhri.timepad.ru
«„Пишу тебе“. Цифровой корпус открыток». Доклад Д.О.Жарова на семинаре „Цифровая среда“ DHRI@SFU / События на TimePad.ru
22 февраля 2023 года в 15:00 (msk) / 19:00 (krsk) / 13:00 (CET) состоится очередное заседание научно-методического семинара «Цифровая среда» Института цифровых гуманитарных исследований (DHRI) Сибирского федерального университета. На семинаре выступит Дмитрий…
🔥4❤3
Центр научный работников и преподавателей иудаки в вузах «Сэфер» приглашает на онлайн курс изучения языка идиш цифровыми методами: корпуса газет на идише, многоязычные корпуса, программы для обработки текстов и аудиоданных на идише, создание собственных баз данных. Курс состоится 6, 13, 10 и 27 марта. #анонс #education https://sefercenter.org/rus/education/educational_programmes/izuchaya-idish-tsifrovymi-metodami-korpusa-bazy-dannykh-instrumentariy.php
❤3👍2
Last call! До завтра еще можно подать заявку на трехдневную школу CLS INFRA. CLS INFRA - это европейский инфраструктурный проект, посвященный computational literary studies. Предлагается крэш курс под названием Dig for gold, цель которого обучение современным методам извлечения знаний из корпуса текстов (от стилометрии до NLP). Школа бесплатная и будет проходить одновременно онлайн и оффлайн с 9 по 11 мая в Мадриде. Все подробности тут. https://clsinfra.io/events/training-school/ #education
❤10🔥2
В университете Лидса замечательная серия открытых лекций воркшопов, посвященных цифровизации рукописей и манскриптов. #анонс Часть из них в зуме. https://www.eventbrite.com/cc/digital-explorations-at-leeds-1835749?fbclid=IwAR1Ox0DE7CgPCTnx7fVMsp8M6-Re9CPBHLp2heYsWV2tn0m0AItUbzY3RHw
Eventbrite
Digital Explorations at Leeds
These events are part of the Digital Explorations: Opening the Medieval Manuscript Fragments from the Ripon Cathedral Library project supported by UK Research and Innovation (UKRI) Research England under the Enhancing Research Culture funding stream.
❤6
Forwarded from Системный Блокъ
«И пусть все читают “Одумайтесь”»: Анастасия Бонч-Осмоловская о цифровом Толстом и пересборке DH после 24 февраля
Анастасия Бонч-Осмоловская в 2012-м создала первую современную магистратуру по компьютерной лингвистике в России, а в 2016 — первый большой центр Digital Humanities. Главные проекты центра связаны с продвинутой оцифровкой наследия Льва Толстого. В интервью «Системному Блоку» она рассказала, как и зачем делалось цифровое издание 90-томника Л.Н.Толстого и что изменилось в российских Digital Humanities после 24.02.2022.
Кратко: о чём интервью?
В 2013 году, когда Анастасия Бонч-Осмоловская и её коллеги, Борис Орехов и Михаил Гронас, увлеклись Digital Humanities, они также заинтересовались форматом Digital Edition (цифрового издания). Начать работу решили с текстов Льва Толстого, и скоро стало понятно, что надо разрабатывать отдельный механизм взаимодействия пользователя с цифровым текстом, не такой, как с печатной книгой. Перед создателями издания стояло множество вопросов: какой должна быть разметка? Что должно быть размечено? Нужно ли разделить тексты на те же 90 томов, в которых они были опубликованы? Важно было продумать, как будут выглядеть небольшие, но значимые элементы интерфейса, чтобы читатель мог узнать, что такое «ЕБЖ», когда слово написано неразборчиво или изменено редактором.
Намного более сложной задачей, впрочем, стало создание «семей текстов» для «Слова Толстого». В такие «семьи» в проекте объединяются, например, варианты одного и того же текста. У них всегда есть «семейное» имя, например, в начале написано «Анна Каренина», а потом «первый вариант», «второй вариант», «третий вариант», «планы и заметки». Туда же помещаются все комментарии, которые имеют отношение к тексту. При работе с поиском по такому тексту можно обращаться только к основному варианту, а можно поставить галочку и искать с черновиками и вариантами, и, главное, можно легко переходить в «семейное» древо.
Прочитать больше подробностей о проекте и выросшем вокруг него DH центре Вышки, узнать, изменилось ли что-то в русских Digital Humanities после 24 февраля 2022 года и понять разницу между Digital Preservation и Digital Presentation можно в полном тексте интервью.
Время чтения: 18 минут.
Анастасия Бонч-Осмоловская в 2012-м создала первую современную магистратуру по компьютерной лингвистике в России, а в 2016 — первый большой центр Digital Humanities. Главные проекты центра связаны с продвинутой оцифровкой наследия Льва Толстого. В интервью «Системному Блоку» она рассказала, как и зачем делалось цифровое издание 90-томника Л.Н.Толстого и что изменилось в российских Digital Humanities после 24.02.2022.
Кратко: о чём интервью?
В 2013 году, когда Анастасия Бонч-Осмоловская и её коллеги, Борис Орехов и Михаил Гронас, увлеклись Digital Humanities, они также заинтересовались форматом Digital Edition (цифрового издания). Начать работу решили с текстов Льва Толстого, и скоро стало понятно, что надо разрабатывать отдельный механизм взаимодействия пользователя с цифровым текстом, не такой, как с печатной книгой. Перед создателями издания стояло множество вопросов: какой должна быть разметка? Что должно быть размечено? Нужно ли разделить тексты на те же 90 томов, в которых они были опубликованы? Важно было продумать, как будут выглядеть небольшие, но значимые элементы интерфейса, чтобы читатель мог узнать, что такое «ЕБЖ», когда слово написано неразборчиво или изменено редактором.
Намного более сложной задачей, впрочем, стало создание «семей текстов» для «Слова Толстого». В такие «семьи» в проекте объединяются, например, варианты одного и того же текста. У них всегда есть «семейное» имя, например, в начале написано «Анна Каренина», а потом «первый вариант», «второй вариант», «третий вариант», «планы и заметки». Туда же помещаются все комментарии, которые имеют отношение к тексту. При работе с поиском по такому тексту можно обращаться только к основному варианту, а можно поставить галочку и искать с черновиками и вариантами, и, главное, можно легко переходить в «семейное» древо.
Прочитать больше подробностей о проекте и выросшем вокруг него DH центре Вышки, узнать, изменилось ли что-то в русских Digital Humanities после 24 февраля 2022 года и понять разницу между Digital Preservation и Digital Presentation можно в полном тексте интервью.
Время чтения: 18 минут.
Системный Блокъ
Анастасия Бонч-Осмоловская о цифровом Толстом и пересборке DH
Анастасия Бонч-Осмоловская ― лингвист, филолог, цифровая исследовательница, идейная вдохновительница и душа российских Digital Humanities. «Системный Блокъ» поговорил с Анастасией о работе над цифровым изданием 90-томника Л.Н.Толстого и пересборке российского…
❤7👍3
Forwarded from Инфокультура
Уже завтра состоится онлайн-мероприятие — День открытых данных 2023.
Мероприятие стартует в 11:00. Расписание выступлений доступно здесь: https://opendataday.ru/msk#program
В программе:
— Мастер-классы о том, как обрабатывать и визуализировать гео-пространственные данные.
— Как искать данные с помощью каталогов данных. Проект datacatalogs.ru.
— Если быть точным в 2022 году: доступны ли данные по социальным проблемам.
— Использование открытых данных в общественном контроле в сфере ЖКХ.
— Цифровые архивы: как собираются цифровые коллекции открытых и общедоступных данных институтов памяти.
Трансляция мероприятия:
- https://opendataday.ru/msk#stream
- https://www.youtube.com/@Infoculture/streams
Слушайте доклады, задавайте вопросы спикерам и принимайте участие в мастер-классах и становитесь частью движения, продвигая открытые данные в своей деятельности!
#OpenDataDay #OpenData #ODD2023
#BetterTogetherThanAlone
Мероприятие стартует в 11:00. Расписание выступлений доступно здесь: https://opendataday.ru/msk#program
В программе:
— Мастер-классы о том, как обрабатывать и визуализировать гео-пространственные данные.
— Как искать данные с помощью каталогов данных. Проект datacatalogs.ru.
— Если быть точным в 2022 году: доступны ли данные по социальным проблемам.
— Использование открытых данных в общественном контроле в сфере ЖКХ.
— Цифровые архивы: как собираются цифровые коллекции открытых и общедоступных данных институтов памяти.
Трансляция мероприятия:
- https://opendataday.ru/msk#stream
- https://www.youtube.com/@Infoculture/streams
Слушайте доклады, задавайте вопросы спикерам и принимайте участие в мастер-классах и становитесь частью движения, продвигая открытые данные в своей деятельности!
#OpenDataDay #OpenData #ODD2023
#BetterTogetherThanAlone
👍3❤2