DH CLOUD
689 subscribers
76 photos
4 videos
6 files
225 links
Делаем то, что считаем нужным, не теряя того, что считаем ценным
Download Telegram
🌐Лекция «Гуманитарий в эпоху датаизма: как осмыслить данные вокруг нас?»

👤Приглашаем на заключительную лекцию марафона!
Докладчик: Андрей Володин, к. и. н., доцент кафедры исторической информатики исторического факультета МГУ им. М. В. Ломоносова, DHRI СФУ

Данные окружают нас, данные повсюду. Датафикация – процесс устойчивого фиксирования массовых наблюдений в разных форматах данных, позволяющий осуществить их качественную и количественную обработку, их научный анализ и синтез. А датаизм — это точка зрения, что Вселенная состоит из потоков данных, когда ценность всякого явления определяется вкладом в обработку данных. Как быть гуманитарием в этом новом мире, как осмыслить собственный «улов» данных и зачем вносить существенный вклад в обработку данных в эпоху повсеместного машинного обучения?

🕰 Мастер-класс начнется 25 мая в 17:00 (мск.)
👉🏻 Регистрация: perm.hse.ru/marathon/2023
Дорогие коллеги, если вы разрабатываете и ведете образовательные программы по Digital Humanities, цифровой истории, компьютерной лингвистике и смежным направлениям, расскажите об этой программе на сайте DH Course Registry https://dhcr.clarin-dariah.eu/.

На этой платформе собраны разные форматы - магистратуры, бакалавриаты, летние школы, отдельные курсы со всего мира. И пока тут практически нет программ из Центральной Азии и России.

Это отличная возможность, чтобы о вашей программе узнали потенциальные абитуриенты и международное сообщество.

Обращайтесь с любыми вопросами по платформе к Динаре Гагариной (@dinaraamirovna). Если вы хотите добавить свой курс, тоже напишите Динаре.
Forwarded from DHRussia Новости
31 мая 2023 года в 15:00 (msk) / 19:00 (krsk) состоится очередное заседание научно-методического семинара «Цифровая среда» Института цифровых гуманитарных исследований (DHRI) Сибирского федерального университета. На семинаре выступит Роман Борисович Кончаков (РАНХиГС) с докладом «Проблемы описания и публикации данных исторической статистики онлайн».
Регистрация и аннотация доклада по адресу: https://dhri.timepad.ru/event/2444752/
This media is not supported in your browser
VIEW IN TELEGRAM
Небольшая видео-презентация пленарного доклада Динары Гагариной "Digital Humanities в Центральной Азии: точки роста" на конференции Ташкентского университета прикладных наук.

Будем рады совместным проектам и мероприятиям по развитию цифровых гуманитарных исследований в Центральной Азии!
Модули Python для решения задач Digital Humanities

Завели на нашем сайте раздел, где будем собирать полезные инструменты, разработанные сообществом DH CLOUD и студентами магистратур по Digital Humanities. Начнем с трех модулей для Python, дальше коллекция будет пополняться.

https://dhcloud.org/python/
Румыния становится важным центром DH образования. Туда переехал из Лейпцига летний европейский университет «Сulture and technology» А в конце июня пройдет школа по корпусной лингвистике и digital humanities. (❗️взнос всего 50 евро) https://dilarass.uvt.ro/
Борис Орехов опубликовал препринт с результатами эксперимента, в котором участвовало под сотню студентов-филологов. Задача была в том, чтобы понять, могут ли респонденты угадать стиль автора, на котором обучалась lstm-модель. Проверялись короткие отрывки в 4 строки, сгенерированные нейросетями, натренированными на текстах Некрасова, Мандельштама и раннего Пастернака. Во всех случаях большинство ответов оказались верными. Важным для результатов оказалось и то, знают ли респонденты стихи поэта наизусть.
Прикладной анализ данных в социальных науках

Академия Яндекса совместно с Европейским университетом в Санкт-Петербурге разработала новый хендбук (онлайн-учебник) «Прикладной анализ данных в социальных науках». Хендбук составлен так, чтобы любой человек без навыков в области анализа данных или программирования мог за короткий срок понять общую логику и техническую сторону процесса, провести самостоятельное исследование и научиться программировать на Python. Учебник бесплатный.
Stylo beats GPT: большие языковые модели не могут (пока) обмануть стилометрию

Этим вечером в Сиене закончилась главная итальянская DH-конференция AIUCD. Среди прочих докладов нас заинтересовал эксперимент по тестированию Delta на текстах, сгенерированных GPT3 и (чуть-чуть) ChatGPT.

🧪Чтобы проделать тест, исследователи нагенерировали в GPT3 текстов “в стиле” десяти английских авторов. Через API GPT3 они закидывали запросы вида “Напиши главу романа в стиле автора А”, “Напиши роман, имитирующий автора Б”, “Напиши рассказ так, как будто он написан автором В” и т.п. — всего 320 комбинаций. Так постепенно нагенерировали “текстоиды” (термин самих исследователей) длиной не менее 5000 слов. Эти текстоиды затем сравнивались с реальными текстами тех же авторов.

😔Результат пока что в пользу стилометрии: тексты GPT3 “в стиле” разных авторов похожи не на этих авторов , а друг на друга (см. картинку). Для ChatGPT, к которому у авторов статьи еще не было API, сделали эксперимент с одним автором (Диккенс), и там стайло тоже обмануть не удалось.

🤔 Причиной "неудач” языковых моделей в имитации авторского сигнала становится хроническое недоиспользование некоторых частотных слов. Например они редко используют отрицательные частицы (прям как некоторые из нас, не умеющие говорить “нет”), а еще модальные глаголы типа might.

🔗Ссылка на сборник AIUCD 2023 и нужную страницу со статьей про Delta vs GPT:

https://www.aiucd.it/wp-content/uploads/2023/06/2023_aiucd_la_memoria_digitale_v1.pdf#page=305
Forwarded from DHRussia Новости
29 июня – 2 июля 2023 г. истфак МГУ и АИК проводят международную летнюю онлайн-школу молодых ученых «Историческая информатика – 2023».

Регистрация на Школу открыта до 21:00 (msk) 28 июня 2022 года: https://aik.timepad.ru/event/2428502/ (по ссылке есть и программа лектория первого дня Школы).

Кто хочет попробовать себя в качестве докладчика в день молодежной конференции в рамках Школы, должен успеть зарегистрироваться не позднее 20 июня.
Forwarded from DHRussia Новости
Продолжается регистрация заявок на конференцию «Информационные технологии в гуманитарных исследованиях», которая пройдет с 25 по 28 сентября 2023 года на базе Сибирского федерального университета в Красноярске в смешанном формате.

Регистрация участников и приём текстов докладов проводятся по адресу: https://conf.sfu-kras.ru/dhri/ до 30 июня.
Forwarded from DHRussia Новости
В ближайшую среду 28 июня 2023 года в 15:00 (msk) / 19:00 (krsk) состоится очередное заседание онлайн-семинара «Цифровая среда» Института цифровых гуманитарных исследований СФУ.

На семинаре выступит Владислава Леонидовна Гайдук (ГМИИ имени А.С.Пушкина) с докладом «Цифровой архив в музее: проблемы и перспективы».

Аннотация доклада и форма регистрации доступны по адресу:
https://dhri.timepad.ru/event/2468014/
Началась III летняя школа по исторической информатике. Организаторы: Исторический факультет МГУ и межрегиональная ассоциация "История и компьютер".

На скриншоте - сооснователь DH CLOUD Борис Орехов читает лекцию "Вызовы GPT для современного гуманитария".

Программа школы: https://www.hist.msu.ru/about/gen_news/rss/90064
Исторические почтовые открытки с дореволюционной политической карикатурой, памятниками русской архитектуры и милыми попугайчиками — теперь прямо в телеграме!

Уже полтора года при издании “Системный Блокъ” существует проект оцифровки, расшифровки и изучения старых почтовых открыток “Пишу тебе”. И вот наконец “Пишу тебе” дорос до собственного медиа-канала. Подписывайтесь на телеграм-канал проекта, теперь про открытки рассказывают там, а не в Системном Блоке. И рассказывают больше и богаче:

https://tttttt.me/pishuteberu

Там тоже будут цифровые сюжеты: разметка и классификация объектов на открытках с помощью компьютерного зрения, изучение корпуса расшифрованных текстов количественными методами, картографирование почтовой переписки и GIS-ы, анализ метаданных…
TRANSKRIBUS - самая знаменитая платформа для распознавания текстов рукописей, исторических документов и старинных книг. 18 июля Transkribus проводит бесплатный вводный вебинар для тех, кто хочет научиться работать с платформой, а заодно и представит новый интерфейс https://readcoop.eu/events/introduction-to-transkribus-and-the-new-user-interface/?utm_content=166445544&utm_medium=social&utm_source=facebook&hss_channel=fbp-546945145805190
Летний набор в «Системный Блокъ»

«Системный Блокъ» запускает новые направления и расширяется — приглашаем новых авторов, редакторов, продюсеров, PR-менеджеров, дата-аналитиков. Нас объединяет интерес к науке и технологиям и желание вдохновлять людей. Среди нас есть филологи, программисты, менеджеры, историки, журналисты и аналитики — люди из совершенно разных сфер.

Мы полностью волонтерский проект. Ниже вы найдете набор ролей, которые могут быть интересны вам или вашим друзьям. Если что-то из этого вам близко, добро пожаловать к нам! Если вы хотите присоединиться, но идеальной роли нет, то все равно оставляйте заявку!

В посте — неполный перечень ролей, которые сейчас открыты, а в статье — подробное описание задач и пожеланий к участникам.

1. Авторы в рубрики — от филологии, искусства, общества до «как это работает»

2. Редактор, выпускающий редактор Телеграма

3. Продюсер рубрики (новой или существующей), менеджер лектория или ивент-менеджер, комьюнити-менеджер

4. PR-менеджер «Системного Блока» или «Пишу тебе», маркетолог

5. Продакт-менеджер на развитие IT-продуктов в «Системном Блоке» и «Пишу тебе»

6. Куратор проектов на хакатоне, продюсер дата-исследований в дата-отдел, визуализатор в дата-отдел

7. Программист/ведущий программист в одну из команд

8. Аналитик в одну из команд

9. Иллюстратор статей, графический дизайнер

10. Data Worm — специалист по поиску данных в открытых источниках

Если вас заинтересовала одна из ролей – приглашаем заполнить форму до 10.07.
Faculty of Liberal Arts and Sciences in Montenegro объявляет набор на бакалавриат в 2023 году.

Шесть majors на выбор: Art History, Cross Cultural Linguistics, Digital Humanities, Media Studies and Journalism, New Political Sciences и Social Theory and Sociological Research.

Преподавание на английском и русском языках, срок обучения — 3 года, по стандартам Болонской системы.