DH CLOUD
575 subscribers
56 photos
3 videos
5 files
177 links
Делаем то, что считаем нужным, не теряя того, что считаем ценным
Download Telegram
Портал «История Казахстана» и инициативы по оцифровке архивов в регионе.

В этот четверг, 22 февраля, на семинаре "Цифровая
история (в) Центральной Азии" выступит Кайрат Алимгазинов из Архива Президента Республики Казахстан. Будем говорить о портале "История Казахстана" и оцифровке архивов в регионе.

Начало в 14:15 CEST / 16:15 мск / 18:15 Ташкент / 19:15 Бишкек и Алматы. Язык презентации - русский, вопросы традиционно на любых языках.

Чтобы получить ссылку на зум, напишите @dinaraamirovna.

Серия семинаров проводится кафедрой Новой и Восточно-Европейской истории Университета Эрлангена - Нюрнберга в сотрудничестве с DGO - Немецкой ассоциацией Восточно-Европейских исследований.
Cразу много преподавательских DH-вакансий в King's College London

https://www.jobs.ac.uk/enhanced/linking/kings-college-london-digital-humanities-feb-2024/

#вакансия
Семинары по пространственному анализу в исследованиях и обучении

Американский университет в Центральной Азии продолжает серию семинаров по цифровым инструментам и методам. Семинары в марте посвящены пространственному анализу.

Язык - английский, онлайн, начало в 16:00 по бишкекскому времени (15:00 мск)

- 5 марта: Введение в пространственный анализ и практические занятия с Google My Maps
- 12 марта: Введение в пространственный анализ и практические занятия с StorymapJS
- 15 марта: Педагогическое применение пространственного анализа

Регистрация: https://zoom.us/meeting/register/tJYrc-uvqDksEtG05AOPmogX36zSPTWAwmwA#/registration
🎉А вот ежегодная выставка достижения цифрового гуманитарного хозяйства. Можно проголосовать за то, что понравилось, а можно просто полюбоваться. Номинации:
Best DH Data Vizualizations
Best DH Dataset
Best DH Short Publication
Best DH Tool
Best DH Training Material
Best Exploration of DH Failure/Limitaitions
Best use DH for fun
http://dhawards.org/dhawards2023/voting/
🕸 Для школьников, и не только: чем интернет отличается от Всемирной паутины?

В новом аудиопроекте Arzamas «От нуля до интернета» ученые рассказывают о том, как прогресс влиял на образование и науку.

В свежем эпизоде вы услышите рассказ руководителя DHRI (ИЦГИ) СФУ, доцента кафедры исторической информатики МГУ Андрея Володина о том, как от телеграфа и советского «Спутника» мы пришли к цифровизации и датаизму.

Доступно уже шесть выпусков цикла с Григорием Полотовским, Александром Бутягиным, Дмитрием Баюком, Дмитрием Михеевым и Натальей Никифоровой. Захватывающие истории о том, как появился нуль и десятеричная система счисления, как выглядела античная библиотека, чему учил своих учеников Галилей, когда новые географические знания начали проникать в университеты, что придумывали в лаборатории Томаса Эдисона.

Проект подготовлен вместе с сервисом «Яндекс Учебник».
До 19 марта можно успеть подать заявку на конференцию «Цифровизация прошлого: историческая память и сохранение культурного наследия» https://vectors2024.tilda.ws/digitalpast
Forwarded from RAntiquity
🗣Приглашаем на презентацию проектных работ студентов 2го курса магистратуры по Digital Humanities НИУ ВШЭ.

В этом году темы проектов посвящены исследованию деколонизации музеев, индвидиуального стиля Платона, особенностям советского кинопроката, библиографии детской литературы, наскальной живописи, многобразию лингвистики как науки и сохранению цифровой памяти.

📆 Встреча пройдет 23 марта в 16.00.

Регистрация по ссылке.
Please open Telegram to view this post
VIEW IN TELEGRAM
✍🏻 Что вы знаете о HTR – распознавании рукописного текста? Как это работает?

27 марта на очередном заседании научно-методического семинара «Цифровая среда» поговорим о подходах и инструментах, которые применяются для автоматической транскрипции рукописей.

Нашим гостем и главным докладчиком станет кандидат исторических наук, медиевистка, сотрудница Центра истории, археологии и литературы средневековых христианских и мусульманских миров (CIHAM, CNRS), главный редактор журнала «Vox medii aevi» Светлана Яцык.

В роли оппонента – исследователь Университета Неймегена (Радбауд) Глеб Шмидт.

Регистрируйтесь сейчас и присоединяйтесь к семинару через неделю.

Начало: 16.30 (мск)/ 20.30 (крск)

#цифроваясреда #htr #рукописи
Вестник Digital Humanities: что делают цифровые гуманитарии с большими языковыми моделями и где смотреть (и оценивать!) достижения DH-хозяйства

Несмотря на непрекращающиеся драматические события в разных точках планеты, научная DH-жизнь продолжается. А значит, и мы продолжаем рассказывать о ней в новых выпусках «Вестника Digital Humanities». В мартовском выпуске:

— отчет о недавней немецкой DH-конференции и LLM-воркшопе на ней
— статья о конкуренции гуманитариев с большими языковыми моделями
— анонс семинара по цифровому распознаванию рукописей
— приглашение проголосовать за DH-awards этого года
— разное 😉

Читать выпуск: https://mailchi.mp/d654715e70ab/digital-humanities-16506350?e=ed4cb54ab6
Цена жизни: женский опыт этнических чисток в сталинский период в Центральной Азии. Доклад Юлии Ященко

Очередной семинар "Цифровая история Центральной Азии" состоится 4 апреля в 14:15 CEST в гибридном режиме.

Язык: английский.

Для участников из России: "Германское общество изучения Восточной Европы" (DGO), являющееся соорганизатором семинара, признано в России нежелательной организацией.

Регистрация: https://fau.zoom-x.de/meeting/register/u5Upc-2qpjotGtfYoZFbo7dwT3R8jrUSnZjB
До 8 апреля продлен прием заявок на открытый воркшоп «Изучение языкового разнообразия литературных премий», который проводит Центр машинного обучения, анализа данных и статистики (МАСТ) Европейского университета https://eusp.org/projects/otkrytyy-vorkshop-izuchenie-yazykovogo-raznoobraziya-literaturnykh-premiy
Конференция «Гуманитарные проблемы актуальных наук: цифровая дисциплина и проект» (15–17 апреля, ИТМО)

Междисциплинарные и цифровые области гуманитарного и социального знания как будто отгорожены от других. Когда цифровой филолог рассуждает в своем докладе о байесовской статистике и доверительных интервалах, филолог нецифровой может смотреть на него со смесью страха и непонимания, а то и вообще не признавать это частью филологии. Возникает иллюзия, что «цифровым» гуманитариям не о чем говорить с «аналоговыми», а техноантропологи опираются на другую версию антропологии, чем «традиционные».

Обсудить проблему дистанции между гуманитарными науками и их цифровыми ответвлениями можно будет 15–17 апреля на конференции «Гуманитарные проблемы актуальных наук: цифровая дисциплина и проект». Конференция пройдет офлайн в DH-центре Университета ИТМО и на других площадках, а также онлайн. И участвовать, и слушать можно как очно, так и дистанционно.

Полная программа — на сайте, там же ссылка на решистрацию. Если вы планируете прийти на конференцию на все три дня — зарегистрироваться нужно на каждый из них.

На конференции будут не только классические форматы в духе докладов, дискуссий и круглых столов, но и серия специальных мероприятий, которые мы подготовили с нашими коллегами: секция о сохранении цифрового наследия вместе с ПАНДАНом, встречи о чтении гипертекстов и тексте в интерфейсе вместе с Пушкиным <цифровым>, лекции и воркшопы от приглашённых спикеров, вечеринки открытия и закрытия.
Forwarded from RAntiquity (Olga Alieva)
Публикуем первую лекцию курса "Количественные методы в гуманитарных науках: критическое введение" (2024, НИУ ВШЭ).

Лекцию о данных в гуманитарных науках прочел к.и.н., доцент кафедры исторической информатики исторического факультета МГУ, руководитель Института цифровых гуманитарных исследований СФУ Андрей Юрьевич Володин.

Встречу провели руководитель магистерской программы НИУ ВШЭ "Цифровые методы в гуманитарных науках" Борис Орехов и доцент Школы философии и культурологии НИУ ВШЭ Ольга Алиева @rantiquity.

В ближайшее время поделимся анонсом следующей лекции, оставайтесь с нами.

#criticaldh #курсы
Forwarded from Ебаный DH
5 коллекций данных для цифрового гуманитария

Интернет набит данными, но очень немногие датасеты сделаны гуманитариями и для гуманитариев. Собрал пять чисто гуманитарных источников данных, которые хорошо использовать в курсе анализа данных или программирования на DH-программах.

🎭 1. DraCor — корпуса и датасеты вокруг драматических текстов (с уклоном в network analysis, но не только). Один из очень немногих проектов, сумевших на базе “гуманитарного” стандарта TEI построить классную экосистему гуманитарных данных. Самые приятные данные дракора — это метаданные для каждого корпуса, которые вы можете скачать прямо на страничке корпуса, например, вот табличка для русского корпуса: https://dracor.org/api/v1/corpora/rus/metadata/csv Тут и классические метаданые вроде дат написания и публикации, и сетевые вроде плотности социальной сети в пьесе, и например соотношение мужской и женской речи…

Еще для каждой отдельной пьесы можно скачать сетевые данные (в gexf/csv/gml), речь персонажей, сценические ремарки… Ну и полную разметку в TEI, из которой все эти данные произрастают.

✒️ 2. Репозиторий открытых данных по русской литературе и фольклору — проект Цифровой лабы Пушкинского дома (ИРЛИ РАН), где цифровые филологи и не только публикуют датасеты и (иногда) код к своим исследованиям. Своего рода гуманитарный papers with code. Вот, например, данные и код к статье Кирилла Маслинского о том, какие животные чаще встречаются в каких жанрах детской литературе.

А еще там публикует новые датасеты сам ПушДом. Многие из них называются очень романтично. Скажем, Забытые романы русских писателей из фондов Пушкинского Дома (1857–1917)… Датасет с таким названием нужно обрабатывать под звуки романса “Отцвели уж давно хризантемы в саду”🍂

📚 3. European Literary Text Collection (ELTeC) — корпуса европейских романов, собранные с прицелом на репрезентативность и сопоставимость друг с другом. Целью было найти для каждой европейской литературы по 100 романов в диапазоне 1840-1920, чтобы они покрывали период более-менее равномерно, чтобы были представлены не только писатели-мужчины, чтобы бли длиной не менее 10000 слов и т.д. Не для всех корпусов это удалось, а русский корпус там совсем странный, но тем не менее — одна из немногих попыток сделать датасет, пригодный для “компаративистики” by design.

🏛 4. Госкаталог Музейного фонда РФсвалка датасет по всему, что оцифровано во всех музеях России. Не так часто в нашей области можно найти наборы данных, где записей не тысячи, но миллионы. Качество очень разное, репрезентативность тоже под вопросом, но жемчужин в этом океане данных тоже море. Одну я здесь уже описывал.

🗺 5. Геоданные DHCLOUD. Тут лежат литературные карты в geojson, сделанные студентами гуманитарного факультета Вышки под руководством Бориса Орехова. Картографированы самые разные тексты: от маршрута Афанасия Никитина и до Приключений Капитана Врунгеля 🐳
Полностью финансируемая PhD позиция по цифровым гуманитарным наукам/социальным наукам с применением методов Text Mining.

Междисциплинарная исследовательская группа ищет PhD студента для проекта по изучению индустриальной модернизации и глубинных переходов в Институте социальных исследований Тартуского университета (Эстония) под руководством Лаура Кангера. Работа будет фокусироваться на выявлении долгосрочных трендов индустриальной модернизации с использованием Text Mining оцифрованных газет и существующих баз данных.

Срок подачи заявок - 15.05.2024.

https://ut.ee/en/content/phd-open-calls (navigate to “1-15 May and 1-15 June 2024” > “Faculty of Social Sciences” > “Media and Communication, Sociology” tab)
🖇 Остатки/отходы или новые локусы научного знания? Что таится в цифровых архивах и как меняется наше взаимодействие с научными данными в диджитале?

24 апреля приглашаем всех гуманитариев на заседание научно-методического семинара «Цифровая среда». Присоединяйтесь онлайн, тема весьма интересная.

Наш гость и докладчик – исследовательница на стыке Digital Humanities, истории науки и медиа-археологии, постдок в Политехнической школе Лозанны (EPFL) и в Люксембургском центре современной и цифровой истории (C2DH) Алина Волынская.

💬 «В своем докладе я предложу своеобразную герменевтику цифрового научного архива как места производства знания и «места памяти» науки. Используя корпус научных коллекций и сочетая количественный и качественный подходы, рассмотрю вопрос о том, как цифровой архив моделирует наше взаимодействие с научным прошлым. Что мы можем узнать о науке прошлого из ее остатков, когда они дигитализируются и превращаются в данные? Какие интерпретации цифровой архив науки делает возможными и каковы, напротив, его эпистемологические ограничения?» 

В роли оппонента – доктор философских наук, лектор университета Лотарингии в Нанси (Франция) Андрей Родин.

→ Ссылка на подключение к семинару придет на почту накануне мероприятия – нужно только
зарегистрироваться.

🔴 Начало: 15.00 (мск)/ 19.00 (крск)

#цифроваясреда #цифровойархив
Please open Telegram to view this post
VIEW IN TELEGRAM
НКРЯ выкладывает в открытый доступ свои модели.
На сайте Национального корпуса русского языка появился новый раздел, посвящённый нейросетевым моделям, которые используются для разметки слов и текстов Корпуса.

Теперь пользователям доступны:
- токенизатор
- векторные модели для поиска слов-ассоциатов, адаптированные для 7 доменов
- модели для словообразовательной разметки
- модели для разметки тематики, жанров, типов текстов

Новый раздел будет полезен всем, кто интересуется обработкой естественного языка и хочет узнать больше о том, какие технологии машинного обучения применяются в НКРЯ. Пользователи могут ознакомиться с описанием моделей и скачать их для собственного использования. Перед скачиванием модели надо ознакомиться с лицензионным соглашением и принять его условия.
вакансия_аналитик_младший.pdf
152.6 KB
Вакансия DH-специалиста в Институте востоковедения РАН
Описание в прикрепленном файле
Цифровой Чехов: зачем и как именно создается семантическое издание произведений Антона Павловича

Уже в эту среду, 22 мая, приглашаем вас на заседание онлайн-семинара «Цифровая среда» с профессором кафедры лингвистики и профессиональной коммуникации ЮФУ Еленой Севериной.

Chekhov Digital – семантическое издание Полного собрания сочинений и писем А. П. Чехова, которое разрабатывается совместно Южным федеральным университетом и Центром гуманитарных исследований НИУ ВШЭ.

На семинаре Елена Михайловна расскажет о
→ процессе трансформации литературных произведений в структурированные машиночитаемые данные
→ методах и инструментах, которые реализуются в проекте Chekhov Digital
→ перспективах использования семантических данных для исследовательских и образовательных целей и планах по расширению проекта.

В роли дискутанта выступит доцент Школы лингвистики НИУ ВШЭ Анастасия Бонч-Осмоловская.

Ведущий семинара – доцент кафедры исторической информатики МГУ, руководитель стратегического проекта ИЦГИ (DHRI) Андрей Володин.

🟢 Начало: 15:00 (мск) / 19:00 (крск)

❗️Напоминаем о том, что на мероприятие нужно предварительно зарегистрироваться.

🟢 Посмотреть записи предыдущих выпусков «Цифровой среды».

#цифроваясреда #литература #семантика #смотреть #слушать
Please open Telegram to view this post
VIEW IN TELEGRAM