DH CLOUD
710 subscribers
77 photos
4 videos
6 files
238 links
Делаем то, что считаем нужным, не теряя того, что считаем ценным
Download Telegram
Forwarded from Институт AIRI
Открыт прием заявок на Лето с AIRI!⚡️

В этом году мы запускаем Школу совместно с Передовой Инженерной Школой ИТМО. Программа пройдет в Санкт-Петербурге с 20 по 30 августа.

🗓 Подать заявку можно по ссылке до 23:59 14 июля 2024 года.

Школа включает в себя лекции, семинары и практическую работу по направлениям:

— Мультимодальные архитектуры и генеративный ИИ в промышленности
— Модели воплощенного ИИ и обучение с подкреплением в робототехнике
— Искусственный интеллект и химия
— Доверенный искусственный интеллект

📍Питание, обучение и проживание бесплатное, оплатить самим нужно будет только проезд.

Подавайте заявки и делитесь постом с друзьями и коллегами!
👍4
Борис Орехов опубликовал несколько препринтов по тему DH и искусственного интеллекта.

Первый называется How does Burrows' Delta work on medieval Chinese poetic texts? Он посвящен дельте Берроуза, про которую известно, что она хорошо работает на языках европейского стандарта. В работе проверяется, сработает ли она на языке с принципиально другим грамматическим строем и принципиально иначе устроенной письменности, а именно — средневековой китайской. В качестве материала избрана поэзия эпохи Тан.

Второй также держит в центре внимания дельту Берроуза: Does Burrows' Delta really confirm that Rowling and Galbraith are the same author? В препринте проблематизируется известный успех стилеметрии, который показал вероятное авторство Роулинг романа, написанного под псевдонимом Роберт Гэлбрейт. Данные, касающиеся этого случая, встроены в пакет stylo, но данные там очень странные, они включают авторов, писавших в другое время и в другом жанре. Борис Орехов проверяет стилеметрическую гипотезу на более аутентичных данных — современниках Роулинг-Гэлбрейта, творивших в тех же жанровых рамках.

Третий больше относится к сфере искусственного интеллекта, хотя и использует инструмент, популярный у цифровых гуманитариев: You shall know a piece by the company it keeps. Chess plays as a data for word2vec models. На текстах на естественном языке сейчас рутинно строятся модели, векторизирующие контексты слов. Борис Орехов предположил, что эту же технологию можно применить к записям шахматных партий, которые можно рассматривать как своего рода тексты, в которых функцию слов будут выполнять ходы фигур. Что из этого получилось, можно прочесть в препринте. Сами векторные модели также опубликованы. К посту приложена картинка с рисунком из работы, изображающим визуализацию ходов белыми фигурами при уменьшении размерности векторного пространства.
🔥62
Forwarded from Гуманитарии в цифре (Мария Романюк)
Открыта регистрация на XIX конференцию Ассоциации «История и компьютер»

15-17 ноября 2024 года в Москве состоится XIX биеннале-конференция «Современная историческая информатика: аналитика данных в исторических исследованиях». Конференция проводится к 100-летию со дня рождения академика И.Д. Ковальченко и 20-летию первой в России кафедры исторической информатики.

Приглашаем принять участие и подать заявку. Темы выступлений должны соответствовать основным направлениям работы конференции (ознакомиться со списком можно здесь), а содержание должно быть связано с применением методов анализа данных и/или цифровых технологий.

Для участия в конференции необходимо зарегистрироваться до 25 августа.

🗓 Дата и место: 15–17 ноября 2024 г., РАНХиГС
🖥 Формат: гибридный
💥 Дедлайн подачи заявок: 25 августа 2024 г.


➡️ Подробная информация

#история #ит #конференции #анонсы
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7
Сегодня в США открывается конференция DH 2024

6 августа 2024 года в пригороде Вашингтона, округ Колумбия, начинает свою работу ежегодная конференция ADHO - Альянса организаций цифровых гуманитарных наук. Это главное ежегодное международное мероприятие в мире Digital Humanities. Тема этого года - "Переосмысление и ответственность" (Reinvention & Responsibility).

Конференция проходит в гибридном режиме, в ней принимают участие несколько членов нашего сообщества.
👍112
Интересная дискуссия состоялась на конгрессе DH-2024 на тему «Анализ текста: инструменты и инфраструктура в 2024 году и после».

Были представлены следующие инструменты:
Voyant Tools (разработчики приглашают исследователей текстов в Voyant Consortium)
LEAF-Writer semantic text editor
Dynamic Table of Contexts
Lexos
WordCruncher
и инфраструктура – магазин приложений от DARIAH – Social Sciences & Humanities Open Marketplace

После презентации прошло бурное обсуждение: как повлияет на анализ текстов внедрение машинного обучения? Как пользоваться веб-приложениями, если данных гигабайты? Когда нужно переходить с устаревших инструментов на новые? И главный вопрос: инструмент анализа текста — это специальный интерфейс взаимодействия с данными или самостоятельный набор методов или, быть может, просто черный ящик?

На графике, полученном с помощью онлайн-сервиса
Voyant Tools, мы видим частотные слова из названий выступлений на конференции DH-2024.

#dhконференции #adho #DH2024 #анализтекста #dhинструменты
👍85🔥1
Forwarded from Boris Orekhov
Всем привет!
В пятницу, 16 августа в 14:00 (по МСК) встретимся в прямом эфире Moscow Python Podcast с Борисом Ореховым, кандидатом филологических наук и доцентом факультета гуманитарных наук НИУ ВШЭ. В выпуске мы обсудим:
🟡в чём особенности обучения программированию гуманитариев;
🟡что общего между естественным языком и языком программирования;
🟡какие библиотеки востребованы у гуманитариев;
🟡зачем кандидату филологических наук изучать программирование.

➡️Когда: 16 августа в 14:00 по Москве.
➡️Где: онлайн и в записи по ссылке.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍1
Музей криптографии глазами гуманитария 
Рассказываем про новый пост из блога Бориса Орехова

Что такое криптография?

Криптография — наука о конфиденциальности, аутентификации и шифровании данных. Системный Блокъ уже писал об исторической криптографии и шифропанках. Музей криптографии в Москве посвящен не только ей самой, но и смежным дисциплинам и технологиям коммуникации. 

Культура и технологии вперемешку

Сейчас область криптографии исключительно математическая и компьютерная, однако музей концентрируется еще и на гуманитарной составляющей. Например, целый этаж посвящен истории здания музея, а на литературной полке можно найти книги, в которых шифры играют заметную сюжетную роль. В то же время в музее много технических экспонатов: например, шифровальных аппаратур.

Атмосфера «Системного Блока» 

Музей может показаться представительством редакции «Системного Блока» в оффлайне: здесь внимание и к текстам, и к технологиям, и к их взаимодействию. Музей отличается легкой подачей и заботливым отношением к истории. Например, большое пространство отведено античности.

Каковы гуманитарные истоки криптографии? Как музею о ней удается разговаривать на человеческом языке? Почему часть экспозиции рассказывает про интернет? О всём этом и многом другом, читайте в посте блога. 

Время чтения: 7,5 минут.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥52
На просветительском сайте «Системный Блок» вышел текст Бориса Орехова об осуществляющемся прямо сейчас учебно-научном цифровом проекте вышкинской магистратуры, посвященном электронному изданию стихов Вознесенского. Проект описан через перспективу личной истории исследователя, описание сопровождается фотографиями из личного архива.
4
До 15 сентября продолжается регистрация на конференцию «Современная историческая информатика: аналитика данных в исторических исследованиях» (состоится в гибридном формате в РАНХиГСе под эгидой Ассоциации «История и компьютер» [АИК] и при участии истфака МГУ 15-17 ноября 2024 года).
5
Цифровые издания: как подстроиться под читателя

У электронного издания в отличие от бумажного есть возможность предложить читателю не единый для всех порядок и состав текстов, а персонализированный набор произведений. Борис Орехов рассказывает подробнее о том, как подстроить сборники стихотворений под людей с разными предпочтениями.

Зачем нужно кастомизированное издание?

Можно любить только последнюю лирику Лермонтова или только сложную поэзию Вознесенского, но классические издания не всегда позволяют купить и читать только любимые стихи. В магистратуре Цифровые методы в гуманитарных науках в НИУ ВШЭ организовали учебный проект, где попытались выработать принципы составления такого издания, которое предлагает читателю то, к чему тот расположен. 

Например, в творчестве Вознесенского есть множество текстов с правильным метром и точной рифмой, типичными лирическими сюжетами. Но есть и другие стихи, в которых встретятся и акцентный стих, и каламбурная рифма. Настроения в текстах середины и конца XX века тоже могут очень сильно различаться. Что хотел бы видеть читатель? Может быть, и то и другое. А может быть, что-то одно.

Как подстроить сборник под читателя?

Способ, которым произведения отбираются для читателя в рамках проекта магистрантов, называется «сценарий». Чтобы реализовать сценарий, нужно разбить все тексты на классы по какому-то параметру, а потом показывать читателю тексты только из одного такого класса. Для начала можно установить, классический (регулярный) стих перед нами или неклассический. Так можно отделить стихи с менее очевидной формой (вроде лесенки Маяковского) от классический силлаботоники, как в «Ты меня на рассвете разбудишь…»

Ещё один полезный цифровой инструмент — тематическое моделирование. С его помощью можно собрать вместе стихи поэта, например, на «женскую» тему. Наконец, можно даже посчитать, насколько сложно текст воспринимается, его «удобочитаемость».

О плюсах и минусах такого отбора, о том, как работают описанные методы, и о том, почему в качестве примера Борис Орехов выбрал именно Вознесенского, узнаете из полной версии текста.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1
У цифровой гуманитарной магистратуры НИУ ВШЭ новый академический руководитель.

Вместо заболевшего Б. В. Орехова магистратурой в Вышке теперь будет руководить Александр Антонович Климов.
Александр Антонович — выпускник магистратуры Компьютерная лингвистика 2019 года. Старший преподаватель в Вышке с 2020 г. В 2019—2020 стажировался в Университете Хельсинки. Преподавание и научные интересы: программирование, базы данных для лингвистов, digital literary studies.
Лучший способ познакомиться с новым академруком как с человеком, с его образом мысли и оптикой — послушать выпуск подкаста «Лига Айвы» с ним в качестве гостя https://tttttt.me/universitates_podcast/30
Вариант: не слушать, а почитать расшифровку: https://universitates.ru/ep-13.html
13👍1
Приглашаем на вебинар с техническим директором Национального корпуса русского языка!

Завтра, 24 сентября, в 17:00 по московскому времени, технический директор НКРЯ, специалист в области компьютерной лингвистики Дмитрий Морозов проведёт вебинар, посвященный машинному обучению в Национальном корпусе русского языка.

Участники вебинара узнают:
- что такое Национальный корпус русского языка и как начать им пользоваться
- как и для чего применяется машинное обучение в НКРЯ
- чем НКРЯ может быть полезен переводчикам
- как НКРЯ помогает изучать языки народов России

Вебинар организует «Лаборатория перевода» совместно с магистерской программой МИСИС «Цифровая лингвистика и локализация».

Ссылка для подключения к вебинару будет опубликована в телеграм-канале @tradulab в день события. Не пропустите!
Прекрасный лекционный формат от CФУ - новый сезон открыт!
⚡️Старт нового сезона «Цифровой среды»

25 сентября научно-методический семинар «Цифровая среда» вновь приглашает всех желающих поразмышлять на актуальные темы Digital Humanities. В это раз в фокусе внимания – социальные сети и их историческая память в зеркале больших данных.

Доктор исторических наук, профессор Томского государственного университета Наталья Трубникова поделится со слушателями семинара опытом применения технологии прикладного интеллектуального анализа больших данных к проблемам и материалам исторической памяти, локализованной в пространстве социальных сетей.

Ведущий семинара — руководитель ИЦГИ СФУ, доцент МГУ Андрей Володин.

Начало: 13.00(мск) / 17:00 (крск)

«Цифровая среда» – проект Института цифровых гуманитарных исследований СФУ, научная платформа для обмена результатами актуальных исследований и мнениями о новых технологиях и подходах в области цифровой гуманитаристики.

Посмотреть записи предыдущих выпусков «Цифровой среды».

❗️На семинар лучше зарегистрироваться заранее

#цифроваясреда #смотреть #слушать #соцсети #bigdata #данные
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥71👍1
Самое важное ежегодное событие событие в мире Digitаl humanities конференция DH 2025 пройдет с 14 по 18 июля в Лиссабоне. Save the date. Прием тезисов до 1 декабря. https://dh2025.adho.org/
👍4🔥2
Весенняя школа Digital Humanities

В начале апреля пройдет школа по Digital Humanities в Потсдаме. Фокус на текстах и их связи с другими типами источников и моделей. Будем ставить исследовательские вопросы и осваивать практические методы. Можно прийти со своим проектом.

Географических и прочих ограничений для участников нет. Язык английский. Есть несколько тревел-грантов. Заявки до 30 ноября. Больше информации о программе и регистрация на сайте.

https://www.uni-potsdam.de/en/digital-humanities/activities/dh-potsdam-spring-school-2025-texts-as-data/call-for-participation
🔥11
Конгресс DH-2024: переосмысление, ответственность, и не только…

В августе мы публиковали заметки руководителя ИЦГИ СФУ Андрея Володина, дистанционно и вдумчиво присутствовавшего на масштабном международном Конгрессе Digital Humanities-2024. Наблюдения Андрея Юрьевича вызвали большой интерес у читателей, поэтому делимся и статьей, опубликованной в новом выпуске «Исторической информатики» ⚡️
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥2
Панельная дискуссия "Цифровая память и архивы"

18 октября в рамках конференции "Посткоммунистическая Центральная Азия: пространство для осмысления" будем обсуждать цифровые архивы, базы данных и сохранение памяти в цифровую эпоху.

В программе секции выступления:
- Автандил Эшмамбет: От исследований к базам данных: сохраняя и открывая умолченую историю Кыргызстана;
- Чоробек Сааданбек: Рукописный фонд https://manuscript.bizdin.kg;
- Александра Поливанова: Мемориал: база репрессированных;
- Татьяна Неуймина: Центр современной культуры Целинный. Проект. Документация;
- Динара Гагарина: Цифровое как инструмент колонизации и деколонизации в контексте Центральной Азии;
- Талгат Джумашев: Технология и истоки. Возможности и вызовы для (изучения) памяти в цифровую эпоху.

Конференция пройдет в Бишкеке 17-19 октября.

Программа: https://ru.esimde.org/archives/6245
🔥81👍1
16 октября пройдет онлайн мероприятие, посвященное очень увлекательной теме исследования видео-игр с африканским контентом и их объединяющей роли множественных африканских культур и языков. Его организует SaDiLaR - южно-африканский DH hub, который за последний год стал очень активным и интересным игроком на глобальном DH пространстве. https://www.eventbrite.co.uk/e/dh-colloquium-featuring-oluwarotimi-randle-tickets-1029864601747?aff=oddtdtcreator
👍6
DH-лекторий в Петербурге

Центр Digital Humanities ИТМО запускает DH-лекторий в культурном квартале Брусницын в Севкабеле. Преподаватели и команда DH-центра будут читать там лекции раз в две недели по субботам. Программа:

19 октября
«Как оцифровать болезнь? Цифровая гуманитаристика в медицине»

2 ноября
«GLAMVR: галереи, архивы, музеи, библиотеки и их цифровая жизнь»

16 ноября
«Игра как совместное событие в физическом и цифровом пространстве»

30 ноября
«Интерфейсы цифровых архивов: аутентичность, пользователи и правила»

Еще будут лекции 14 и 28 декабря, их темы уточняются

Анонс первой лекции и регистрация на нее тут
8👍2🔥1