DH CLOUD
683 subscribers
76 photos
4 videos
5 files
225 links
Делаем то, что считаем нужным, не теряя того, что считаем ценным
Download Telegram
Forwarded from AIRI Institute
Открыт прием заявок на Лето с AIRI!⚡️

В этом году мы запускаем Школу совместно с Передовой Инженерной Школой ИТМО. Программа пройдет в Санкт-Петербурге с 20 по 30 августа.

🗓 Подать заявку можно по ссылке до 23:59 14 июля 2024 года.

Школа включает в себя лекции, семинары и практическую работу по направлениям:

— Мультимодальные архитектуры и генеративный ИИ в промышленности
— Модели воплощенного ИИ и обучение с подкреплением в робототехнике
— Искусственный интеллект и химия
— Доверенный искусственный интеллект

📍Питание, обучение и проживание бесплатное, оплатить самим нужно будет только проезд.

Подавайте заявки и делитесь постом с друзьями и коллегами!
Борис Орехов опубликовал несколько препринтов по тему DH и искусственного интеллекта.

Первый называется How does Burrows' Delta work on medieval Chinese poetic texts? Он посвящен дельте Берроуза, про которую известно, что она хорошо работает на языках европейского стандарта. В работе проверяется, сработает ли она на языке с принципиально другим грамматическим строем и принципиально иначе устроенной письменности, а именно — средневековой китайской. В качестве материала избрана поэзия эпохи Тан.

Второй также держит в центре внимания дельту Берроуза: Does Burrows' Delta really confirm that Rowling and Galbraith are the same author? В препринте проблематизируется известный успех стилеметрии, который показал вероятное авторство Роулинг романа, написанного под псевдонимом Роберт Гэлбрейт. Данные, касающиеся этого случая, встроены в пакет stylo, но данные там очень странные, они включают авторов, писавших в другое время и в другом жанре. Борис Орехов проверяет стилеметрическую гипотезу на более аутентичных данных — современниках Роулинг-Гэлбрейта, творивших в тех же жанровых рамках.

Третий больше относится к сфере искусственного интеллекта, хотя и использует инструмент, популярный у цифровых гуманитариев: You shall know a piece by the company it keeps. Chess plays as a data for word2vec models. На текстах на естественном языке сейчас рутинно строятся модели, векторизирующие контексты слов. Борис Орехов предположил, что эту же технологию можно применить к записям шахматных партий, которые можно рассматривать как своего рода тексты, в которых функцию слов будут выполнять ходы фигур. Что из этого получилось, можно прочесть в препринте. Сами векторные модели также опубликованы. К посту приложена картинка с рисунком из работы, изображающим визуализацию ходов белыми фигурами при уменьшении размерности векторного пространства.
Forwarded from Гуманитарии в цифре (Мария Романюк)
Открыта регистрация на XIX конференцию Ассоциации «История и компьютер»

15-17 ноября 2024 года в Москве состоится XIX биеннале-конференция «Современная историческая информатика: аналитика данных в исторических исследованиях». Конференция проводится к 100-летию со дня рождения академика И.Д. Ковальченко и 20-летию первой в России кафедры исторической информатики.

Приглашаем принять участие и подать заявку. Темы выступлений должны соответствовать основным направлениям работы конференции (ознакомиться со списком можно здесь), а содержание должно быть связано с применением методов анализа данных и/или цифровых технологий.

Для участия в конференции необходимо зарегистрироваться до 25 августа.

🗓 Дата и место: 15–17 ноября 2024 г., РАНХиГС
🖥 Формат: гибридный
💥 Дедлайн подачи заявок: 25 августа 2024 г.


➡️ Подробная информация

#история #ит #конференции #анонсы
Please open Telegram to view this post
VIEW IN TELEGRAM
Сегодня в США открывается конференция DH 2024

6 августа 2024 года в пригороде Вашингтона, округ Колумбия, начинает свою работу ежегодная конференция ADHO - Альянса организаций цифровых гуманитарных наук. Это главное ежегодное международное мероприятие в мире Digital Humanities. Тема этого года - "Переосмысление и ответственность" (Reinvention & Responsibility).

Конференция проходит в гибридном режиме, в ней принимают участие несколько членов нашего сообщества.
Интересная дискуссия состоялась на конгрессе DH-2024 на тему «Анализ текста: инструменты и инфраструктура в 2024 году и после».

Были представлены следующие инструменты:
Voyant Tools (разработчики приглашают исследователей текстов в Voyant Consortium)
LEAF-Writer semantic text editor
Dynamic Table of Contexts
Lexos
WordCruncher
и инфраструктура – магазин приложений от DARIAH – Social Sciences & Humanities Open Marketplace

После презентации прошло бурное обсуждение: как повлияет на анализ текстов внедрение машинного обучения? Как пользоваться веб-приложениями, если данных гигабайты? Когда нужно переходить с устаревших инструментов на новые? И главный вопрос: инструмент анализа текста — это специальный интерфейс взаимодействия с данными или самостоятельный набор методов или, быть может, просто черный ящик?

На графике, полученном с помощью онлайн-сервиса
Voyant Tools, мы видим частотные слова из названий выступлений на конференции DH-2024.

#dhконференции #adho #DH2024 #анализтекста #dhинструменты
Forwarded from Boris Orekhov
Всем привет!
В пятницу, 16 августа в 14:00 (по МСК) встретимся в прямом эфире Moscow Python Podcast с Борисом Ореховым, кандидатом филологических наук и доцентом факультета гуманитарных наук НИУ ВШЭ. В выпуске мы обсудим:
🟡в чём особенности обучения программированию гуманитариев;
🟡что общего между естественным языком и языком программирования;
🟡какие библиотеки востребованы у гуманитариев;
🟡зачем кандидату филологических наук изучать программирование.

➡️Когда: 16 августа в 14:00 по Москве.
➡️Где: онлайн и в записи по ссылке.
Please open Telegram to view this post
VIEW IN TELEGRAM
Музей криптографии глазами гуманитария 
Рассказываем про новый пост из блога Бориса Орехова

Что такое криптография?

Криптография — наука о конфиденциальности, аутентификации и шифровании данных. Системный Блокъ уже писал об исторической криптографии и шифропанках. Музей криптографии в Москве посвящен не только ей самой, но и смежным дисциплинам и технологиям коммуникации. 

Культура и технологии вперемешку

Сейчас область криптографии исключительно математическая и компьютерная, однако музей концентрируется еще и на гуманитарной составляющей. Например, целый этаж посвящен истории здания музея, а на литературной полке можно найти книги, в которых шифры играют заметную сюжетную роль. В то же время в музее много технических экспонатов: например, шифровальных аппаратур.

Атмосфера «Системного Блока» 

Музей может показаться представительством редакции «Системного Блока» в оффлайне: здесь внимание и к текстам, и к технологиям, и к их взаимодействию. Музей отличается легкой подачей и заботливым отношением к истории. Например, большое пространство отведено античности.

Каковы гуманитарные истоки криптографии? Как музею о ней удается разговаривать на человеческом языке? Почему часть экспозиции рассказывает про интернет? О всём этом и многом другом, читайте в посте блога. 

Время чтения: 7,5 минут.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
На просветительском сайте «Системный Блок» вышел текст Бориса Орехова об осуществляющемся прямо сейчас учебно-научном цифровом проекте вышкинской магистратуры, посвященном электронному изданию стихов Вознесенского. Проект описан через перспективу личной истории исследователя, описание сопровождается фотографиями из личного архива.
До 15 сентября продолжается регистрация на конференцию «Современная историческая информатика: аналитика данных в исторических исследованиях» (состоится в гибридном формате в РАНХиГСе под эгидой Ассоциации «История и компьютер» [АИК] и при участии истфака МГУ 15-17 ноября 2024 года).
Цифровые издания: как подстроиться под читателя

У электронного издания в отличие от бумажного есть возможность предложить читателю не единый для всех порядок и состав текстов, а персонализированный набор произведений. Борис Орехов рассказывает подробнее о том, как подстроить сборники стихотворений под людей с разными предпочтениями.

Зачем нужно кастомизированное издание?

Можно любить только последнюю лирику Лермонтова или только сложную поэзию Вознесенского, но классические издания не всегда позволяют купить и читать только любимые стихи. В магистратуре Цифровые методы в гуманитарных науках в НИУ ВШЭ организовали учебный проект, где попытались выработать принципы составления такого издания, которое предлагает читателю то, к чему тот расположен. 

Например, в творчестве Вознесенского есть множество текстов с правильным метром и точной рифмой, типичными лирическими сюжетами. Но есть и другие стихи, в которых встретятся и акцентный стих, и каламбурная рифма. Настроения в текстах середины и конца XX века тоже могут очень сильно различаться. Что хотел бы видеть читатель? Может быть, и то и другое. А может быть, что-то одно.

Как подстроить сборник под читателя?

Способ, которым произведения отбираются для читателя в рамках проекта магистрантов, называется «сценарий». Чтобы реализовать сценарий, нужно разбить все тексты на классы по какому-то параметру, а потом показывать читателю тексты только из одного такого класса. Для начала можно установить, классический (регулярный) стих перед нами или неклассический. Так можно отделить стихи с менее очевидной формой (вроде лесенки Маяковского) от классический силлаботоники, как в «Ты меня на рассвете разбудишь…»

Ещё один полезный цифровой инструмент — тематическое моделирование. С его помощью можно собрать вместе стихи поэта, например, на «женскую» тему. Наконец, можно даже посчитать, насколько сложно текст воспринимается, его «удобочитаемость».

О плюсах и минусах такого отбора, о том, как работают описанные методы, и о том, почему в качестве примера Борис Орехов выбрал именно Вознесенского, узнаете из полной версии текста.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
У цифровой гуманитарной магистратуры НИУ ВШЭ новый академический руководитель.

Вместо заболевшего Б. В. Орехова магистратурой в Вышке теперь будет руководить Александр Антонович Климов.
Александр Антонович — выпускник магистратуры Компьютерная лингвистика 2019 года. Старший преподаватель в Вышке с 2020 г. В 2019—2020 стажировался в Университете Хельсинки. Преподавание и научные интересы: программирование, базы данных для лингвистов, digital literary studies.
Лучший способ познакомиться с новым академруком как с человеком, с его образом мысли и оптикой — послушать выпуск подкаста «Лига Айвы» с ним в качестве гостя https://tttttt.me/universitates_podcast/30
Вариант: не слушать, а почитать расшифровку: https://universitates.ru/ep-13.html
Приглашаем на вебинар с техническим директором Национального корпуса русского языка!

Завтра, 24 сентября, в 17:00 по московскому времени, технический директор НКРЯ, специалист в области компьютерной лингвистики Дмитрий Морозов проведёт вебинар, посвященный машинному обучению в Национальном корпусе русского языка.

Участники вебинара узнают:
- что такое Национальный корпус русского языка и как начать им пользоваться
- как и для чего применяется машинное обучение в НКРЯ
- чем НКРЯ может быть полезен переводчикам
- как НКРЯ помогает изучать языки народов России

Вебинар организует «Лаборатория перевода» совместно с магистерской программой МИСИС «Цифровая лингвистика и локализация».

Ссылка для подключения к вебинару будет опубликована в телеграм-канале @tradulab в день события. Не пропустите!
Прекрасный лекционный формат от CФУ - новый сезон открыт!
⚡️Старт нового сезона «Цифровой среды»

25 сентября научно-методический семинар «Цифровая среда» вновь приглашает всех желающих поразмышлять на актуальные темы Digital Humanities. В это раз в фокусе внимания – социальные сети и их историческая память в зеркале больших данных.

Доктор исторических наук, профессор Томского государственного университета Наталья Трубникова поделится со слушателями семинара опытом применения технологии прикладного интеллектуального анализа больших данных к проблемам и материалам исторической памяти, локализованной в пространстве социальных сетей.

Ведущий семинара — руководитель ИЦГИ СФУ, доцент МГУ Андрей Володин.

Начало: 13.00(мск) / 17:00 (крск)

«Цифровая среда» – проект Института цифровых гуманитарных исследований СФУ, научная платформа для обмена результатами актуальных исследований и мнениями о новых технологиях и подходах в области цифровой гуманитаристики.

Посмотреть записи предыдущих выпусков «Цифровой среды».

❗️На семинар лучше зарегистрироваться заранее

#цифроваясреда #смотреть #слушать #соцсети #bigdata #данные
Please open Telegram to view this post
VIEW IN TELEGRAM
Самое важное ежегодное событие событие в мире Digitаl humanities конференция DH 2025 пройдет с 14 по 18 июля в Лиссабоне. Save the date. Прием тезисов до 1 декабря. https://dh2025.adho.org/
Весенняя школа Digital Humanities

В начале апреля пройдет школа по Digital Humanities в Потсдаме. Фокус на текстах и их связи с другими типами источников и моделей. Будем ставить исследовательские вопросы и осваивать практические методы. Можно прийти со своим проектом.

Географических и прочих ограничений для участников нет. Язык английский. Есть несколько тревел-грантов. Заявки до 30 ноября. Больше информации о программе и регистрация на сайте.

https://www.uni-potsdam.de/en/digital-humanities/activities/dh-potsdam-spring-school-2025-texts-as-data/call-for-participation
Конгресс DH-2024: переосмысление, ответственность, и не только…

В августе мы публиковали заметки руководителя ИЦГИ СФУ Андрея Володина, дистанционно и вдумчиво присутствовавшего на масштабном международном Конгрессе Digital Humanities-2024. Наблюдения Андрея Юрьевича вызвали большой интерес у читателей, поэтому делимся и статьей, опубликованной в новом выпуске «Исторической информатики» ⚡️
Please open Telegram to view this post
VIEW IN TELEGRAM
Панельная дискуссия "Цифровая память и архивы"

18 октября в рамках конференции "Посткоммунистическая Центральная Азия: пространство для осмысления" будем обсуждать цифровые архивы, базы данных и сохранение памяти в цифровую эпоху.

В программе секции выступления:
- Автандил Эшмамбет: От исследований к базам данных: сохраняя и открывая умолченую историю Кыргызстана;
- Чоробек Сааданбек: Рукописный фонд https://manuscript.bizdin.kg;
- Александра Поливанова: Мемориал: база репрессированных;
- Татьяна Неуймина: Центр современной культуры Целинный. Проект. Документация;
- Динара Гагарина: Цифровое как инструмент колонизации и деколонизации в контексте Центральной Азии;
- Талгат Джумашев: Технология и истоки. Возможности и вызовы для (изучения) памяти в цифровую эпоху.

Конференция пройдет в Бишкеке 17-19 октября.

Программа: https://ru.esimde.org/archives/6245
16 октября пройдет онлайн мероприятие, посвященное очень увлекательной теме исследования видео-игр с африканским контентом и их объединяющей роли множественных африканских культур и языков. Его организует SaDiLaR - южно-африканский DH hub, который за последний год стал очень активным и интересным игроком на глобальном DH пространстве. https://www.eventbrite.co.uk/e/dh-colloquium-featuring-oluwarotimi-randle-tickets-1029864601747?aff=oddtdtcreator
DH-лекторий в Петербурге

Центр Digital Humanities ИТМО запускает DH-лекторий в культурном квартале Брусницын в Севкабеле. Преподаватели и команда DH-центра будут читать там лекции раз в две недели по субботам. Программа:

19 октября
«Как оцифровать болезнь? Цифровая гуманитаристика в медицине»

2 ноября
«GLAMVR: галереи, архивы, музеи, библиотеки и их цифровая жизнь»

16 ноября
«Игра как совместное событие в физическом и цифровом пространстве»

30 ноября
«Интерфейсы цифровых архивов: аутентичность, пользователи и правила»

Еще будут лекции 14 и 28 декабря, их темы уточняются

Анонс первой лекции и регистрация на нее тут