DH CLOUD
630 subscribers
67 photos
3 videos
5 files
200 links
Делаем то, что считаем нужным, не теряя того, что считаем ценным
Download Telegram
Forwarded from Antibarbari HSE (Olga Alieva)
🥁 Как сообщают с места событий, сегодня телеграм-канал Antibarbari HSE стал победителем Конкурса лучших русскоязычных научных и научно-популярных работ НИУ ВШЭ! Жюри отметило нас среди лучших научно-популярных ресурсов по направлению «Филология».

🙂 Мы также поздравляем наших постоянных авторов Ирину Макарову и Бориса Орехова.

💘 Статья Ирины Владимировны «Народная мудрость в диалоге Аристотеля “О философии”» взяла приз в научной номинации по направлению «Философия и религиоведение».

💝Борис Валерьевич получил приз за научно-популярный проект «Некраткие содержания» (направление «Филология») и за научную публикацию «Индивидуальная семантика Л.Н. Толстого в свете векторных моделей» (направление «Лингвистика»).

Поздравляем коллег и очень гордимся сотрудничеством! Спасибо всем, кто поддерживает нас лайками, репостами и лучами добра.

Будем же еще научнее, еще популярнее. Euge!
Please open Telegram to view this post
VIEW IN TELEGRAM
Сергей Кокин: Рассекречивание архивных документов и предоставление доступа к ним: опыт Украины (1991–2024)

Приглашаем на очередной семинар ”Цифровая история (в) Центральной Азии”, где в этот раз будет тема архивных документов и архивных проектов в Украине (в том числе совместных проектов со странами ЦА).

13 июня, 14:15 CEST / 15:15 Киев / 17:15 Ташкент и Алматы / 18:15 Бишкек / Эрлангене и Zoom.

Эксперт: Сергей Кокин, старший научный сотрудник Института истории Украины Академии наук Украины, бывший сотрудник архива Службы безопасности Украины.

Доклад посвящен процессу рассекречивания архивных документов в Украине с 1990-х годов до настоящего времени. Сейчас доступ к рассекреченным оцифрованным материалам предоставляется в читальном зале Архива Службы безопасности Украины в Киеве, ограничения на доступ к ним были сняты в 2014–2015 годах. Также будут рассмотрены созданные в стране базы данных репрессированных и реабилитированных лиц, а также международные проекты, реализуемые в том числе совместно со странами Центральной Азии.

Язык доклада: русский, вопросы могут задаваться на русском, украинском английском, немецком.

Для регистрации и получения ссылки напишите Динаре Гагариной (@dinaraamirovna или dinara.gagarina@fau.de).
“ЦИФРОВОЙ ГУМАНИТАРИЙ” – ЗВУЧИТ НЕОБЫЧНО И ПАРАДОКСАЛЬНО?
Магистерская программа “Цифровые методы в гуманитарных науках” НИУ ВШЭ
❤️ приглашает на вебинар для поступающих.
Ссылка на вебинар.
В субботу 15 июня в 13.00 (мск.) мы ждем 🔘 тех, кто:
📖 … уже является специалистом в гуманитарной области и хочет научиться применять новейшие компьютерные методы в работе с гуманитарным знанием;
👀 … на “ты” с программированием, анализом данных, статистикой и другими цифровыми технологиями – и хочет с их помощью узнавать новое про литературу, историю и культуру;
☕️ … всех, кому интересно как: подружить нейросети с поэзией, создать цифровую копию Помпей, вычислить настоящего автора шекспировских пьес, построить компьютерную модель “Войны и мира”, научить компьютер расшифровывать древние манускрипты – и многое другое!
Руководители и преподаватели расскажут о магистерской программе и ответят на ваши вопросы.
🔗 Наш сайт: https://www.hse.ru/ma/dh
🖥 Наше сообщество: https://dhcloud.org/
🆕 Наши новости: https://tttttt.me/dhcloud https://tttttt.me/rantiquity
💬 Наши люди: Борис Орехов, Ольга Алиева, Анастасия Бонч-Осмоловская и др.
Please open Telegram to view this post
VIEW IN TELEGRAM
Что почитать летом?

В этом году исполняется 5 лет магистерской программе Цифровые методы в гуманитарных науках НИУ ВШЭ ❤️. Не такой маленький срок в нашем быстро живущем мире.
К юбилею мы составили список публикаций и выступлений по DH преподавателей магистратуры 😎, среди которых два сооснователя DH CLOUD.
Список рубрицирован, а внутри каждой тематической рубрики пункты разделены на научные текстовые публикации, видео выступлений (чаще всего тоже научных) и популяризаторские высказывания (чаще всего текстовые). Перечень снабжен ссылками. Он включает материалы с 2013 по 2024 год, так что получился изрядным.

Если вы пропустили что-то из этих текстов и видео, то лето — хороший момент, чтобы наверстать.
Please open Telegram to view this post
VIEW IN TELEGRAM
У Бориса Орехова на портале Грамота вышло интервью о векторных моделях и способах их применения, в том числе при исследовании культурно значимых текстов.
Это выступление продолжает серию работ Орехова, инкорпорирующую технологию векторизации контекстов в инструментарий цифровых гуманитарных исследований, начатую проектом Векторные романы (2017).
Forwarded from Ебаный DH
Завтра в 18:30 по Берлину / 19:30 по Москве у нас будет онлайн-доклад Агаты Холобут и Яна Рыбицкого (со-автор библиотеки stylo и специалист по стилометрии перевода) про количественный анализ того, как кинематограф меняет, адаптирует и трансформирует диалоги из литературного текста (на примере экранизаций “Гордости и предубеждения”), а также что происходит при их переводе. Регистрация чтоб послушать доклад — по ссылке
Доклад будет на английском языке
🔗 Онлайн-школа «Историческая информатика – 2024» стартует уже в четверг – и стартует с насыщенного лекционного дня.

27 июня в 11:00 (мск)/ 15:00 (крск) встречаемся с доцентом МГУ, руководителем Института цифровых гуманитарных исследований СФУ Андреем Володиным на лекции «Digital Humanities: эпистемологическое сообщество».

Зарегистрироваться в качестве слушателя еще не поздно: заполните короткую анкету, пройдя по этой ссылке.

Иллюстрация: Kandinsky 3.1, промт Digital Humanities: эпистемологическое сообщество

#Летняяшкола #история #историческаяинформатика
Please open Telegram to view this post
VIEW IN TELEGRAM
Топ-5 небанальных книг, которые помогут разобраться в пришествии технологий в нашу жизнь и культуру

Что почитать, если хочется понять, какую роль технологии играют в нашей жизни и в жизни людей творческих профессий? Как сделаны продукты, которые управляют нашей жизнью, как они вписаны в социальный и интеллектуальный контекст? Хорошо объясняют это не только книги, написанные в последние годы, но и незаслуженно забытые, вышедшие 50 лет назад.

Академический руководитель магистратуры Цифровые методы в гуманитарных науках НИУ ВШЭ Борис Орехов порекомендовал для «Гуманитариев в цифре» то, что, по его мнению, стоит почитать, чтобы иметь хороший интеллектуальный фундамент в этой области, и при этом не кружиться вокруг одних и тех же заглавий, которые и так у всех на слуху.

1️⃣ Абраам Моль «Искусство и компьютер». Уже довольно старая (1971, русский перевод: 1975), но недооцененная книга французского философа о том, как художники разных медиа могут работать с компьютером. Тематика книги во многом пересекается с тем, что называется «литературой формальных ограничений», но содержит много открывающих глаза экскурсов в теорию информации и основы эстетики. Эта книга сильно повлияла на понимание материала сегодняшними безусловными авторитетами в области формализации неформализуемого, прежде всего, Михаила Гаспарова. По-русски вышла в сборнике «Искусство и ЭВМ».

2️⃣ Адам Гринфилд «Радикальные технологии. Устройство повседневной жизни». Книга более новая, но и быстрее устаревающая. В картинках, которые рисует автор, мы узнаем свою повседневность нескольколетней давности, но уже не сегодняшнего дня. Впрочем, сами концепции стареют медленнее примеров, потому что, как известно, люди склонны переоценивать то, что в техническом смысле может быть достигнуто в краткосрочной перспективе, но недооценивать то, что может быть случится в долгосрочной.

3️⃣ Гаспар Кёниг «Конец индивидуума. Путешествие философа в страну искусственного интеллекта». Еще одна книга от философа. Не такая плоская, как прочие, силящиеся объяснить роль ИИ в нашем мире.

4️⃣ Рудольф Зарипов «Машинный поиск вариантов при моделировании творческого процесса». Еще одна старая (1983), но не устаревшая книга о компьютерах и творчестве. Формулы для комбинаторного порождения мелодий вас могут не заинтересовать, но зато книге предпослано глубокое введение с рассказом про историю искусственного интеллекта, с объяснением, при чем тут понятие фрейма, и другими полезными соображениями.

5️⃣ Сергей Николенко, Артур Кадурин, Екатерина Архангельская «Глубокое обучение» (2018). Лучшая, потому что самая понятная и самая человечная книга про нейросети. Если бы все так писали о сложном, даже котики никогда не плакали бы.

#чтопочитать
Please open Telegram to view this post
VIEW IN TELEGRAM
Философские пристрастия искусственного интеллекта

📍Санкт-Петербург, Менделеевская линия, д.5, ауд. 8 (Институт философии СПбГУ).

4 июля, 18:00 мск.


Очередной семинар серии «Лаборатория цифровой философии» ориентируется на интеграцию философских (и, конкретнее, этических) вопросов в контекст современных разработок искусственного интеллекта.

Темы для обсуждения:
- Как внедрение этического мышления в процесс создания ИИ помогает предсказывать воздействие технологий на общество?
- Как избежать вредных стереотипов в визуализации данных, как справиться с дискриминацией в автоматизированных процессах?
- Какие идеи Платона и Аристотеля могут использоваться в разработке, использования и оценке моделей искусственного интеллекта (LLAMA, GPT и др.)?

С результатами исследований в области философии и этики искусственного интеллекта выступят заведующий кафедрой этики доцент В.Ю. Перов; и.о.заведующего кафедрой философской антропологии доцент И.Ю. Ларионов.

Отдельная тема дискуссии — сравнение обучения ИИ с платоновским воспоминанием и/или применением учения Аристотеля о четырех причинах.

Регистрация: Дмитрий Ярочкин, ya.yarochkin@yandex.ru
Один канал в телеграме опубликовал очень странный, на наш взгляд, список книг о digital humanities, где все либо давно устарело, либо по-английски. А свежее (или нестареющее) и по-русски тоже можно почитать. Так что публикуем нашу подборку:

📖 Цифровые гуманитарные исследования (2023) - книга, названная монографией, но на самом деле представляющая собой учебник, в котором отражены все современные направления работы в области DH.

📖 Гаспаров М. Л. Очерк истории русского стиха (1984) - монография, открывшая глаза отечественным филологом на то, как можно изучать стихи, и сформировавшая самую сильную область отечественных digital humanities — стиховедение. Как стиховедение соотносится с DH, можно узнать 🎦 тут.

📖 Ярхо Б. И. Методология точного литературоведения (2006) - автор — человек, глубоко понимавший задачи литературоведения, и разработавший целую идейную платформу для применения количественных методов к литературному материалу в эпоху, когда еще и современной статистики-то не было. Совершенно гигантический труд, уже много определивший в науке и которому еще предстоит многое предопределить.

📖 Пильщиков И. А. Семь бесед о филологии и Digital Humanities (2022) - История, теория и практика цифровых исследований от патриарха отечественной филологии Игоря Алексеевича Пильщикова

📖 Орехов Б. В. Башкирский стих XX века: корпусное исследование (2019) - обновленное стиховедение с привлечением корпусных технологий, современного data science и инструментов машинной обработки текста, все это сделано на материале поэзии одного из народов РФ, включенного в общетюркский культурный контекст.

А если не только почитать, но и посмотреть, то вот:
📚 Список публикаций и выступлений по DH преподавателей магистратуры НИУ ВШЭ (2024)
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from AIRI Institute
Открыт прием заявок на Лето с AIRI!⚡️

В этом году мы запускаем Школу совместно с Передовой Инженерной Школой ИТМО. Программа пройдет в Санкт-Петербурге с 20 по 30 августа.

🗓 Подать заявку можно по ссылке до 23:59 14 июля 2024 года.

Школа включает в себя лекции, семинары и практическую работу по направлениям:

— Мультимодальные архитектуры и генеративный ИИ в промышленности
— Модели воплощенного ИИ и обучение с подкреплением в робототехнике
— Искусственный интеллект и химия
— Доверенный искусственный интеллект

📍Питание, обучение и проживание бесплатное, оплатить самим нужно будет только проезд.

Подавайте заявки и делитесь постом с друзьями и коллегами!
Борис Орехов опубликовал несколько препринтов по тему DH и искусственного интеллекта.

Первый называется How does Burrows' Delta work on medieval Chinese poetic texts? Он посвящен дельте Берроуза, про которую известно, что она хорошо работает на языках европейского стандарта. В работе проверяется, сработает ли она на языке с принципиально другим грамматическим строем и принципиально иначе устроенной письменности, а именно — средневековой китайской. В качестве материала избрана поэзия эпохи Тан.

Второй также держит в центре внимания дельту Берроуза: Does Burrows' Delta really confirm that Rowling and Galbraith are the same author? В препринте проблематизируется известный успех стилеметрии, который показал вероятное авторство Роулинг романа, написанного под псевдонимом Роберт Гэлбрейт. Данные, касающиеся этого случая, встроены в пакет stylo, но данные там очень странные, они включают авторов, писавших в другое время и в другом жанре. Борис Орехов проверяет стилеметрическую гипотезу на более аутентичных данных — современниках Роулинг-Гэлбрейта, творивших в тех же жанровых рамках.

Третий больше относится к сфере искусственного интеллекта, хотя и использует инструмент, популярный у цифровых гуманитариев: You shall know a piece by the company it keeps. Chess plays as a data for word2vec models. На текстах на естественном языке сейчас рутинно строятся модели, векторизирующие контексты слов. Борис Орехов предположил, что эту же технологию можно применить к записям шахматных партий, которые можно рассматривать как своего рода тексты, в которых функцию слов будут выполнять ходы фигур. Что из этого получилось, можно прочесть в препринте. Сами векторные модели также опубликованы. К посту приложена картинка с рисунком из работы, изображающим визуализацию ходов белыми фигурами при уменьшении размерности векторного пространства.
Forwarded from Гуманитарии в цифре (Мария Романюк)
Открыта регистрация на XIX конференцию Ассоциации «История и компьютер»

15-17 ноября 2024 года в Москве состоится XIX биеннале-конференция «Современная историческая информатика: аналитика данных в исторических исследованиях». Конференция проводится к 100-летию со дня рождения академика И.Д. Ковальченко и 20-летию первой в России кафедры исторической информатики.

Приглашаем принять участие и подать заявку. Темы выступлений должны соответствовать основным направлениям работы конференции (ознакомиться со списком можно здесь), а содержание должно быть связано с применением методов анализа данных и/или цифровых технологий.

Для участия в конференции необходимо зарегистрироваться до 25 августа.

🗓 Дата и место: 15–17 ноября 2024 г., РАНХиГС
🖥 Формат: гибридный
💥 Дедлайн подачи заявок: 25 августа 2024 г.


➡️ Подробная информация

#история #ит #конференции #анонсы
Please open Telegram to view this post
VIEW IN TELEGRAM
Сегодня в США открывается конференция DH 2024

6 августа 2024 года в пригороде Вашингтона, округ Колумбия, начинает свою работу ежегодная конференция ADHO - Альянса организаций цифровых гуманитарных наук. Это главное ежегодное международное мероприятие в мире Digital Humanities. Тема этого года - "Переосмысление и ответственность" (Reinvention & Responsibility).

Конференция проходит в гибридном режиме, в ней принимают участие несколько членов нашего сообщества.
Интересная дискуссия состоялась на конгрессе DH-2024 на тему «Анализ текста: инструменты и инфраструктура в 2024 году и после».

Были представлены следующие инструменты:
Voyant Tools (разработчики приглашают исследователей текстов в Voyant Consortium)
LEAF-Writer semantic text editor
Dynamic Table of Contexts
Lexos
WordCruncher
и инфраструктура – магазин приложений от DARIAH – Social Sciences & Humanities Open Marketplace

После презентации прошло бурное обсуждение: как повлияет на анализ текстов внедрение машинного обучения? Как пользоваться веб-приложениями, если данных гигабайты? Когда нужно переходить с устаревших инструментов на новые? И главный вопрос: инструмент анализа текста — это специальный интерфейс взаимодействия с данными или самостоятельный набор методов или, быть может, просто черный ящик?

На графике, полученном с помощью онлайн-сервиса
Voyant Tools, мы видим частотные слова из названий выступлений на конференции DH-2024.

#dhконференции #adho #DH2024 #анализтекста #dhинструменты
Forwarded from Boris Orekhov
Всем привет!
В пятницу, 16 августа в 14:00 (по МСК) встретимся в прямом эфире Moscow Python Podcast с Борисом Ореховым, кандидатом филологических наук и доцентом факультета гуманитарных наук НИУ ВШЭ. В выпуске мы обсудим:
🟡в чём особенности обучения программированию гуманитариев;
🟡что общего между естественным языком и языком программирования;
🟡какие библиотеки востребованы у гуманитариев;
🟡зачем кандидату филологических наук изучать программирование.

➡️Когда: 16 августа в 14:00 по Москве.
➡️Где: онлайн и в записи по ссылке.
Please open Telegram to view this post
VIEW IN TELEGRAM
Музей криптографии глазами гуманитария 
Рассказываем про новый пост из блога Бориса Орехова

Что такое криптография?

Криптография — наука о конфиденциальности, аутентификации и шифровании данных. Системный Блокъ уже писал об исторической криптографии и шифропанках. Музей криптографии в Москве посвящен не только ей самой, но и смежным дисциплинам и технологиям коммуникации. 

Культура и технологии вперемешку

Сейчас область криптографии исключительно математическая и компьютерная, однако музей концентрируется еще и на гуманитарной составляющей. Например, целый этаж посвящен истории здания музея, а на литературной полке можно найти книги, в которых шифры играют заметную сюжетную роль. В то же время в музее много технических экспонатов: например, шифровальных аппаратур.

Атмосфера «Системного Блока» 

Музей может показаться представительством редакции «Системного Блока» в оффлайне: здесь внимание и к текстам, и к технологиям, и к их взаимодействию. Музей отличается легкой подачей и заботливым отношением к истории. Например, большое пространство отведено античности.

Каковы гуманитарные истоки криптографии? Как музею о ней удается разговаривать на человеческом языке? Почему часть экспозиции рассказывает про интернет? О всём этом и многом другом, читайте в посте блога. 

Время чтения: 7,5 минут.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
На просветительском сайте «Системный Блок» вышел текст Бориса Орехова об осуществляющемся прямо сейчас учебно-научном цифровом проекте вышкинской магистратуры, посвященном электронному изданию стихов Вознесенского. Проект описан через перспективу личной истории исследователя, описание сопровождается фотографиями из личного архива.
До 15 сентября продолжается регистрация на конференцию «Современная историческая информатика: аналитика данных в исторических исследованиях» (состоится в гибридном формате в РАНХиГСе под эгидой Ассоциации «История и компьютер» [АИК] и при участии истфака МГУ 15-17 ноября 2024 года).
Цифровые издания: как подстроиться под читателя

У электронного издания в отличие от бумажного есть возможность предложить читателю не единый для всех порядок и состав текстов, а персонализированный набор произведений. Борис Орехов рассказывает подробнее о том, как подстроить сборники стихотворений под людей с разными предпочтениями.

Зачем нужно кастомизированное издание?

Можно любить только последнюю лирику Лермонтова или только сложную поэзию Вознесенского, но классические издания не всегда позволяют купить и читать только любимые стихи. В магистратуре Цифровые методы в гуманитарных науках в НИУ ВШЭ организовали учебный проект, где попытались выработать принципы составления такого издания, которое предлагает читателю то, к чему тот расположен. 

Например, в творчестве Вознесенского есть множество текстов с правильным метром и точной рифмой, типичными лирическими сюжетами. Но есть и другие стихи, в которых встретятся и акцентный стих, и каламбурная рифма. Настроения в текстах середины и конца XX века тоже могут очень сильно различаться. Что хотел бы видеть читатель? Может быть, и то и другое. А может быть, что-то одно.

Как подстроить сборник под читателя?

Способ, которым произведения отбираются для читателя в рамках проекта магистрантов, называется «сценарий». Чтобы реализовать сценарий, нужно разбить все тексты на классы по какому-то параметру, а потом показывать читателю тексты только из одного такого класса. Для начала можно установить, классический (регулярный) стих перед нами или неклассический. Так можно отделить стихи с менее очевидной формой (вроде лесенки Маяковского) от классический силлаботоники, как в «Ты меня на рассвете разбудишь…»

Ещё один полезный цифровой инструмент — тематическое моделирование. С его помощью можно собрать вместе стихи поэта, например, на «женскую» тему. Наконец, можно даже посчитать, насколько сложно текст воспринимается, его «удобочитаемость».

О плюсах и минусах такого отбора, о том, как работают описанные методы, и о том, почему в качестве примера Борис Орехов выбрал именно Вознесенского, узнаете из полной версии текста.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM