DH CLOUD
720 subscribers
77 photos
4 videos
6 files
239 links
Делаем то, что считаем нужным, не теряя того, что считаем ценным
Download Telegram
Forwarded from Antibarbari HSE (Olga Alieva)
🥁 Как сообщают с места событий, сегодня телеграм-канал Antibarbari HSE стал победителем Конкурса лучших русскоязычных научных и научно-популярных работ НИУ ВШЭ! Жюри отметило нас среди лучших научно-популярных ресурсов по направлению «Филология».

🙂 Мы также поздравляем наших постоянных авторов Ирину Макарову и Бориса Орехова.

💘 Статья Ирины Владимировны «Народная мудрость в диалоге Аристотеля “О философии”» взяла приз в научной номинации по направлению «Философия и религиоведение».

💝Борис Валерьевич получил приз за научно-популярный проект «Некраткие содержания» (направление «Филология») и за научную публикацию «Индивидуальная семантика Л.Н. Толстого в свете векторных моделей» (направление «Лингвистика»).

Поздравляем коллег и очень гордимся сотрудничеством! Спасибо всем, кто поддерживает нас лайками, репостами и лучами добра.

Будем же еще научнее, еще популярнее. Euge!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥133👍1
Сергей Кокин: Рассекречивание архивных документов и предоставление доступа к ним: опыт Украины (1991–2024)

Приглашаем на очередной семинар ”Цифровая история (в) Центральной Азии”, где в этот раз будет тема архивных документов и архивных проектов в Украине (в том числе совместных проектов со странами ЦА).

13 июня, 14:15 CEST / 15:15 Киев / 17:15 Ташкент и Алматы / 18:15 Бишкек / Эрлангене и Zoom.

Эксперт: Сергей Кокин, старший научный сотрудник Института истории Украины Академии наук Украины, бывший сотрудник архива Службы безопасности Украины.

Доклад посвящен процессу рассекречивания архивных документов в Украине с 1990-х годов до настоящего времени. Сейчас доступ к рассекреченным оцифрованным материалам предоставляется в читальном зале Архива Службы безопасности Украины в Киеве, ограничения на доступ к ним были сняты в 2014–2015 годах. Также будут рассмотрены созданные в стране базы данных репрессированных и реабилитированных лиц, а также международные проекты, реализуемые в том числе совместно со странами Центральной Азии.

Язык доклада: русский, вопросы могут задаваться на русском, украинском английском, немецком.

Для регистрации и получения ссылки напишите Динаре Гагариной (@dinaraamirovna или dinara.gagarina@fau.de).
4
“ЦИФРОВОЙ ГУМАНИТАРИЙ” – ЗВУЧИТ НЕОБЫЧНО И ПАРАДОКСАЛЬНО?
Магистерская программа “Цифровые методы в гуманитарных науках” НИУ ВШЭ
❤️ приглашает на вебинар для поступающих.
Ссылка на вебинар.
В субботу 15 июня в 13.00 (мск.) мы ждем 🔘 тех, кто:
📖 … уже является специалистом в гуманитарной области и хочет научиться применять новейшие компьютерные методы в работе с гуманитарным знанием;
👀 … на “ты” с программированием, анализом данных, статистикой и другими цифровыми технологиями – и хочет с их помощью узнавать новое про литературу, историю и культуру;
☕️ … всех, кому интересно как: подружить нейросети с поэзией, создать цифровую копию Помпей, вычислить настоящего автора шекспировских пьес, построить компьютерную модель “Войны и мира”, научить компьютер расшифровывать древние манускрипты – и многое другое!
Руководители и преподаватели расскажут о магистерской программе и ответят на ваши вопросы.
🔗 Наш сайт: https://www.hse.ru/ma/dh
🖥 Наше сообщество: https://dhcloud.org/
🆕 Наши новости: https://tttttt.me/dhcloud https://tttttt.me/rantiquity
💬 Наши люди: Борис Орехов, Ольга Алиева, Анастасия Бонч-Осмоловская и др.
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥2👏1
Что почитать летом?

В этом году исполняется 5 лет магистерской программе Цифровые методы в гуманитарных науках НИУ ВШЭ ❤️. Не такой маленький срок в нашем быстро живущем мире.
К юбилею мы составили список публикаций и выступлений по DH преподавателей магистратуры 😎, среди которых два сооснователя DH CLOUD.
Список рубрицирован, а внутри каждой тематической рубрики пункты разделены на научные текстовые публикации, видео выступлений (чаще всего тоже научных) и популяризаторские высказывания (чаще всего текстовые). Перечень снабжен ссылками. Он включает материалы с 2013 по 2024 год, так что получился изрядным.

Если вы пропустили что-то из этих текстов и видео, то лето — хороший момент, чтобы наверстать.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥137
У Бориса Орехова на портале Грамота вышло интервью о векторных моделях и способах их применения, в том числе при исследовании культурно значимых текстов.
Это выступление продолжает серию работ Орехова, инкорпорирующую технологию векторизации контекстов в инструментарий цифровых гуманитарных исследований, начатую проектом Векторные романы (2017).
🔥7👍31
Завтра в 18:30 по Берлину / 19:30 по Москве у нас будет онлайн-доклад Агаты Холобут и Яна Рыбицкого (со-автор библиотеки stylo и специалист по стилометрии перевода) про количественный анализ того, как кинематограф меняет, адаптирует и трансформирует диалоги из литературного текста (на примере экранизаций “Гордости и предубеждения”), а также что происходит при их переводе. Регистрация чтоб послушать доклад — по ссылке
Доклад будет на английском языке
👍13
🔗 Онлайн-школа «Историческая информатика – 2024» стартует уже в четверг – и стартует с насыщенного лекционного дня.

27 июня в 11:00 (мск)/ 15:00 (крск) встречаемся с доцентом МГУ, руководителем Института цифровых гуманитарных исследований СФУ Андреем Володиным на лекции «Digital Humanities: эпистемологическое сообщество».

Зарегистрироваться в качестве слушателя еще не поздно: заполните короткую анкету, пройдя по этой ссылке.

Иллюстрация: Kandinsky 3.1, промт Digital Humanities: эпистемологическое сообщество

#Летняяшкола #история #историческаяинформатика
Please open Telegram to view this post
VIEW IN TELEGRAM
7🔥1
Топ-5 небанальных книг, которые помогут разобраться в пришествии технологий в нашу жизнь и культуру

Что почитать, если хочется понять, какую роль технологии играют в нашей жизни и в жизни людей творческих профессий? Как сделаны продукты, которые управляют нашей жизнью, как они вписаны в социальный и интеллектуальный контекст? Хорошо объясняют это не только книги, написанные в последние годы, но и незаслуженно забытые, вышедшие 50 лет назад.

Академический руководитель магистратуры Цифровые методы в гуманитарных науках НИУ ВШЭ Борис Орехов порекомендовал для «Гуманитариев в цифре» то, что, по его мнению, стоит почитать, чтобы иметь хороший интеллектуальный фундамент в этой области, и при этом не кружиться вокруг одних и тех же заглавий, которые и так у всех на слуху.

1️⃣ Абраам Моль «Искусство и компьютер». Уже довольно старая (1971, русский перевод: 1975), но недооцененная книга французского философа о том, как художники разных медиа могут работать с компьютером. Тематика книги во многом пересекается с тем, что называется «литературой формальных ограничений», но содержит много открывающих глаза экскурсов в теорию информации и основы эстетики. Эта книга сильно повлияла на понимание материала сегодняшними безусловными авторитетами в области формализации неформализуемого, прежде всего, Михаила Гаспарова. По-русски вышла в сборнике «Искусство и ЭВМ».

2️⃣ Адам Гринфилд «Радикальные технологии. Устройство повседневной жизни». Книга более новая, но и быстрее устаревающая. В картинках, которые рисует автор, мы узнаем свою повседневность нескольколетней давности, но уже не сегодняшнего дня. Впрочем, сами концепции стареют медленнее примеров, потому что, как известно, люди склонны переоценивать то, что в техническом смысле может быть достигнуто в краткосрочной перспективе, но недооценивать то, что может быть случится в долгосрочной.

3️⃣ Гаспар Кёниг «Конец индивидуума. Путешествие философа в страну искусственного интеллекта». Еще одна книга от философа. Не такая плоская, как прочие, силящиеся объяснить роль ИИ в нашем мире.

4️⃣ Рудольф Зарипов «Машинный поиск вариантов при моделировании творческого процесса». Еще одна старая (1983), но не устаревшая книга о компьютерах и творчестве. Формулы для комбинаторного порождения мелодий вас могут не заинтересовать, но зато книге предпослано глубокое введение с рассказом про историю искусственного интеллекта, с объяснением, при чем тут понятие фрейма, и другими полезными соображениями.

5️⃣ Сергей Николенко, Артур Кадурин, Екатерина Архангельская «Глубокое обучение» (2018). Лучшая, потому что самая понятная и самая человечная книга про нейросети. Если бы все так писали о сложном, даже котики никогда не плакали бы.

#чтопочитать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥5
Философские пристрастия искусственного интеллекта

📍Санкт-Петербург, Менделеевская линия, д.5, ауд. 8 (Институт философии СПбГУ).

4 июля, 18:00 мск.


Очередной семинар серии «Лаборатория цифровой философии» ориентируется на интеграцию философских (и, конкретнее, этических) вопросов в контекст современных разработок искусственного интеллекта.

Темы для обсуждения:
- Как внедрение этического мышления в процесс создания ИИ помогает предсказывать воздействие технологий на общество?
- Как избежать вредных стереотипов в визуализации данных, как справиться с дискриминацией в автоматизированных процессах?
- Какие идеи Платона и Аристотеля могут использоваться в разработке, использования и оценке моделей искусственного интеллекта (LLAMA, GPT и др.)?

С результатами исследований в области философии и этики искусственного интеллекта выступят заведующий кафедрой этики доцент В.Ю. Перов; и.о.заведующего кафедрой философской антропологии доцент И.Ю. Ларионов.

Отдельная тема дискуссии — сравнение обучения ИИ с платоновским воспоминанием и/или применением учения Аристотеля о четырех причинах.

Регистрация: Дмитрий Ярочкин, ya.yarochkin@yandex.ru
🔥5👍1
Один канал в телеграме опубликовал очень странный, на наш взгляд, список книг о digital humanities, где все либо давно устарело, либо по-английски. А свежее (или нестареющее) и по-русски тоже можно почитать. Так что публикуем нашу подборку:

📖 Цифровые гуманитарные исследования (2023) - книга, названная монографией, но на самом деле представляющая собой учебник, в котором отражены все современные направления работы в области DH.

📖 Гаспаров М. Л. Очерк истории русского стиха (1984) - монография, открывшая глаза отечественным филологом на то, как можно изучать стихи, и сформировавшая самую сильную область отечественных digital humanities — стиховедение. Как стиховедение соотносится с DH, можно узнать 🎦 тут.

📖 Ярхо Б. И. Методология точного литературоведения (2006) - автор — человек, глубоко понимавший задачи литературоведения, и разработавший целую идейную платформу для применения количественных методов к литературному материалу в эпоху, когда еще и современной статистики-то не было. Совершенно гигантический труд, уже много определивший в науке и которому еще предстоит многое предопределить.

📖 Пильщиков И. А. Семь бесед о филологии и Digital Humanities (2022) - История, теория и практика цифровых исследований от патриарха отечественной филологии Игоря Алексеевича Пильщикова

📖 Орехов Б. В. Башкирский стих XX века: корпусное исследование (2019) - обновленное стиховедение с привлечением корпусных технологий, современного data science и инструментов машинной обработки текста, все это сделано на материале поэзии одного из народов РФ, включенного в общетюркский культурный контекст.

А если не только почитать, но и посмотреть, то вот:
📚 Список публикаций и выступлений по DH преподавателей магистратуры НИУ ВШЭ (2024)
Please open Telegram to view this post
VIEW IN TELEGRAM
14
Forwarded from Институт AIRI
Открыт прием заявок на Лето с AIRI!⚡️

В этом году мы запускаем Школу совместно с Передовой Инженерной Школой ИТМО. Программа пройдет в Санкт-Петербурге с 20 по 30 августа.

🗓 Подать заявку можно по ссылке до 23:59 14 июля 2024 года.

Школа включает в себя лекции, семинары и практическую работу по направлениям:

— Мультимодальные архитектуры и генеративный ИИ в промышленности
— Модели воплощенного ИИ и обучение с подкреплением в робототехнике
— Искусственный интеллект и химия
— Доверенный искусственный интеллект

📍Питание, обучение и проживание бесплатное, оплатить самим нужно будет только проезд.

Подавайте заявки и делитесь постом с друзьями и коллегами!
👍4
Борис Орехов опубликовал несколько препринтов по тему DH и искусственного интеллекта.

Первый называется How does Burrows' Delta work on medieval Chinese poetic texts? Он посвящен дельте Берроуза, про которую известно, что она хорошо работает на языках европейского стандарта. В работе проверяется, сработает ли она на языке с принципиально другим грамматическим строем и принципиально иначе устроенной письменности, а именно — средневековой китайской. В качестве материала избрана поэзия эпохи Тан.

Второй также держит в центре внимания дельту Берроуза: Does Burrows' Delta really confirm that Rowling and Galbraith are the same author? В препринте проблематизируется известный успех стилеметрии, который показал вероятное авторство Роулинг романа, написанного под псевдонимом Роберт Гэлбрейт. Данные, касающиеся этого случая, встроены в пакет stylo, но данные там очень странные, они включают авторов, писавших в другое время и в другом жанре. Борис Орехов проверяет стилеметрическую гипотезу на более аутентичных данных — современниках Роулинг-Гэлбрейта, творивших в тех же жанровых рамках.

Третий больше относится к сфере искусственного интеллекта, хотя и использует инструмент, популярный у цифровых гуманитариев: You shall know a piece by the company it keeps. Chess plays as a data for word2vec models. На текстах на естественном языке сейчас рутинно строятся модели, векторизирующие контексты слов. Борис Орехов предположил, что эту же технологию можно применить к записям шахматных партий, которые можно рассматривать как своего рода тексты, в которых функцию слов будут выполнять ходы фигур. Что из этого получилось, можно прочесть в препринте. Сами векторные модели также опубликованы. К посту приложена картинка с рисунком из работы, изображающим визуализацию ходов белыми фигурами при уменьшении размерности векторного пространства.
🔥62
Forwarded from Гуманитарии в цифре (Мария Романюк)
Открыта регистрация на XIX конференцию Ассоциации «История и компьютер»

15-17 ноября 2024 года в Москве состоится XIX биеннале-конференция «Современная историческая информатика: аналитика данных в исторических исследованиях». Конференция проводится к 100-летию со дня рождения академика И.Д. Ковальченко и 20-летию первой в России кафедры исторической информатики.

Приглашаем принять участие и подать заявку. Темы выступлений должны соответствовать основным направлениям работы конференции (ознакомиться со списком можно здесь), а содержание должно быть связано с применением методов анализа данных и/или цифровых технологий.

Для участия в конференции необходимо зарегистрироваться до 25 августа.

🗓 Дата и место: 15–17 ноября 2024 г., РАНХиГС
🖥 Формат: гибридный
💥 Дедлайн подачи заявок: 25 августа 2024 г.


➡️ Подробная информация

#история #ит #конференции #анонсы
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7
Сегодня в США открывается конференция DH 2024

6 августа 2024 года в пригороде Вашингтона, округ Колумбия, начинает свою работу ежегодная конференция ADHO - Альянса организаций цифровых гуманитарных наук. Это главное ежегодное международное мероприятие в мире Digital Humanities. Тема этого года - "Переосмысление и ответственность" (Reinvention & Responsibility).

Конференция проходит в гибридном режиме, в ней принимают участие несколько членов нашего сообщества.
👍112
Интересная дискуссия состоялась на конгрессе DH-2024 на тему «Анализ текста: инструменты и инфраструктура в 2024 году и после».

Были представлены следующие инструменты:
Voyant Tools (разработчики приглашают исследователей текстов в Voyant Consortium)
LEAF-Writer semantic text editor
Dynamic Table of Contexts
Lexos
WordCruncher
и инфраструктура – магазин приложений от DARIAH – Social Sciences & Humanities Open Marketplace

После презентации прошло бурное обсуждение: как повлияет на анализ текстов внедрение машинного обучения? Как пользоваться веб-приложениями, если данных гигабайты? Когда нужно переходить с устаревших инструментов на новые? И главный вопрос: инструмент анализа текста — это специальный интерфейс взаимодействия с данными или самостоятельный набор методов или, быть может, просто черный ящик?

На графике, полученном с помощью онлайн-сервиса
Voyant Tools, мы видим частотные слова из названий выступлений на конференции DH-2024.

#dhконференции #adho #DH2024 #анализтекста #dhинструменты
👍85🔥1
Forwarded from Boris Orekhov
Всем привет!
В пятницу, 16 августа в 14:00 (по МСК) встретимся в прямом эфире Moscow Python Podcast с Борисом Ореховым, кандидатом филологических наук и доцентом факультета гуманитарных наук НИУ ВШЭ. В выпуске мы обсудим:
🟡в чём особенности обучения программированию гуманитариев;
🟡что общего между естественным языком и языком программирования;
🟡какие библиотеки востребованы у гуманитариев;
🟡зачем кандидату филологических наук изучать программирование.

➡️Когда: 16 августа в 14:00 по Москве.
➡️Где: онлайн и в записи по ссылке.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍1
Музей криптографии глазами гуманитария 
Рассказываем про новый пост из блога Бориса Орехова

Что такое криптография?

Криптография — наука о конфиденциальности, аутентификации и шифровании данных. Системный Блокъ уже писал об исторической криптографии и шифропанках. Музей криптографии в Москве посвящен не только ей самой, но и смежным дисциплинам и технологиям коммуникации. 

Культура и технологии вперемешку

Сейчас область криптографии исключительно математическая и компьютерная, однако музей концентрируется еще и на гуманитарной составляющей. Например, целый этаж посвящен истории здания музея, а на литературной полке можно найти книги, в которых шифры играют заметную сюжетную роль. В то же время в музее много технических экспонатов: например, шифровальных аппаратур.

Атмосфера «Системного Блока» 

Музей может показаться представительством редакции «Системного Блока» в оффлайне: здесь внимание и к текстам, и к технологиям, и к их взаимодействию. Музей отличается легкой подачей и заботливым отношением к истории. Например, большое пространство отведено античности.

Каковы гуманитарные истоки криптографии? Как музею о ней удается разговаривать на человеческом языке? Почему часть экспозиции рассказывает про интернет? О всём этом и многом другом, читайте в посте блога. 

Время чтения: 7,5 минут.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥52
На просветительском сайте «Системный Блок» вышел текст Бориса Орехова об осуществляющемся прямо сейчас учебно-научном цифровом проекте вышкинской магистратуры, посвященном электронному изданию стихов Вознесенского. Проект описан через перспективу личной истории исследователя, описание сопровождается фотографиями из личного архива.
4
До 15 сентября продолжается регистрация на конференцию «Современная историческая информатика: аналитика данных в исторических исследованиях» (состоится в гибридном формате в РАНХиГСе под эгидой Ассоциации «История и компьютер» [АИК] и при участии истфака МГУ 15-17 ноября 2024 года).
5
Цифровые издания: как подстроиться под читателя

У электронного издания в отличие от бумажного есть возможность предложить читателю не единый для всех порядок и состав текстов, а персонализированный набор произведений. Борис Орехов рассказывает подробнее о том, как подстроить сборники стихотворений под людей с разными предпочтениями.

Зачем нужно кастомизированное издание?

Можно любить только последнюю лирику Лермонтова или только сложную поэзию Вознесенского, но классические издания не всегда позволяют купить и читать только любимые стихи. В магистратуре Цифровые методы в гуманитарных науках в НИУ ВШЭ организовали учебный проект, где попытались выработать принципы составления такого издания, которое предлагает читателю то, к чему тот расположен. 

Например, в творчестве Вознесенского есть множество текстов с правильным метром и точной рифмой, типичными лирическими сюжетами. Но есть и другие стихи, в которых встретятся и акцентный стих, и каламбурная рифма. Настроения в текстах середины и конца XX века тоже могут очень сильно различаться. Что хотел бы видеть читатель? Может быть, и то и другое. А может быть, что-то одно.

Как подстроить сборник под читателя?

Способ, которым произведения отбираются для читателя в рамках проекта магистрантов, называется «сценарий». Чтобы реализовать сценарий, нужно разбить все тексты на классы по какому-то параметру, а потом показывать читателю тексты только из одного такого класса. Для начала можно установить, классический (регулярный) стих перед нами или неклассический. Так можно отделить стихи с менее очевидной формой (вроде лесенки Маяковского) от классический силлаботоники, как в «Ты меня на рассвете разбудишь…»

Ещё один полезный цифровой инструмент — тематическое моделирование. С его помощью можно собрать вместе стихи поэта, например, на «женскую» тему. Наконец, можно даже посчитать, насколько сложно текст воспринимается, его «удобочитаемость».

О плюсах и минусах такого отбора, о том, как работают описанные методы, и о том, почему в качестве примера Борис Орехов выбрал именно Вознесенского, узнаете из полной версии текста.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1