Antibarbari HSE
📆 17 мая в 18:10 (мск) в Греко-латинском клубе Antibarbari состоится встреча со Светланой Яцык, к.и.н., научным сотрудником Лаборатории медиевистических исследований НИУ «ВШЭ», участницей проекта Distinguo. Тема встречи: Распознавание рукописного текста…
Это уже сегодня - семинар со Светланой Яцык "Распознавание рукописного текста (HTR): история, перспективы, текущие проекты"
👍1
Forwarded from Кот Шрёдингера (Андрей Константинов)
Помните, я рассказывал про свой любимый атлас geacron, который показывает границы стран в любой год за последние пять тысяч лет? Увидел еще один подобный инструмент для сопоставления разных исторических событий, очень интересный, - worldpopulationhistory. Тут под картой сразу несколько таймлайнов с главными событиями из истории развития общества, сельского хозяйства, медицины, науки, технологий, – одним словом, не с войнами, сменой вождей и прочей политической круговертью, а с инновациями, реально менявшими мир. Правда, только с первого года нашей эры. Вместо границ стран - места, где на самом деле жили люди (основная тема карты - как менялось население мира).
А не попадался ли кому-нибудь инструмент для создания и сравнения таймлайнов? Давно хочу этим заняться.
А не попадался ли кому-нибудь инструмент для создания и сравнения таймлайнов? Давно хочу этим заняться.
🔥4
Forwarded from Antibarbari HSE (Olga Alieva)
Публикуем запись вчерашнего выступления Светланы Яцык об автоматическом распознавании рукописного текста. Презентация доступна по ссылке выше.
Также вчера Светлана Александровна упомянула о том, что ей нужны волонтеры (возможно студенты) в проект по распознаванию русского рукописного текста. Это хорошая возможность освоить eScriptorium под руководством опытного наставника; пишите @gratis_dictum, если готовы за это взяться. Для студентов ВШЭ возможно получение кредитов за проектную деятельность.
Также вчера Светлана Александровна упомянула о том, что ей нужны волонтеры (возможно студенты) в проект по распознаванию русского рукописного текста. Это хорошая возможность освоить eScriptorium под руководством опытного наставника; пишите @gratis_dictum, если готовы за это взяться. Для студентов ВШЭ возможно получение кредитов за проектную деятельность.
VK
Antibarbari HSE. Запись со стены.
Светлана Яцык: Распознавание рукописного текста (HTR): история, перспективы, текущие проекты
Смотрите полностью ВКонтакте.
Смотрите полностью ВКонтакте.
👍5
Борис Орехов: Текст и знание в гуманитарных науках в эпоху больших языковых моделей
Выкладываем запись выступления Бориса Орехова 16 мая в УрФУ на научном семинаре, посвященном проблемам и возможностям применения нейросетей в гуманитарных исследованиях.
Отчуждаемо ли знание от текста? Можно ли считать, что критика “составителей речей” у Платона распространяется на ChatGPT? Где проще имитировать знание -- в гуманитарных науках или в естественных? Как выдает себя машина при написании курсовой по истории?
Огромное спасибо О. В. Алиевой за помощь с видео.
https://youtu.be/SVI9nSmrQWk
Выкладываем запись выступления Бориса Орехова 16 мая в УрФУ на научном семинаре, посвященном проблемам и возможностям применения нейросетей в гуманитарных исследованиях.
Отчуждаемо ли знание от текста? Можно ли считать, что критика “составителей речей” у Платона распространяется на ChatGPT? Где проще имитировать знание -- в гуманитарных науках или в естественных? Как выдает себя машина при написании курсовой по истории?
Огромное спасибо О. В. Алиевой за помощь с видео.
https://youtu.be/SVI9nSmrQWk
YouTube
Борис Орехов: Текст и знание в гуманитарных науках в эпоху больших языковых моделей
Запись доклада Бориса Орехова "Текст и знание в гуманитарных науках в эпоху больших языковых моделей". Выступление 16 мая в УрФУ на научном семинаре, посвященном проблемам и возможностям применения нейросетей в гуманитарных исследованиях.
Отчуждаемо ли…
Отчуждаемо ли…
👍14❤5🔥1
Forwarded from ololo community
Мы начинаем прием заявок на участие в онлайн-программе самообразования Supporting the Creative Economy для профессионалов, работающих в культурных и креативных индустриях и заинтересованных в разработке политик в данном направлении.
На протяжении четырех недель вы будете погружаться в мир креативной экономики, узнавая о ее экономической, технологической и социальной значимости, а также о том, какие возможности она предоставляет творческим предпринимателям.
Программа не только позволит вам расширить свои знания и навыки, но и даст возможность внести существенный вклад в разработку политик, способствующих развитию культурных и креативных индустрий Центральной Азии.
Программа создана British Council и Cultural Associates Oxford в партнерстве с ololo. Ознакомиться с программой и подать заявку можно по ссылкам ниже 🔻
#SupportingtheCreativeEconomy #oxford #britishcouncil #ololo #kzbritish
На протяжении четырех недель вы будете погружаться в мир креативной экономики, узнавая о ее экономической, технологической и социальной значимости, а также о том, какие возможности она предоставляет творческим предпринимателям.
Программа не только позволит вам расширить свои знания и навыки, но и даст возможность внести существенный вклад в разработку политик, способствующих развитию культурных и креативных индустрий Центральной Азии.
Программа создана British Council и Cultural Associates Oxford в партнерстве с ololo. Ознакомиться с программой и подать заявку можно по ссылкам ниже 🔻
#SupportingtheCreativeEconomy #oxford #britishcouncil #ololo #kzbritish
❤1
Forwarded from Системный Блокъ
Как провести стилометрический эксперимент с помощью stylo? Исследуем сценарии «Черного зеркала»
Хотите научиться устанавливать авторство текстов и следить за изменениями в стилистике сценариев к любимым сериалам? Читайте гайд, как самому провести стилометрический эксперимент — с помощью stylo, библиотеки языка R и самого популярного инструмента для стилометрии.
Кратко: о чем статья?
Стилометрия — это количественное исследование стилистики, обычно включающее частотный анализ письменного текста. «Системный Блокъ» рассказывал о ней здесь и делал подборку материалов о стилометрических исследованиях. На практике её можно применять во многих областях: от судебной лингвистики и до установки авторства пьес Мольера.
Самый распространенный инструмент для стилометрических исследований — stylo, библиотека языка программирования R (но не пугайтесь заранее: программировать особо не придётся — у stylo вполне понятный интерфейс). Для работы с ним потребуется установить интерпретатор (программу, которая «переводит» код на языке программирования в команды, понятные машине) языка R и среду для написания кода, которая называется RStudio.
Следуя инструкции работы со stylo, мы исследовали сериал-антиутопию «Черное зеркало», взяв в открытом доступе расшифровки всех эпизодов на английском языке. Эксперимент показал, что первые два сезона для британского телеканала стилистически отличаются от последующих трёх — созданных для Нетфликса. Хотя сценарии для них написал один и тот же человек — создатель сериала, Чарли Брукер.
Чтобы узнать, какая серия «Черного зеркала» стилистически выбивается из общего ряда, получить более подробную инструкцию по работе со stylo на Windows, Mac и Linux и проводить собственные эксперименты — читайте полный текст статьи.
Время чтения: 16 минут.
Хотите научиться устанавливать авторство текстов и следить за изменениями в стилистике сценариев к любимым сериалам? Читайте гайд, как самому провести стилометрический эксперимент — с помощью stylo, библиотеки языка R и самого популярного инструмента для стилометрии.
Кратко: о чем статья?
Стилометрия — это количественное исследование стилистики, обычно включающее частотный анализ письменного текста. «Системный Блокъ» рассказывал о ней здесь и делал подборку материалов о стилометрических исследованиях. На практике её можно применять во многих областях: от судебной лингвистики и до установки авторства пьес Мольера.
Самый распространенный инструмент для стилометрических исследований — stylo, библиотека языка программирования R (но не пугайтесь заранее: программировать особо не придётся — у stylo вполне понятный интерфейс). Для работы с ним потребуется установить интерпретатор (программу, которая «переводит» код на языке программирования в команды, понятные машине) языка R и среду для написания кода, которая называется RStudio.
Следуя инструкции работы со stylo, мы исследовали сериал-антиутопию «Черное зеркало», взяв в открытом доступе расшифровки всех эпизодов на английском языке. Эксперимент показал, что первые два сезона для британского телеканала стилистически отличаются от последующих трёх — созданных для Нетфликса. Хотя сценарии для них написал один и тот же человек — создатель сериала, Чарли Брукер.
Чтобы узнать, какая серия «Черного зеркала» стилистически выбивается из общего ряда, получить более подробную инструкцию по работе со stylo на Windows, Mac и Linux и проводить собственные эксперименты — читайте полный текст статьи.
Время чтения: 16 минут.
Системный Блокъ
Гайд по проведению стилометрического анализа с помощью Stylo на языке R
Системный Блокъ уже рассказывал о том, что такое стилометрия, и о многих стилометрических исследованиях. Читайте подробный гайд, как самому провести такой эксперимент — с помощью stylo, библиотеки языка R и самого популярного инструмента для стилометрии.
❤3
Forwarded from Марафон Homo Digitus 2023
🌐Лекция «Гуманитарий в эпоху датаизма: как осмыслить данные вокруг нас?»
👤Приглашаем на заключительную лекцию марафона!
Докладчик: Андрей Володин, к. и. н., доцент кафедры исторической информатики исторического факультета МГУ им. М. В. Ломоносова, DHRI СФУ
Данные окружают нас, данные повсюду. Датафикация – процесс устойчивого фиксирования массовых наблюдений в разных форматах данных, позволяющий осуществить их качественную и количественную обработку, их научный анализ и синтез. А датаизм — это точка зрения, что Вселенная состоит из потоков данных, когда ценность всякого явления определяется вкладом в обработку данных. Как быть гуманитарием в этом новом мире, как осмыслить собственный «улов» данных и зачем вносить существенный вклад в обработку данных в эпоху повсеместного машинного обучения?
🕰 Мастер-класс начнется 25 мая в 17:00 (мск.)
👉🏻 Регистрация: perm.hse.ru/marathon/2023
👤Приглашаем на заключительную лекцию марафона!
Докладчик: Андрей Володин, к. и. н., доцент кафедры исторической информатики исторического факультета МГУ им. М. В. Ломоносова, DHRI СФУ
Данные окружают нас, данные повсюду. Датафикация – процесс устойчивого фиксирования массовых наблюдений в разных форматах данных, позволяющий осуществить их качественную и количественную обработку, их научный анализ и синтез. А датаизм — это точка зрения, что Вселенная состоит из потоков данных, когда ценность всякого явления определяется вкладом в обработку данных. Как быть гуманитарием в этом новом мире, как осмыслить собственный «улов» данных и зачем вносить существенный вклад в обработку данных в эпоху повсеместного машинного обучения?
🕰 Мастер-класс начнется 25 мая в 17:00 (мск.)
👉🏻 Регистрация: perm.hse.ru/marathon/2023
👍6🔥2
Дорогие коллеги, если вы разрабатываете и ведете образовательные программы по Digital Humanities, цифровой истории, компьютерной лингвистике и смежным направлениям, расскажите об этой программе на сайте DH Course Registry https://dhcr.clarin-dariah.eu/.
На этой платформе собраны разные форматы - магистратуры, бакалавриаты, летние школы, отдельные курсы со всего мира. И пока тут практически нет программ из Центральной Азии и России.
Это отличная возможность, чтобы о вашей программе узнали потенциальные абитуриенты и международное сообщество.
Обращайтесь с любыми вопросами по платформе к Динаре Гагариной (@dinaraamirovna). Если вы хотите добавить свой курс, тоже напишите Динаре.
На этой платформе собраны разные форматы - магистратуры, бакалавриаты, летние школы, отдельные курсы со всего мира. И пока тут практически нет программ из Центральной Азии и России.
Это отличная возможность, чтобы о вашей программе узнали потенциальные абитуриенты и международное сообщество.
Обращайтесь с любыми вопросами по платформе к Динаре Гагариной (@dinaraamirovna). Если вы хотите добавить свой курс, тоже напишите Динаре.
❤8
Forwarded from DHRussia Новости
31 мая 2023 года в 15:00 (msk) / 19:00 (krsk) состоится очередное заседание научно-методического семинара «Цифровая среда» Института цифровых гуманитарных исследований (DHRI) Сибирского федерального университета. На семинаре выступит Роман Борисович Кончаков (РАНХиГС) с докладом «Проблемы описания и публикации данных исторической статистики онлайн».
Регистрация и аннотация доклада по адресу: https://dhri.timepad.ru/event/2444752/
Регистрация и аннотация доклада по адресу: https://dhri.timepad.ru/event/2444752/
dhri.timepad.ru
«Проблемы описания и публикации данных исторической статистики онлайн». Доклад Р.Б.Кончакова на семинаре „Цифровая среда“ DHRI@SFU…
31 мая 2023 года в 15:00 (msk) / 19:00 (krsk) состоится очередное заседание научно-методического семинара «Цифровая среда» Института цифровых гуманитарных исследований (DHRI) Сибирского федерального университета. На семинаре выступит Роман Борисович Кончаков…
❤2👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Небольшая видео-презентация пленарного доклада Динары Гагариной "Digital Humanities в Центральной Азии: точки роста" на конференции Ташкентского университета прикладных наук.
Будем рады совместным проектам и мероприятиям по развитию цифровых гуманитарных исследований в Центральной Азии!
Будем рады совместным проектам и мероприятиям по развитию цифровых гуманитарных исследований в Центральной Азии!
❤6🔥3👍1
Модули Python для решения задач Digital Humanities
Завели на нашем сайте раздел, где будем собирать полезные инструменты, разработанные сообществом DH CLOUD и студентами магистратур по Digital Humanities. Начнем с трех модулей для Python, дальше коллекция будет пополняться.
https://dhcloud.org/python/
Завели на нашем сайте раздел, где будем собирать полезные инструменты, разработанные сообществом DH CLOUD и студентами магистратур по Digital Humanities. Начнем с трех модулей для Python, дальше коллекция будет пополняться.
https://dhcloud.org/python/
dhcloud.org
Модули Python для решения задач Digital Humanities
В этом разделе будем собирать полезные инструменты, разработанные сообществом DH CLOUD и студентами магистратур по Digital Humanities. Начнем с трех
❤15👍4🔥3
Румыния становится важным центром DH образования. Туда переехал из Лейпцига летний европейский университет «Сulture and technology» А в конце июня пройдет школа по корпусной лингвистике и digital humanities. (❗️взнос всего 50 евро) https://dilarass.uvt.ro/
❤6👍6
Борис Орехов опубликовал препринт с результатами эксперимента, в котором участвовало под сотню студентов-филологов. Задача была в том, чтобы понять, могут ли респонденты угадать стиль автора, на котором обучалась lstm-модель. Проверялись короткие отрывки в 4 строки, сгенерированные нейросетями, натренированными на текстах Некрасова, Мандельштама и раннего Пастернака. Во всех случаях большинство ответов оказались верными. Важным для результатов оказалось и то, знают ли респонденты стихи поэта наизусть.
❤17🔥2
Прикладной анализ данных в социальных науках
Академия Яндекса совместно с Европейским университетом в Санкт-Петербурге разработала новый хендбук (онлайн-учебник) «Прикладной анализ данных в социальных науках». Хендбук составлен так, чтобы любой человек без навыков в области анализа данных или программирования мог за короткий срок понять общую логику и техническую сторону процесса, провести самостоятельное исследование и научиться программировать на Python. Учебник бесплатный.
Академия Яндекса совместно с Европейским университетом в Санкт-Петербурге разработала новый хендбук (онлайн-учебник) «Прикладной анализ данных в социальных науках». Хендбук составлен так, чтобы любой человек без навыков в области анализа данных или программирования мог за короткий срок понять общую логику и техническую сторону процесса, провести самостоятельное исследование и научиться программировать на Python. Учебник бесплатный.
education.yandex.ru
Прикладной анализ данных в социальных науках — Хендбук от Яндекс Образования
Учебник составлен так, чтобы любой человек без навыков в области анализа данных или программирования, мог за короткий срок понять общую логику и техническую сторону процесса, провести самостоятельное исследование и научиться программировать на Python.
🔥16👍3
Forwarded from Цифровой филолог (Даня Скоринкин)
Stylo beats GPT: большие языковые модели не могут (пока) обмануть стилометрию
Этим вечером в Сиене закончилась главная итальянская DH-конференция AIUCD. Среди прочих докладов нас заинтересовал эксперимент по тестированию Delta на текстах, сгенерированных GPT3 и (чуть-чуть) ChatGPT.
🧪Чтобы проделать тест, исследователи нагенерировали в GPT3 текстов “в стиле” десяти английских авторов. Через API GPT3 они закидывали запросы вида “Напиши главу романа в стиле автора А”, “Напиши роман, имитирующий автора Б”, “Напиши рассказ так, как будто он написан автором В” и т.п. — всего 320 комбинаций. Так постепенно нагенерировали “текстоиды” (термин самих исследователей) длиной не менее 5000 слов. Эти текстоиды затем сравнивались с реальными текстами тех же авторов.
😔Результат пока что в пользу стилометрии: тексты GPT3 “в стиле” разных авторов похожи не на этих авторов , а друг на друга (см. картинку). Для ChatGPT, к которому у авторов статьи еще не было API, сделали эксперимент с одним автором (Диккенс), и там стайло тоже обмануть не удалось.
🤔 Причиной "неудач” языковых моделей в имитации авторского сигнала становится хроническое недоиспользование некоторых частотных слов. Например они редко используют отрицательные частицы (прям как некоторые из нас, не умеющие говорить “нет”), а еще модальные глаголы типа might.
🔗Ссылка на сборник AIUCD 2023 и нужную страницу со статьей про Delta vs GPT:
https://www.aiucd.it/wp-content/uploads/2023/06/2023_aiucd_la_memoria_digitale_v1.pdf#page=305
Этим вечером в Сиене закончилась главная итальянская DH-конференция AIUCD. Среди прочих докладов нас заинтересовал эксперимент по тестированию Delta на текстах, сгенерированных GPT3 и (чуть-чуть) ChatGPT.
🧪Чтобы проделать тест, исследователи нагенерировали в GPT3 текстов “в стиле” десяти английских авторов. Через API GPT3 они закидывали запросы вида “Напиши главу романа в стиле автора А”, “Напиши роман, имитирующий автора Б”, “Напиши рассказ так, как будто он написан автором В” и т.п. — всего 320 комбинаций. Так постепенно нагенерировали “текстоиды” (термин самих исследователей) длиной не менее 5000 слов. Эти текстоиды затем сравнивались с реальными текстами тех же авторов.
😔Результат пока что в пользу стилометрии: тексты GPT3 “в стиле” разных авторов похожи не на этих авторов , а друг на друга (см. картинку). Для ChatGPT, к которому у авторов статьи еще не было API, сделали эксперимент с одним автором (Диккенс), и там стайло тоже обмануть не удалось.
🤔 Причиной "неудач” языковых моделей в имитации авторского сигнала становится хроническое недоиспользование некоторых частотных слов. Например они редко используют отрицательные частицы (прям как некоторые из нас, не умеющие говорить “нет”), а еще модальные глаголы типа might.
🔗Ссылка на сборник AIUCD 2023 и нужную страницу со статьей про Delta vs GPT:
https://www.aiucd.it/wp-content/uploads/2023/06/2023_aiucd_la_memoria_digitale_v1.pdf#page=305
🔥8👍1
Forwarded from DHRussia Новости
29 июня – 2 июля 2023 г. истфак МГУ и АИК проводят международную летнюю онлайн-школу молодых ученых «Историческая информатика – 2023».
Регистрация на Школу открыта до 21:00 (msk) 28 июня 2022 года: https://aik.timepad.ru/event/2428502/ (по ссылке есть и программа лектория первого дня Школы).
Кто хочет попробовать себя в качестве докладчика в день молодежной конференции в рамках Школы, должен успеть зарегистрироваться не позднее 20 июня.
Регистрация на Школу открыта до 21:00 (msk) 28 июня 2022 года: https://aik.timepad.ru/event/2428502/ (по ссылке есть и программа лектория первого дня Школы).
Кто хочет попробовать себя в качестве докладчика в день молодежной конференции в рамках Школы, должен успеть зарегистрироваться не позднее 20 июня.
aik.timepad.ru
III международная летняя школа молодых ученых по исторической информатике / События на TimePad.ru
Исторический факультет МГУ имени М.В. Ломоносова и Ассоциация «История и компьютер» 29 июня – 2 июля 2023 г. проводят международную летнюю школу молодых ученых по исторической информатике — «Историческая информатика – 2023».
Регистрация на Школу была…
Регистрация на Школу была…
👍5
От кыргызского эпоса до ChatGPT: что обсуждали на круглом столе «Digital Humanities в Центральной Азии»
Системный Блокъ подготовил обзор докладов с удобными таймкодами.
https://sysblok.ru/philology/ot-kyrgyzskogo-jeposa-do-chatgpt-chto-obsuzhdali-na-kruglom-stole-digital-humanities-v-centralnoj-azii/
Системный Блокъ подготовил обзор докладов с удобными таймкодами.
https://sysblok.ru/philology/ot-kyrgyzskogo-jeposa-do-chatgpt-chto-obsuzhdali-na-kruglom-stole-digital-humanities-v-centralnoj-azii/
Системный Блокъ
Что обсуждали на круглом столе «Digital Humanities в Центральной Азии»
15 марта 2023 года прошёл круглый стол «Digital Humanities в Центральной Азии» — серия панельных дискуссий, на которых учёные из стран Центральной Азии обсудили цифровые гуманитарные исследования и проекты в регионе. Участница Системного Блока сходила на…
🔥6❤1
Forwarded from DHRussia Новости
Продолжается регистрация заявок на конференцию «Информационные технологии в гуманитарных исследованиях», которая пройдет с 25 по 28 сентября 2023 года на базе Сибирского федерального университета в Красноярске в смешанном формате.
Регистрация участников и приём текстов докладов проводятся по адресу: https://conf.sfu-kras.ru/dhri/ до 30 июня.
Регистрация участников и приём текстов докладов проводятся по адресу: https://conf.sfu-kras.ru/dhri/ до 30 июня.
conf.sfu-kras.ru
Общая информация | Конференции СФУ
Сибирский федеральный университет (СФУ) входит в топ-15 вузов России. Ведущие научные школы Красноярска. Лучший в России кампус. Мировые индустриальные партнёры
❤2
Forwarded from DHRussia Новости
В ближайшую среду 28 июня 2023 года в 15:00 (msk) / 19:00 (krsk) состоится очередное заседание онлайн-семинара
На семинаре выступит Владислава Леонидовна Гайдук (ГМИИ имени А.С.Пушкина) с докладом «Цифровой архив в музее: проблемы и перспективы».
Аннотация доклада и форма регистрации доступны по адресу:
https://dhri.timepad.ru/event/2468014/
«Цифровая среда»
Института цифровых гуманитарных исследований СФУ.На семинаре выступит Владислава Леонидовна Гайдук (ГМИИ имени А.С.Пушкина) с докладом «Цифровой архив в музее: проблемы и перспективы».
Аннотация доклада и форма регистрации доступны по адресу:
https://dhri.timepad.ru/event/2468014/
dhri.timepad.ru
«Цифровой архив в музее: проблемы и перспективы». Доклад В.Л.Гайдук на семинаре „Цифровая среда“ DHRI@SFU / События на TimePad.ru
28 июня 2023 года в 15:00 (msk) / 19:00 (krsk) состоится очередное заседание научно-методического семинара «Цифровая среда» Института цифровых гуманитарных исследований (DHRI) Сибирского федерального университета. На семинаре выступит Владислава Леонидовна…
👍1