Птички, цветочки и запахи городов: подборка материалов для летнего чтения
Впереди почти месяц лета, а это значит, что можно успеть насладиться августом: съездить в путешествие, собрать гербарий, посмотреть выставки. Но еще лучше, если сделать все это в духе digital humanities. Как соединить технологии и летние радости, читайте в нашей сезонной подборке.
Чем пахнут города?
Лето — это прежде всего путешествия. Если не знаете, как выбрать направление, загляните в наш материал об интерактивной карте запахов городов, которую составила международная группа урбанистов. Узнаете, как исследователям помогли посты и фотографии из соцсетей и на какой улице Барселоны раздается больше всего ароматов еды.
Айтрекинг в восприятии архитектурной среды
Путешествовать можно и виртуально. Например, в Помпеи! Ведь ученые создали 3D-модель Дома греческих эпиграмм, сохранившегося после извержения Везувия. Мы изучили их исследование и выяснили, зачем археологам погружать людей в виртуальную реальность и что привлекает современных наблюдателей в античном интерьере.
Бердвотчинг: что это за птица такая?
Если городскому туризму вы предпочитаете прогулки по природным ландшафтам, то рекомендуем заняться бёрдвотчингом, или попросту наблюдением за птицами. У нас есть материал, в котором мы советуем мобильные приложения для всех, кто хочет отличать соловья от кукушки. Прочитайте его — и вы узнаете, как с помощью смартфона определить, кто поет в соседней роще и как любители могут внести вклад в большую науку. А ещё больше о возможности самостоятельно вложиться в науку рассказали здесь.
Испытание ботаника: тест по растениям России из цифрового гербария МГУ
Примените свои знания о флоре в нашем тесте, созданном на основе цифрового гербария МГУ. Это самая крупная в России цифровая база растений. В ней собраны более миллиона образцов со всего мира. Пройдите тест и вы навсегда запомните, как называется трава из детской игры “Петушок или курочка” и какое народное прозвище у клевера ползучего.
Гид по Voyant Tools
Если лето для вас — время, когда можно научиться чему-то новому, то рекомендуем наш гайд по инструменту для анализа текстов Voyant Tools (есть первая и вторая части). Визуализации, частотный анализ, определение трендов и коллокаций в корпусе — вот лишь некоторые возможности этого ресурса.
🤖 «Системный Блокъ» @sysblok
Впереди почти месяц лета, а это значит, что можно успеть насладиться августом: съездить в путешествие, собрать гербарий, посмотреть выставки. Но еще лучше, если сделать все это в духе digital humanities. Как соединить технологии и летние радости, читайте в нашей сезонной подборке.
Чем пахнут города?
Лето — это прежде всего путешествия. Если не знаете, как выбрать направление, загляните в наш материал об интерактивной карте запахов городов, которую составила международная группа урбанистов. Узнаете, как исследователям помогли посты и фотографии из соцсетей и на какой улице Барселоны раздается больше всего ароматов еды.
Айтрекинг в восприятии архитектурной среды
Путешествовать можно и виртуально. Например, в Помпеи! Ведь ученые создали 3D-модель Дома греческих эпиграмм, сохранившегося после извержения Везувия. Мы изучили их исследование и выяснили, зачем археологам погружать людей в виртуальную реальность и что привлекает современных наблюдателей в античном интерьере.
Бердвотчинг: что это за птица такая?
Если городскому туризму вы предпочитаете прогулки по природным ландшафтам, то рекомендуем заняться бёрдвотчингом, или попросту наблюдением за птицами. У нас есть материал, в котором мы советуем мобильные приложения для всех, кто хочет отличать соловья от кукушки. Прочитайте его — и вы узнаете, как с помощью смартфона определить, кто поет в соседней роще и как любители могут внести вклад в большую науку. А ещё больше о возможности самостоятельно вложиться в науку рассказали здесь.
Испытание ботаника: тест по растениям России из цифрового гербария МГУ
Примените свои знания о флоре в нашем тесте, созданном на основе цифрового гербария МГУ. Это самая крупная в России цифровая база растений. В ней собраны более миллиона образцов со всего мира. Пройдите тест и вы навсегда запомните, как называется трава из детской игры “Петушок или курочка” и какое народное прозвище у клевера ползучего.
Гид по Voyant Tools
Если лето для вас — время, когда можно научиться чему-то новому, то рекомендуем наш гайд по инструменту для анализа текстов Voyant Tools (есть первая и вторая части). Визуализации, частотный анализ, определение трендов и коллокаций в корпусе — вот лишь некоторые возможности этого ресурса.
Please open Telegram to view this post
VIEW IN TELEGRAM
Исход людей из OpenAI, новые модели для решения математических задач и SAM 2
Рассказываем, что произошло в мире ИИ за последние две недели.
Ключевые лица покидают OpenAI?
Сооснователь OpenAI, Джон Шульман, заявил о своём уходе. В сообщении Шульман рассказал, что переходит работать в компанию Anthropic (один из основных конкурентов OpenAI). Свою отставку он объяснил желанием заниматься более технической работой и сфокусироваться на исследованиях безопасного ИИ.
Через несколько часов после заявления Шульмана технический директор компании Грег Брокман сообщил, что после девяти лет работы он берёт отпуск до конца этого года. В июне этого же года компанию покинули два топ-исследователя. Один из них также впоследствии ушёл в Anthropic.
Qwen2-Math – новый лидер среди математических моделей
Китайский холдинг Alibaba Group выпустил семейство больших языковых моделей Qwen2-Math, специализированных для решения математических моделей. Qwen2-Math — дообученная версией семейства обычных языковых моделей Qwen2, доступная в трёх размерах: 1,5, 7 и 72 млрд параметров.
Флагманская модель опережает открытые и коммерческие модели (GPT-4o и Claude Sonnet 3.5) в математических тестах. Младшая версия же по качеству сравнима с моделями более чем в четыре раза больше, включая недавно выпущенную Mathstral.
SAM 2 – новая модель для сегментации изображений и видео
Meta* представила второе поколение модели SAM (Segment Anything Model). В отличие от предшественника, который умел выделять произвольные объекты только на изображениях, SAM 2 умеет работать и с видео.
SAM 2 способен консистентно выделять произвольные движущиеся объекты между кадрами. В работе с изображениями новая версия точнее и в шесть раз быстрее первой. Для обучения модели была собрана обучающая выборка, содержащая 51 тыс. разнообразных видео с 643 тыс. выделенных объектов.
Модель и выборка доступны для скачивания и коммерческого использования.
🤖 «Системный Блокъ» @sysblok
* Meta признана в РФ экстремистской организацией.
Рассказываем, что произошло в мире ИИ за последние две недели.
Ключевые лица покидают OpenAI?
Сооснователь OpenAI, Джон Шульман, заявил о своём уходе. В сообщении Шульман рассказал, что переходит работать в компанию Anthropic (один из основных конкурентов OpenAI). Свою отставку он объяснил желанием заниматься более технической работой и сфокусироваться на исследованиях безопасного ИИ.
Через несколько часов после заявления Шульмана технический директор компании Грег Брокман сообщил, что после девяти лет работы он берёт отпуск до конца этого года. В июне этого же года компанию покинули два топ-исследователя. Один из них также впоследствии ушёл в Anthropic.
Qwen2-Math – новый лидер среди математических моделей
Китайский холдинг Alibaba Group выпустил семейство больших языковых моделей Qwen2-Math, специализированных для решения математических моделей. Qwen2-Math — дообученная версией семейства обычных языковых моделей Qwen2, доступная в трёх размерах: 1,5, 7 и 72 млрд параметров.
Флагманская модель опережает открытые и коммерческие модели (GPT-4o и Claude Sonnet 3.5) в математических тестах. Младшая версия же по качеству сравнима с моделями более чем в четыре раза больше, включая недавно выпущенную Mathstral.
SAM 2 – новая модель для сегментации изображений и видео
Meta* представила второе поколение модели SAM (Segment Anything Model). В отличие от предшественника, который умел выделять произвольные объекты только на изображениях, SAM 2 умеет работать и с видео.
SAM 2 способен консистентно выделять произвольные движущиеся объекты между кадрами. В работе с изображениями новая версия точнее и в шесть раз быстрее первой. Для обучения модели была собрана обучающая выборка, содержащая 51 тыс. разнообразных видео с 643 тыс. выделенных объектов.
Модель и выборка доступны для скачивания и коммерческого использования.
* Meta признана в РФ экстремистской организацией.
Please open Telegram to view this post
VIEW IN TELEGRAM
От Ктулху до Человеколося: мифы в цифровой галактике
Как существа из древних легенд «выживают» в современной массовой культуре, перемещаясь из сказок и книг — в мультики, сериалы и компьютерные игры? Материал «Системного Блока» о цифровой жизни мифов.
Кратко: о чём статья?
В цифровой среде интерактивность лежит в основе реальности. Интерактивность пользователя, взаимодействие с программным кодом или его написание порождает просьюмеризм (явление, при котором человек принимает активное участие в создании товаров и услуг, которые сам потребляет). Когда просьюмер сталкивается с собственным запросом, он познает проблему интермедиальности (перехода образа из одной среды в другую).
Примером перехода мифа в цифру может служить рассказ Говарда Лавкрафта «Зов Ктулху». Образ Ктулху стал появляться в произведениях других авторов, например, Анджея Сапковского, Стивена Кинга и Нила Геймана, потом с участием этого персонажа сняли фильмы. Индустрию игр Ктулху также не обошёл стороной.
Другой пример переосмысления образов — игра пермских инди-разработчиков «Человеколось». За основу взяты предания ханты, манси и саамов о лосе Ене и его семи сыновьях.
О том, чем может заниматься просьюмер, из чего состоит коллекция пермского звериного стиля и какие ещё примеры перехода мифа в цифру можно найти — в полном тексте статьи.
Время чтения: 6 минут.
🤖 «Системный Блокъ» @sysblok
Как существа из древних легенд «выживают» в современной массовой культуре, перемещаясь из сказок и книг — в мультики, сериалы и компьютерные игры? Материал «Системного Блока» о цифровой жизни мифов.
Кратко: о чём статья?
В цифровой среде интерактивность лежит в основе реальности. Интерактивность пользователя, взаимодействие с программным кодом или его написание порождает просьюмеризм (явление, при котором человек принимает активное участие в создании товаров и услуг, которые сам потребляет). Когда просьюмер сталкивается с собственным запросом, он познает проблему интермедиальности (перехода образа из одной среды в другую).
Примером перехода мифа в цифру может служить рассказ Говарда Лавкрафта «Зов Ктулху». Образ Ктулху стал появляться в произведениях других авторов, например, Анджея Сапковского, Стивена Кинга и Нила Геймана, потом с участием этого персонажа сняли фильмы. Индустрию игр Ктулху также не обошёл стороной.
Другой пример переосмысления образов — игра пермских инди-разработчиков «Человеколось». За основу взяты предания ханты, манси и саамов о лосе Ене и его семи сыновьях.
О том, чем может заниматься просьюмер, из чего состоит коллекция пермского звериного стиля и какие ещё примеры перехода мифа в цифру можно найти — в полном тексте статьи.
Время чтения: 6 минут.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
От Ктулху до Человеколося: мифы в цифровой галактике - Системный Блокъ
Как существа из древних легенд «выживают» в современной массовой культуре, перемещаясь из сказок и книг — в мультики, сериалы и компьютерные игры
«Короче, Пушкин!»: как нейросети пересказали школьную программу
В апреле 2024 года — период активной подготовки к экзаменам — Яндекс Вордстат зафиксировал более 1,5 миллиона запросов по словосочетанию «краткий пересказ». Но кто-то ищет краткие пересказы произведений в поисковиках, а кто-то — просит помощи у нейросети. Насколько точен и адекватен анализ от ИИ? Чтобы узнать это, мы провели эксперимент и протестировали три самых популярных нейросети.
Кратко: что за эксперимент?
Для эксперимента мы использовали три нейросети: Chat GPT, Yandex GPT и Notion AI.
У каждой ИИ было две задачи: кратко изложить текст и рассказать, в чем основная суть произведения.
В качестве материала мы выбрали разные по структуре произведения из школьной классики: рассказ А. П. Чехова «Толстый и тонкий», басню Крылова «Ворона и лисица» и стихотворение М. Ю. Лермонтова «Бородино».
В случае рассказа Чехова Yandex GPT пересказал только сюжет: на вокзале встретились два приятеля, пообщались и разошлись. Никакой иронии он не заметил. Chat GPT справился лучше, хотя грамматика русского языка у него оказалась не на высоте и встречались фразы вроде: «У них были с собой жена и сын тонкого». Notion AI просуммировал события наиболее точно, но вот считать иронию текста у нейросети тоже не получилось. Зато, формулируя главную мысль текста, Notion AI обратил внимание на позицию автора критику общества, не ограничившись только сюжетом.
В случае с Лермонтовым и Крыловым Yandex GPT бессистемно выдавал лоскуты отдельных цитат, а Notion AI и Chat GPT выбрали другие стратегии.
Подробнее о них и о том, какие ошибки сделали нейросети (спойлер:Chat GPT, например, приписал «Бородино» Пушкину ) узнаете из полной версии статьи.
Время чтения: 9 минут.
🤖 «Системный Блокъ» @sysblok
В апреле 2024 года — период активной подготовки к экзаменам — Яндекс Вордстат зафиксировал более 1,5 миллиона запросов по словосочетанию «краткий пересказ». Но кто-то ищет краткие пересказы произведений в поисковиках, а кто-то — просит помощи у нейросети. Насколько точен и адекватен анализ от ИИ? Чтобы узнать это, мы провели эксперимент и протестировали три самых популярных нейросети.
Кратко: что за эксперимент?
Для эксперимента мы использовали три нейросети: Chat GPT, Yandex GPT и Notion AI.
У каждой ИИ было две задачи: кратко изложить текст и рассказать, в чем основная суть произведения.
В качестве материала мы выбрали разные по структуре произведения из школьной классики: рассказ А. П. Чехова «Толстый и тонкий», басню Крылова «Ворона и лисица» и стихотворение М. Ю. Лермонтова «Бородино».
В случае рассказа Чехова Yandex GPT пересказал только сюжет: на вокзале встретились два приятеля, пообщались и разошлись. Никакой иронии он не заметил. Chat GPT справился лучше, хотя грамматика русского языка у него оказалась не на высоте и встречались фразы вроде: «У них были с собой жена и сын тонкого». Notion AI просуммировал события наиболее точно, но вот считать иронию текста у нейросети тоже не получилось. Зато, формулируя главную мысль текста, Notion AI обратил внимание на позицию автора критику общества, не ограничившись только сюжетом.
В случае с Лермонтовым и Крыловым Yandex GPT бессистемно выдавал лоскуты отдельных цитат, а Notion AI и Chat GPT выбрали другие стратегии.
Подробнее о них и о том, какие ошибки сделали нейросети (спойлер:
Время чтения: 9 минут.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
«Короче, Пушкин!»: как нейросети пересказали школьную программу - Системный Блокъ
Сотни тысяч школьников ищут способ упростить себе подготовку к экзамену по литературе. Кто-то ищет краткие пересказы произведений, а кто-то просит помощи у нейросети, не догадываясь, что та может оказать им медвежью услугу. Насколько точен и адекватен анализ…
Музей криптографии глазами гуманитария
Рассказываем про новый пост из блога Бориса Орехова
Что такое криптография?
Криптография — наука о конфиденциальности, аутентификации и шифровании данных. Системный Блокъ уже писал об исторической криптографии и шифропанках. Музей криптографии в Москве посвящен не только ей самой, но и смежным дисциплинам и технологиям коммуникации.
Культура и технологии вперемешку
Сейчас область криптографии исключительно математическая и компьютерная, однако музей концентрируется еще и на гуманитарной составляющей. Например, целый этаж посвящен истории здания музея, а на литературной полке можно найти книги, в которых шифры играют заметную сюжетную роль. В то же время в музее много технических экспонатов: например, шифровальных аппаратур.
Атмосфера «Системного Блока»
Музей может показаться представительством редакции «Системного Блока» в оффлайне: здесь внимание и к текстам, и к технологиям, и к их взаимодействию. Музей отличается легкой подачей и заботливым отношением к истории. Например, большое пространство отведено античности.
Каковы гуманитарные истоки криптографии? Как музею о ней удается разговаривать на человеческом языке? Почему часть экспозиции рассказывает про интернет? О всём этом и многом другом, читайте в посте блога.
Время чтения: 7,5 минут.
🤖 «Системный Блокъ» @sysblok
Рассказываем про новый пост из блога Бориса Орехова
Что такое криптография?
Криптография — наука о конфиденциальности, аутентификации и шифровании данных. Системный Блокъ уже писал об исторической криптографии и шифропанках. Музей криптографии в Москве посвящен не только ей самой, но и смежным дисциплинам и технологиям коммуникации.
Культура и технологии вперемешку
Сейчас область криптографии исключительно математическая и компьютерная, однако музей концентрируется еще и на гуманитарной составляющей. Например, целый этаж посвящен истории здания музея, а на литературной полке можно найти книги, в которых шифры играют заметную сюжетную роль. В то же время в музее много технических экспонатов: например, шифровальных аппаратур.
Атмосфера «Системного Блока»
Музей может показаться представительством редакции «Системного Блока» в оффлайне: здесь внимание и к текстам, и к технологиям, и к их взаимодействию. Музей отличается легкой подачей и заботливым отношением к истории. Например, большое пространство отведено античности.
Каковы гуманитарные истоки криптографии? Как музею о ней удается разговаривать на человеческом языке? Почему часть экспозиции рассказывает про интернет? О всём этом и многом другом, читайте в посте блога.
Время чтения: 7,5 минут.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Не (с)только криптография - Системный Блокъ
Про Музей криптографии глазами гуманитария: как в экспозиции удалось смешать культуру и технологии в равной пропорции, что стоит на литературной полке музея криптографии и почему внутри музея царит атмосфера Системного Блока.
Вино и гашиш, Истанбул и Париж: про какие города и страны поют русскоязычные исполнители?
Анализ 1129 песен, выпущенных с 1990-ых по 2019 год показал, какие локации популярнее всего у русской поп-эстрады. В лидерах Москва – 68 упоминаний (от 22 исполнителей). Причем чаще всего город встречается в песнях Децла. Второе по популярности направление – Париж. О нем пели 41 раз 13 исполнителей. Санкт-Петербург как главный мотив песен упомянули 30 раз 8 исполнителей.
Если хотите узнать не только о городах, но также о еде, напитках и чувствах в песнях разных жанров, читайте наше исследование о русскоязычной музыке.
🤖 «Системный Блокъ» @sysblok
Анализ 1129 песен, выпущенных с 1990-ых по 2019 год показал, какие локации популярнее всего у русской поп-эстрады. В лидерах Москва – 68 упоминаний (от 22 исполнителей). Причем чаще всего город встречается в песнях Децла. Второе по популярности направление – Париж. О нем пели 41 раз 13 исполнителей. Санкт-Петербург как главный мотив песен упомянули 30 раз 8 исполнителей.
Если хотите узнать не только о городах, но также о еде, напитках и чувствах в песнях разных жанров, читайте наше исследование о русскоязычной музыке.
Please open Telegram to view this post
VIEW IN TELEGRAM
Языковые модели — это адронный коллайдер для языка: интервью с Татьяной Шавриной
Что делать с тем, что коммерческие продукты вроде ChatGPT созданы на основе украденной интеллектуальной собственности? Есть ли внутри современных нейросетевых моделей что-то вроде физической модели мира? (Спойлер:кажется, нет. ) Куда развивается искусственный интеллект и какие новые умения он приобретет в ближайшем будущем? И что делать тем, кто хочет участвовать в развитии ИИ? Об этом «Системный Блокъ» поговорил с Татьяной Шавриной, руководительницей исследовательской команды в проекте LLAMA и создательницей канала Kali Novskaya @rybolos_channel, в котором выходят новости мира NLP, обзоры свежих статей, датасетов и моделей.
‼️ Перспективы
Мы впервые находимся в ситуации, когда благодаря большим языковым моделям (LLM) мы можем задокументировать человеческое общение в огромном объеме, причём в условиях, которые мы можем контролировать. Благодаря LLM мы можем построить универсальные правила грамматики заново, как бы снизу вверх, опираясь на большие данные, которые у нас теперь есть. Правда, придется преодолеть англоцентризм моделей и ещё некоторые ограничения.
❗ Риски
С использованием искусственного интеллекта связаны и большие риски. Например, манипуляция информацией и общественным мнением на разных уровнях, а еще – применение в военной сфере. Сейчас есть стартапы, которые занимаются компьютерным зрением для дронов, распознаванием лиц, слежкой за людьми.
❓ Вопросы
Интеллектуальная собственность и авторские права — большой вопрос в сфере ИИ. Все нейросети и продукты на них в широком смысле построены на нарушении копирайта. Что с этим делать пока неясно, поскольку популярные лицензии на интеллектуальную собственность составлялись без учета того, что кто-то будет их использовать для обучения ИИ-моделей. Они создавались под маркетинговые нужды. Сегодня крупные владельцы контента часто сами заинтересованы в том, чтобы ослабить ограничения копирайта, но пока мало что сделано.
⁉️ Сомнения
Фундаментально в области LLM мало что поменялось с 2020 года, когда вышла GPT-3. То есть ещё до ChatGPT. Просто сначала взаимодействие с ней было не так удобно, как сейчас, потому что оно было не в формате диалога. Скорее всего вскоре наши ожидания от LLM остановятся на определённом уровне, как ожидания от интернет-поиска. Станет проще писать эссе, писать код или оформлять отчёты по ГОСТу. И на этом всё.
Впрочем, модели, конечно, будут становиться масштабнее и качественнее. Будет поддержка большего числа языков. Будут больше использоваться научные данные. Логический вывод будет работать чуть-чуть лучше. Тренд идет на планирование, агентность — всё то, чего нам не хватает до наступления AGI (универсального искусственного интеллекта).
Если хотите узнать больше о настоящем и будущем ИИ — конкуренции Open-source моделей с коммерческими, данных для обучения и «модели мира» — переходите к полной версии интервью.
🤖 «Системный Блокъ» @sysblok
Что делать с тем, что коммерческие продукты вроде ChatGPT созданы на основе украденной интеллектуальной собственности? Есть ли внутри современных нейросетевых моделей что-то вроде физической модели мира? (Спойлер:
‼️ Перспективы
Мы впервые находимся в ситуации, когда благодаря большим языковым моделям (LLM) мы можем задокументировать человеческое общение в огромном объеме, причём в условиях, которые мы можем контролировать. Благодаря LLM мы можем построить универсальные правила грамматики заново, как бы снизу вверх, опираясь на большие данные, которые у нас теперь есть. Правда, придется преодолеть англоцентризм моделей и ещё некоторые ограничения.
❗ Риски
С использованием искусственного интеллекта связаны и большие риски. Например, манипуляция информацией и общественным мнением на разных уровнях, а еще – применение в военной сфере. Сейчас есть стартапы, которые занимаются компьютерным зрением для дронов, распознаванием лиц, слежкой за людьми.
❓ Вопросы
Интеллектуальная собственность и авторские права — большой вопрос в сфере ИИ. Все нейросети и продукты на них в широком смысле построены на нарушении копирайта. Что с этим делать пока неясно, поскольку популярные лицензии на интеллектуальную собственность составлялись без учета того, что кто-то будет их использовать для обучения ИИ-моделей. Они создавались под маркетинговые нужды. Сегодня крупные владельцы контента часто сами заинтересованы в том, чтобы ослабить ограничения копирайта, но пока мало что сделано.
⁉️ Сомнения
Фундаментально в области LLM мало что поменялось с 2020 года, когда вышла GPT-3. То есть ещё до ChatGPT. Просто сначала взаимодействие с ней было не так удобно, как сейчас, потому что оно было не в формате диалога. Скорее всего вскоре наши ожидания от LLM остановятся на определённом уровне, как ожидания от интернет-поиска. Станет проще писать эссе, писать код или оформлять отчёты по ГОСТу. И на этом всё.
Впрочем, модели, конечно, будут становиться масштабнее и качественнее. Будет поддержка большего числа языков. Будут больше использоваться научные данные. Логический вывод будет работать чуть-чуть лучше. Тренд идет на планирование, агентность — всё то, чего нам не хватает до наступления AGI (универсального искусственного интеллекта).
Если хотите узнать больше о настоящем и будущем ИИ — конкуренции Open-source моделей с коммерческими, данных для обучения и «модели мира» — переходите к полной версии интервью.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Интервью «Системного Блока» с Татьяной Шавриной о прогрессе языковых моделей, современном состоянии области искусственного интеллекта…
«Системный Блокъ» поговорил с Татьяной Шавриной, экспертом по языковым моделям и искусственному интеллекту, о прогрессе языковых моделей, современном состоянии области искусственного интеллекта, проблеме исчерпания обучающих данных и вопросах копирайта.
Цифровая охота: «поймать» всех животных в тексте
Какие животные населяют научную фантастику? Где их больше: в ужасах или в детективах? А где они разнообразнее? Рассказываем об исследовании Кирилла Маслинского и смотрим на фауну в детской литературе.
Кратко: о чем статья?
Кирилл Маслинский, исследователь литературы, сотрудник Пушкинского дома и создатель Деткорпуса, изучает процесс создания контента. Он использует модель роста словаря, чтобы оценить разнообразие «животных» в разных жанрах детской литературы.
Само появление животных в тексте зависит от множества обстоятельств: например, в сказках типичные герои-помощники — это лесные обитатели, так исторически сложилось, это внутренний фактор; а в текстах Пришвина много птиц, потому что писатель был охотником, то есть тут сыграла роль социализация автора, фактор внешний.
Для исследования Кирилл Маслинский сделал выборку текстов от 100 до 300 000 слов из коллекции ДетКорпуса, относящихся к периоду 1900–2020 гг. Всего в такой словарь вошло 1906 упоминаний животных: птиц, рыб, грызунов и прочих. В ужасах, например, больше всего упоминались змеи, а в научной фантастике было много амфибий и морских обитателей.
Увидеть кто, где и как часто упоминается, можно на наших инфографиках с данными из исследования, а узнать больше об исследовании можно из полной версии материала.
Время чтения: 7 минут.
🤖 «Системный Блокъ» @sysblok
Какие животные населяют научную фантастику? Где их больше: в ужасах или в детективах? А где они разнообразнее? Рассказываем об исследовании Кирилла Маслинского и смотрим на фауну в детской литературе.
Кратко: о чем статья?
Кирилл Маслинский, исследователь литературы, сотрудник Пушкинского дома и создатель Деткорпуса, изучает процесс создания контента. Он использует модель роста словаря, чтобы оценить разнообразие «животных» в разных жанрах детской литературы.
Само появление животных в тексте зависит от множества обстоятельств: например, в сказках типичные герои-помощники — это лесные обитатели, так исторически сложилось, это внутренний фактор; а в текстах Пришвина много птиц, потому что писатель был охотником, то есть тут сыграла роль социализация автора, фактор внешний.
Для исследования Кирилл Маслинский сделал выборку текстов от 100 до 300 000 слов из коллекции ДетКорпуса, относящихся к периоду 1900–2020 гг. Всего в такой словарь вошло 1906 упоминаний животных: птиц, рыб, грызунов и прочих. В ужасах, например, больше всего упоминались змеи, а в научной фантастике было много амфибий и морских обитателей.
Увидеть кто, где и как часто упоминается, можно на наших инфографиках с данными из исследования, а узнать больше об исследовании можно из полной версии материала.
Время чтения: 7 минут.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Может ли робот прочитать папирус: как ИИ помогает восстанавливать утраченные тексты
Кажется, история из «Гостьи из будущего», где один из героев спасал рукописи из Александрийской библиотеки, стала реальностью. В начале 2024 года исследователям удалось прочитать сгоревший папирус из Геркуланума с помощью искусственного интеллекта.
Кратко: о чем статья?
Геркуланум, один из городов, погибший во время извержения Везувия в 79 году н. э., был открыт искателями сокровищ ещё в XVIII веке. В 1752 году рабочие наткнулись на постройку, которую позже назвали Виллой папирусов. В ней обнаружили 1800 сгоревших свертков, так что сегодня это собрание античных рукописей считается самым большим в мире.
Ученые предпринимали разные попытки прочитать уцелевшие части рукописей, размачивая и разворачивая папирусы, даже просвечивали их рентгеном, но эти методы не всегда давали желаемый результат и часто повреждали рукопись.
Наконец, в 2023 году команде из трех человек удалось прочитать четыре отрывка из свитка Геркуланума с помощью искусственного интеллекта, который отличил чернила от подложки. Благодаря этому открытию исследователи уточнили точное место захоронения Платона и узнали некоторые подробности его биографии, а ещё прочитали один из неизвестных ранее текстов древнегреческого философа Филодема.
Подробнее о том, какими методами ученые пользовались раньше и как с исследованием 2023 года связан Vesuvius Challenge, узнаете из полной версии статьи.
Время чтения: 10 минут.
🤖 «Системный Блокъ» @sysblok
Кажется, история из «Гостьи из будущего», где один из героев спасал рукописи из Александрийской библиотеки, стала реальностью. В начале 2024 года исследователям удалось прочитать сгоревший папирус из Геркуланума с помощью искусственного интеллекта.
Кратко: о чем статья?
Геркуланум, один из городов, погибший во время извержения Везувия в 79 году н. э., был открыт искателями сокровищ ещё в XVIII веке. В 1752 году рабочие наткнулись на постройку, которую позже назвали Виллой папирусов. В ней обнаружили 1800 сгоревших свертков, так что сегодня это собрание античных рукописей считается самым большим в мире.
Ученые предпринимали разные попытки прочитать уцелевшие части рукописей, размачивая и разворачивая папирусы, даже просвечивали их рентгеном, но эти методы не всегда давали желаемый результат и часто повреждали рукопись.
Наконец, в 2023 году команде из трех человек удалось прочитать четыре отрывка из свитка Геркуланума с помощью искусственного интеллекта, который отличил чернила от подложки. Благодаря этому открытию исследователи уточнили точное место захоронения Платона и узнали некоторые подробности его биографии, а ещё прочитали один из неизвестных ранее текстов древнегреческого философа Филодема.
Подробнее о том, какими методами ученые пользовались раньше и как с исследованием 2023 года связан Vesuvius Challenge, узнаете из полной версии статьи.
Время чтения: 10 минут.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Может ли робот прочитать папирус: как ИИ помогает восстанавливать утраченные тексты
Кажется, история из «Гостьи из будущего», где один из героев спасал рукописи из Александрийской библиотеки, стала реальностью. В начале 2024 года исследователям удалось прочитать сгоревший папирус из Геркуланума с помощью искусственного интеллекта.
Перфокарта: от ткацкого станка до аналитической машины
Помните ли вы времена, когда компьютеры работали на перфокартах? Листы плотной бумаги с дырочками — они использовались до того, как появились дискеты, компакт-диски и флешки. Начав свою историю с ткацких станков, перфокарты помогли создать первые базы данных и сыграли важную роль в создании вычислительных машин. Исследователь истории науки и техники, сотрудник Центра непрерывного образования факультета компьютерных наук НИУ ВШЭ Антон Басов изучает, как изобретение XVIII века заложило основу цифровой эпохи. Публикуем первую часть «биографии» перфокарт.
Кратко: о чем статья?
Перфорированная карта — носитель информации в виде листа из плотной бумаги (или другого материала), на котором данные записаны при помощи отверстий, пробитых в определённых местах. Хотя в современных компьютерах перфокарты уже не применяются, их по-прежнему используют в вязальных машинах.
История перфокарт вообще начинается именно с ткацкого дела: в 1725 году француз Базиль Боашон предложил использовать бесконечную бумажную ленту, в определённых местах которой были проколоты отверстия, для создания сложных многоцветных узоров. Правда, автоматическим такой станок стал только к началу XIX века благодаря другому французу – Жозефу Мари Жаккару.
Станок, действующий по принципу Жаккара, на Всемирной выставке увидел английский учёный Чарльз Бэббидж. Вдохновившись, Бэббидж придумал аналитическую машину, которую считают первой моделью программируемого компьютера.
Подробнее об этих страницах истории перфокарт узнаете из полной версии статьи, а о том, что было дальше, мы расскажем в следующих частях материала!
Время чтения: 9 минут.
🤖 «Системный Блокъ» @sysblok
Помните ли вы времена, когда компьютеры работали на перфокартах? Листы плотной бумаги с дырочками — они использовались до того, как появились дискеты, компакт-диски и флешки. Начав свою историю с ткацких станков, перфокарты помогли создать первые базы данных и сыграли важную роль в создании вычислительных машин. Исследователь истории науки и техники, сотрудник Центра непрерывного образования факультета компьютерных наук НИУ ВШЭ Антон Басов изучает, как изобретение XVIII века заложило основу цифровой эпохи. Публикуем первую часть «биографии» перфокарт.
Кратко: о чем статья?
Перфорированная карта — носитель информации в виде листа из плотной бумаги (или другого материала), на котором данные записаны при помощи отверстий, пробитых в определённых местах. Хотя в современных компьютерах перфокарты уже не применяются, их по-прежнему используют в вязальных машинах.
История перфокарт вообще начинается именно с ткацкого дела: в 1725 году француз Базиль Боашон предложил использовать бесконечную бумажную ленту, в определённых местах которой были проколоты отверстия, для создания сложных многоцветных узоров. Правда, автоматическим такой станок стал только к началу XIX века благодаря другому французу – Жозефу Мари Жаккару.
Станок, действующий по принципу Жаккара, на Всемирной выставке увидел английский учёный Чарльз Бэббидж. Вдохновившись, Бэббидж придумал аналитическую машину, которую считают первой моделью программируемого компьютера.
Подробнее об этих страницах истории перфокарт узнаете из полной версии статьи, а о том, что было дальше, мы расскажем в следующих частях материала!
Время чтения: 9 минут.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
История перфокарт от Жаккарда до аналитической машины
«Системный Блокъ» рассказывает, что такое перфокарты и как они оказались связаны с ткацкими станками.
Тексты, звуки, экспонаты: подборка интервью о цифровых коллекциях
Оцифровка и сохранение артефактов культуры — одна из важнейших задач цифровой гуманитаристики. Мы собрали для вас интервью четырёх исследователей и одного гражданского активиста о том, кто, зачем и для кого коллекционирует цифровые данные.
Литературоведение: репозиторий открытых данных Пушкинского Дома
Кирилл Маслинский — цифровой филолог, руководитель Лаборатории цифровых исследований литературы и фольклора в Пушкинском Доме (Института русской литературы РАН), создатель Детского корпуса и Репозитория открытых данных по русской литературе и фольклору. В интервью «Системному Блоку» он рассказывает, как Пушкинский дом начал публиковать литературные корпуса, кому и зачем они нужны, и какие исследования на основе открытых данных можно делать в литературоведении.
Культурология: цифровые коллекции музеев
Инна Кижнер — старший преподаватель кафедры информационных технологий в креативных и культурных индустриях, научный сотрудник лаборатории Digital Humanities Сибирского федерального университета. Читайте в её интервью, каким искажениям подвержены цифровые коллекции музеев, какие культурные явления можно исследовать благодаря оцифровке и как должна выглядеть идеальная цифровая коллекция.
Фольклористика: фонограммархив для науки
Светлана Подрезова ― кандидат искусствоведения, старшая научная сотрудница и заведующая Фонограммархивом Пушкинского Дома. «Системный Блокъ» поговорил с ней об истории одной из самых больших коллекций фольклорных этнографических записей, о её возрождении и сложностях оцифровки и о ценности её материалов для собирателей и учёных.
История: базы данных о репрессиях
Алексей Бабий — руководитель красноярского общества «Мемориал», а также один из первопроходцев Рунета. Последние три десятилетия он занимается сбором, каталогизацией и оцифровкой данных о жертвах репрессий в Красноярском крае. В интервью «Системному Блоку» он размышляет, что интернет может дать гражданским активистам, объясняет, как опыт работы на советских ЭВМ 70-х годов помогает ему обеспечивать сохранность информации о репрессиях и отвечает на вопрос, почему современным «облачным НКО» не страшны угрозы ликвидации.
Урбанистика: большие данные для больших городов
Кандидат географических наук, глава и соучредитель компании Habidatum Алексей Новиков рассказал «Системному Блоку», зачем собирать большие данные о городах и создавать их цифровые двойники, что такое пространственно-временное планирование и с какими этическими ограничениями сталкивается исследователь urban data.
🤖 «Системный Блокъ» @sysblok
Оцифровка и сохранение артефактов культуры — одна из важнейших задач цифровой гуманитаристики. Мы собрали для вас интервью четырёх исследователей и одного гражданского активиста о том, кто, зачем и для кого коллекционирует цифровые данные.
Литературоведение: репозиторий открытых данных Пушкинского Дома
Кирилл Маслинский — цифровой филолог, руководитель Лаборатории цифровых исследований литературы и фольклора в Пушкинском Доме (Института русской литературы РАН), создатель Детского корпуса и Репозитория открытых данных по русской литературе и фольклору. В интервью «Системному Блоку» он рассказывает, как Пушкинский дом начал публиковать литературные корпуса, кому и зачем они нужны, и какие исследования на основе открытых данных можно делать в литературоведении.
Культурология: цифровые коллекции музеев
Инна Кижнер — старший преподаватель кафедры информационных технологий в креативных и культурных индустриях, научный сотрудник лаборатории Digital Humanities Сибирского федерального университета. Читайте в её интервью, каким искажениям подвержены цифровые коллекции музеев, какие культурные явления можно исследовать благодаря оцифровке и как должна выглядеть идеальная цифровая коллекция.
Фольклористика: фонограммархив для науки
Светлана Подрезова ― кандидат искусствоведения, старшая научная сотрудница и заведующая Фонограммархивом Пушкинского Дома. «Системный Блокъ» поговорил с ней об истории одной из самых больших коллекций фольклорных этнографических записей, о её возрождении и сложностях оцифровки и о ценности её материалов для собирателей и учёных.
История: базы данных о репрессиях
Алексей Бабий — руководитель красноярского общества «Мемориал», а также один из первопроходцев Рунета. Последние три десятилетия он занимается сбором, каталогизацией и оцифровкой данных о жертвах репрессий в Красноярском крае. В интервью «Системному Блоку» он размышляет, что интернет может дать гражданским активистам, объясняет, как опыт работы на советских ЭВМ 70-х годов помогает ему обеспечивать сохранность информации о репрессиях и отвечает на вопрос, почему современным «облачным НКО» не страшны угрозы ликвидации.
Урбанистика: большие данные для больших городов
Кандидат географических наук, глава и соучредитель компании Habidatum Алексей Новиков рассказал «Системному Блоку», зачем собирать большие данные о городах и создавать их цифровые двойники, что такое пространственно-временное планирование и с какими этическими ограничениями сталкивается исследователь urban data.
Please open Telegram to view this post
VIEW IN TELEGRAM
Шахматы и компьютерные технологии сегодня
Как компьютеры меняют современные шахматы, зачем кодировать ходы, как с помощью электронного подхода повысить зрелищность игры и что такое премув? Разбираемся вместе с новым текстом в блоге Бориса Орехова.
🤖 Роботы vs. Человек
История шахмат и компьютерных технологий последние полвека шли параллельными курсами. Создание шахматных программ декларировалось как одна из основных задач искусственного интеллекта в 1972 году и в ее решении инженеры, несомненно, преуспели. Несколько десятилетий шахматные программы зрели и в 1990-х, наконец, дозрели до того, чтобы обыгрывать человека уровня чемпиона мира. Тогда же статус последнего рубежа человеческой самости, который не покорило компьютерное воинство, перешел к поэзии, а в шахматы человек роботу окончательно проиграл. Но шахматы на этом не закончились. Люди продолжают играть, а технологии взаимодействуют с шахматами и меняют их сразу в нескольких направлениях.
👩💻 Анализ партии
Сегодня компьютер – главный инструмент в разборе того, какие ходы были удачными, какие нет, и как следовало бы пойти на каждом этапе, чтобы получить выигрышную позицию. А во время шахматных партий результат компьютерного анализа показывает величину позиционного преимущества каждой из сторон, поскольку не для каждого зрителя это может быть очевидно.
🧑🏻💻 Читинг
Читинг – игра с использованием компьютерных подсказок. В современных шахматах такие подсказки, конечно, строго запрещены, потому что они превращают соревнование силы человеческого духа в банальное подсматривание. Но некоторые все же пытаются этот запрет обходить. Осенью 2022 года разгорелся скандал между сильнейшим шахматистом мира Магнусом Карлсеном и в тот момент еще никому неизвестным американцем Хансом Моке Ниманном. Карлсен проиграл и активно намекал, что Ниманн играл нечестно. Илон Маск, кстати, предположил, что Ниманн мог бы получать подсказки от сообщника, который передавал их с помощью находящейся в теле шахматиста дистанционно управляемой секс-игрушки(что? да! читайте полную версию текста…)
👨🏽💻 Онлайн-игра
В шахматы всё чаще играют онлайн. Это меняет многое: от психологического состояния игроков до возможностей, которые есть в виртуальной игре. Например, можно сделать премув – запланировать ход, пока соперник думает над своим. Когда он его сделает, премув мгновенно выполнится, и игрок, сделавший его, не потратит время. В онлайн-шахматах появляются новые стратегии и разгораются новые скандалы.
Подробнее о них и о том, чем закончился матч легенды онлайн-шахмат с 14-м чемпионом мира по шахматам Владимиром Крамником, узнаете из поста Бориса Орехова.
🤖 «Системный Блокъ» @sysblok
Как компьютеры меняют современные шахматы, зачем кодировать ходы, как с помощью электронного подхода повысить зрелищность игры и что такое премув? Разбираемся вместе с новым текстом в блоге Бориса Орехова.
🤖 Роботы vs. Человек
История шахмат и компьютерных технологий последние полвека шли параллельными курсами. Создание шахматных программ декларировалось как одна из основных задач искусственного интеллекта в 1972 году и в ее решении инженеры, несомненно, преуспели. Несколько десятилетий шахматные программы зрели и в 1990-х, наконец, дозрели до того, чтобы обыгрывать человека уровня чемпиона мира. Тогда же статус последнего рубежа человеческой самости, который не покорило компьютерное воинство, перешел к поэзии, а в шахматы человек роботу окончательно проиграл. Но шахматы на этом не закончились. Люди продолжают играть, а технологии взаимодействуют с шахматами и меняют их сразу в нескольких направлениях.
👩💻 Анализ партии
Сегодня компьютер – главный инструмент в разборе того, какие ходы были удачными, какие нет, и как следовало бы пойти на каждом этапе, чтобы получить выигрышную позицию. А во время шахматных партий результат компьютерного анализа показывает величину позиционного преимущества каждой из сторон, поскольку не для каждого зрителя это может быть очевидно.
🧑🏻💻 Читинг
Читинг – игра с использованием компьютерных подсказок. В современных шахматах такие подсказки, конечно, строго запрещены, потому что они превращают соревнование силы человеческого духа в банальное подсматривание. Но некоторые все же пытаются этот запрет обходить. Осенью 2022 года разгорелся скандал между сильнейшим шахматистом мира Магнусом Карлсеном и в тот момент еще никому неизвестным американцем Хансом Моке Ниманном. Карлсен проиграл и активно намекал, что Ниманн играл нечестно. Илон Маск, кстати, предположил, что Ниманн мог бы получать подсказки от сообщника, который передавал их с помощью находящейся в теле шахматиста дистанционно управляемой секс-игрушки
👨🏽💻 Онлайн-игра
В шахматы всё чаще играют онлайн. Это меняет многое: от психологического состояния игроков до возможностей, которые есть в виртуальной игре. Например, можно сделать премув – запланировать ход, пока соперник думает над своим. Когда он его сделает, премув мгновенно выполнится, и игрок, сделавший его, не потратит время. В онлайн-шахматах появляются новые стратегии и разгораются новые скандалы.
Подробнее о них и о том, чем закончился матч легенды онлайн-шахмат с 14-м чемпионом мира по шахматам Владимиром Крамником, узнаете из поста Бориса Орехова.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Шахматы и компьютерные технологии сегодня - Системный Блокъ
Как компьютеры меняют современные шахматы, зачем кодировать ходы, как с помощью электронного подхода повысить зрелищность игры и что такое премув?
Чему учат в цифровой школе? Альтернативное расписание уроков к 1 сентября от «Системного Блока»
Как бы выглядела школа «Системного Блока» и чему бы в ней учили? К началу учебного года мы составили альтернативное расписание и подобрали материалы.
🤓 Техноистория
Первый урок — техноистория. Поговорим о том, как цифровые технологии влияют на жизнь общества и что об этом думают сами люди.
Знаете ли вы, что в Советском Союзе пытались создать свой интернет? Точнее, автоматизированную систему сбора информации со всех предприятий СССР. Почему амбициозный проект не стал реальностью, читайте в нашем посте.
Задумывались ли вы о том, что исторические компьютерные игры не просто погружают в прошлое, но и формируют картину мира в настоящем? Рассказываем, есть ли познавательная ценность в исторических видеоиграх.
А может, обсудим, заменят ли умные роботы людей в работе и повседневной жизни? Такие опасения существуют давно — и они отразились в кинематографе. Читайте — и перейдем к следующему занятию.
😎 Компьютерная лингвистика
Можно учить правила русского или английского языка, а можно изучать язык как систему — этим занимается лингвистика. С развитием компьютерных технологий лингвисты получили новые инструменты для исследований. Так, в середине XX века наука о языке сближается с математикой и информатикой — и зарождается компьютерная лингвистика. С ней вы встречались, например, когда пользовались автоматическим переводом текста с другого языка.
Но можно ли компьютерную лингвистику применять в других областях жизни, например, в медицине? Да! В статье “Компьютерная лингвистика в медицине: от справок до COVID” вы найдете примеры того, как NLP (обработка естественного языка) помогала бороться с коронавирусом и упрощала взаимодействие людей.
А если вам интересно узнать, как компьютеры понимают, насколько просто написан текст, рекомендуем познакомиться с материалом о том, как алгоритмы оценивают сложность текста. Там же вы узнаете, чем эти данные полезны маркетологам, чиновникам и методистам.
🤩 Нейросетевое творчество
Уроки ИЗО и МХК мы тоже адаптировали. Например, проверили, насколько хорошо (или плохо) у искусственного интеллекта получается писать художественные тексты и рассказали об этом здесь.
А если вы пока не готовы сотрудничать с ИИ, пройдите наши тесты и попробуйте отличить художника от нейросети, а живого поэта от электронного.
Ещё больше «уроков» — по биоинформатике и цифровому музыковедению — найдёте в расширенной подборке.
🤖 «Системный Блокъ» @sysblok
Как бы выглядела школа «Системного Блока» и чему бы в ней учили? К началу учебного года мы составили альтернативное расписание и подобрали материалы.
🤓 Техноистория
Первый урок — техноистория. Поговорим о том, как цифровые технологии влияют на жизнь общества и что об этом думают сами люди.
Знаете ли вы, что в Советском Союзе пытались создать свой интернет? Точнее, автоматизированную систему сбора информации со всех предприятий СССР. Почему амбициозный проект не стал реальностью, читайте в нашем посте.
Задумывались ли вы о том, что исторические компьютерные игры не просто погружают в прошлое, но и формируют картину мира в настоящем? Рассказываем, есть ли познавательная ценность в исторических видеоиграх.
А может, обсудим, заменят ли умные роботы людей в работе и повседневной жизни? Такие опасения существуют давно — и они отразились в кинематографе. Читайте — и перейдем к следующему занятию.
😎 Компьютерная лингвистика
Можно учить правила русского или английского языка, а можно изучать язык как систему — этим занимается лингвистика. С развитием компьютерных технологий лингвисты получили новые инструменты для исследований. Так, в середине XX века наука о языке сближается с математикой и информатикой — и зарождается компьютерная лингвистика. С ней вы встречались, например, когда пользовались автоматическим переводом текста с другого языка.
Но можно ли компьютерную лингвистику применять в других областях жизни, например, в медицине? Да! В статье “Компьютерная лингвистика в медицине: от справок до COVID” вы найдете примеры того, как NLP (обработка естественного языка) помогала бороться с коронавирусом и упрощала взаимодействие людей.
А если вам интересно узнать, как компьютеры понимают, насколько просто написан текст, рекомендуем познакомиться с материалом о том, как алгоритмы оценивают сложность текста. Там же вы узнаете, чем эти данные полезны маркетологам, чиновникам и методистам.
🤩 Нейросетевое творчество
Уроки ИЗО и МХК мы тоже адаптировали. Например, проверили, насколько хорошо (или плохо) у искусственного интеллекта получается писать художественные тексты и рассказали об этом здесь.
А если вы пока не готовы сотрудничать с ИИ, пройдите наши тесты и попробуйте отличить художника от нейросети, а живого поэта от электронного.
Ещё больше «уроков» — по биоинформатике и цифровому музыковедению — найдёте в расширенной подборке.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Чему учат в цифровой школе? Альтернативное расписание уроков к 1 сентября от «Системного Блока» - Системный Блокъ
Как бы выглядела школа «Системного Блока» и чему бы в ней учили? К началу учебного года мы составили альтернативное расписание и подобрали материалы.
Как биоинформатика и палеогенетика помогают в археологии
Долгое время антропологи и археологи для датировки находок анализировали надписи, глиняные отложения, химический состав или остаточную радиоактивность. Теперь методы молекулярной биологии позволяют проводить генетический анализ древней ДНК и уже по нему воссоздавать историю наших предков. Андрей Макашов, преподаватель специалитета в Высшей школе биомедицинских систем и технологий петербургского Политеха @polytech_petra, рассказывает, как благодаря палеогенетикам и биоинформатикам мы узнаем, как смешивались предки современного человека и неандертальцы, куда мигрировали древние люди и откуда распространялись эпидемии.
Кратко: о чем статья?
Палеогенетика изучает древнюю ДНК, содержащуюся в биологических останках. Основоположник палеогенетики — обладатель нобелевской премии Сванте Паабо, а первое исследование ДНК из останков существ провели в 1984 году. Оно было посвящено вымершей в 1883 году квагге.
Палеогенетики выделяют генетический материал из зубов, костей и волосяных фолликул. ДНК лучше всего сохраняется при низкой влажности и минимальных температурах, поэтому в России благодаря климату обнаруживают большое количество палеоматериала, пригодного для генетических исследований. Полученные фрагменты ДНК секвенируют, то есть определяют первичную последовательность цепочек ДНК. На этом этапе вступают биоинформатики, использующие специальные программы для обработки расшифрованного палеоматериала.
С помощью древней ДНК можно изучать эволюционные связи организмов, происхождение инфекционных болезней, анализировать миграции населения и генетические адаптации к культурным населениям. Например, один из главных результатов работы палеогенетиков — история родства неандертальцев, денисовцев и современного человека. А еще они помогают установить, откуда в Европу средних веков пришла чума и что за загадочная инфекция выкосила ацтеков после приезда европейских колонизаторов.
Более подробно о совместной работе археологов, палеогенетиков и биоинформатиков, а также о том, как древняя ДНК помогла исследовать генофонд Европы и методы лечения проказы, читайте в полной версии статьи.
Время чтения: 15,5 минут.
🤖 «Системный Блокъ» @sysblok
Долгое время антропологи и археологи для датировки находок анализировали надписи, глиняные отложения, химический состав или остаточную радиоактивность. Теперь методы молекулярной биологии позволяют проводить генетический анализ древней ДНК и уже по нему воссоздавать историю наших предков. Андрей Макашов, преподаватель специалитета в Высшей школе биомедицинских систем и технологий петербургского Политеха @polytech_petra, рассказывает, как благодаря палеогенетикам и биоинформатикам мы узнаем, как смешивались предки современного человека и неандертальцы, куда мигрировали древние люди и откуда распространялись эпидемии.
Кратко: о чем статья?
Палеогенетика изучает древнюю ДНК, содержащуюся в биологических останках. Основоположник палеогенетики — обладатель нобелевской премии Сванте Паабо, а первое исследование ДНК из останков существ провели в 1984 году. Оно было посвящено вымершей в 1883 году квагге.
Палеогенетики выделяют генетический материал из зубов, костей и волосяных фолликул. ДНК лучше всего сохраняется при низкой влажности и минимальных температурах, поэтому в России благодаря климату обнаруживают большое количество палеоматериала, пригодного для генетических исследований. Полученные фрагменты ДНК секвенируют, то есть определяют первичную последовательность цепочек ДНК. На этом этапе вступают биоинформатики, использующие специальные программы для обработки расшифрованного палеоматериала.
С помощью древней ДНК можно изучать эволюционные связи организмов, происхождение инфекционных болезней, анализировать миграции населения и генетические адаптации к культурным населениям. Например, один из главных результатов работы палеогенетиков — история родства неандертальцев, денисовцев и современного человека. А еще они помогают установить, откуда в Европу средних веков пришла чума и что за загадочная инфекция выкосила ацтеков после приезда европейских колонизаторов.
Более подробно о совместной работе археологов, палеогенетиков и биоинформатиков, а также о том, как древняя ДНК помогла исследовать генофонд Европы и методы лечения проказы, читайте в полной версии статьи.
Время чтения: 15,5 минут.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Тайны древней ДНК: как палеогенетика и биоинформатика помогают археологам - Системный Блокъ
Можно ли узнать, чем болели люди в каменном веке, изучив остатки ДНК из их зубов? Да, если на помощь придут палеогенетика в связке с биоинформатикой. Палеогенетика изучает древнюю ДНК, чтобы понять, куда и откуда мигрировали древние люди, какие возбудители…
Перфокарта: от механических баз данных к цифровым
«Системный Блокъ» рассказывает, как перфокарты привели к созданию компьютера. В первой части материала о перфокартах мы уже проследили их историю от ткацкого станка до аналитической машины.
Кратко: о чем статья?
Совершенно новый способ использования перфокарт — для «сравнения идей» — предложил С. Н. Корсаков. Начавший карьеру в 1805 году, он занимался статистикой в самых разных учреждениях Российской Империи. Главное изобретение своей жизни Корсаков придумал, увлекшись гомеопатией. Его прибор состоял из таблицы с отверстиями на пересечении симптомов (строк) и болезней (столбцов), бруска и воткнутых в него игл. С помощью прибора Корсаков хотел производить поиск по массивам данных, используя разные логические операторы. Хотя идея была прорывной для своего времени, воплотить ее в жизнь не получилось, а Корсаков к проекту больше не возвращался.
Далее история переносится в Соединенные Штаты. В обработке результатов переписи населения США в 1880-м году участвовал выпускник Колумбийского горного училища Герман Холлерит. Именно он придумал табулятор (автоматическую счетную машину), механизирующий и ускоряющий работу клерков, а также основал компанию, позже названную IBM (International Business Machines). Уникальной новацией Холлерита было применение одной перфокарты для записи одной единицы информации. Это позволяло сортировать перфокарты по признакам и находить закономерности в данных.
К концу 30-х годов XX-го века машины-табуляторы усовершенствовались: они научились производить арифметические операции, подсчитывать промежуточные и итоговые результаты, печатать буквы. В это время ученые начинают разрабатывать вычислительную машину, которая могла бы работать по заранее заданной программе. Для ввода и вывода информации инженеры использовали уже ставший стандартным метод записи информации в машиночитаемом виде — перфокарты. Они оставались главным средством ввода информации в компьютер до 1970-х годов, когда распространились терминалы с дисплеями.
Почему изобретение Корсаково так и не было реализовано? Как именно работало устройство Холлерита? Каково наследие перфокарт в современном компьютере? Обо всем этом читайте в полной версии статьи.
Время чтения: 14 минут.
🤖 «Системный Блокъ» @sysblok
«Системный Блокъ» рассказывает, как перфокарты привели к созданию компьютера. В первой части материала о перфокартах мы уже проследили их историю от ткацкого станка до аналитической машины.
Кратко: о чем статья?
Совершенно новый способ использования перфокарт — для «сравнения идей» — предложил С. Н. Корсаков. Начавший карьеру в 1805 году, он занимался статистикой в самых разных учреждениях Российской Империи. Главное изобретение своей жизни Корсаков придумал, увлекшись гомеопатией. Его прибор состоял из таблицы с отверстиями на пересечении симптомов (строк) и болезней (столбцов), бруска и воткнутых в него игл. С помощью прибора Корсаков хотел производить поиск по массивам данных, используя разные логические операторы. Хотя идея была прорывной для своего времени, воплотить ее в жизнь не получилось, а Корсаков к проекту больше не возвращался.
Далее история переносится в Соединенные Штаты. В обработке результатов переписи населения США в 1880-м году участвовал выпускник Колумбийского горного училища Герман Холлерит. Именно он придумал табулятор (автоматическую счетную машину), механизирующий и ускоряющий работу клерков, а также основал компанию, позже названную IBM (International Business Machines). Уникальной новацией Холлерита было применение одной перфокарты для записи одной единицы информации. Это позволяло сортировать перфокарты по признакам и находить закономерности в данных.
К концу 30-х годов XX-го века машины-табуляторы усовершенствовались: они научились производить арифметические операции, подсчитывать промежуточные и итоговые результаты, печатать буквы. В это время ученые начинают разрабатывать вычислительную машину, которая могла бы работать по заранее заданной программе. Для ввода и вывода информации инженеры использовали уже ставший стандартным метод записи информации в машиночитаемом виде — перфокарты. Они оставались главным средством ввода информации в компьютер до 1970-х годов, когда распространились терминалы с дисплеями.
Почему изобретение Корсаково так и не было реализовано? Как именно работало устройство Холлерита? Каково наследие перфокарт в современном компьютере? Обо всем этом читайте в полной версии статьи.
Время чтения: 14 минут.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Перфокарта: от механических баз данных к цифровым - Системный Блокъ
В первой части рассказа о перфокартах мы узнали о том, как причудливо прошла история перфокарт от древнего ремесла ткачества до аналитических машин. Во второй части «Системный Блокъ» изучает, что же произошло дальше. А произошло немало: перфокарты через гомеопатию…
Цифровые издания: как подстроиться под читателя
У электронного издания в отличие от бумажного есть возможность предложить читателю не единый для всех порядок и состав текстов, а персонализированный набор произведений. Борис Орехов рассказывает подробнее о том, как подстроить сборники стихотворений под людей с разными предпочтениями.
Зачем нужно кастомизированное издание?
Можно любить только последнюю лирику Лермонтова или только сложную поэзию Вознесенского, но классические издания не всегда позволяют купить и читать только любимые стихи. В магистратуре Цифровые методы в гуманитарных науках в НИУ ВШЭ организовали учебный проект, где попытались выработать принципы составления такого издания, которое предлагает читателю то, к чему тот расположен.
Например, в творчестве Вознесенского есть множество текстов с правильным метром и точной рифмой, типичными лирическими сюжетами. Но есть и другие стихи, в которых встретятся и акцентный стих, и каламбурная рифма. Настроения в текстах середины и конца XX века тоже могут очень сильно различаться. Что хотел бы видеть читатель? Может быть, и то и другое. А может быть, что-то одно.
Как подстроить сборник под читателя?
Способ, которым произведения отбираются для читателя в рамках проекта магистрантов, называется «сценарий». Чтобы реализовать сценарий, нужно разбить все тексты на классы по какому-то параметру, а потом показывать читателю тексты только из одного такого класса. Для начала можно установить, классический (регулярный) стих перед нами или неклассический. Так можно отделить стихи с менее очевидной формой (вроде лесенки Маяковского) от классический силлаботоники, как в «Ты меня на рассвете разбудишь…»
Ещё один полезный цифровой инструмент — тематическое моделирование. С его помощью можно собрать вместе стихи поэта, например, на «женскую» тему. Наконец, можно даже посчитать, насколько сложно текст воспринимается, его «удобочитаемость».
О плюсах и минусах такого отбора, о том, как работают описанные методы, и о том, почему в качестве примера Борис Орехов выбрал именно Вознесенского, узнаете из полной версии текста.
🤖 «Системный Блокъ» @sysblok
У электронного издания в отличие от бумажного есть возможность предложить читателю не единый для всех порядок и состав текстов, а персонализированный набор произведений. Борис Орехов рассказывает подробнее о том, как подстроить сборники стихотворений под людей с разными предпочтениями.
Зачем нужно кастомизированное издание?
Можно любить только последнюю лирику Лермонтова или только сложную поэзию Вознесенского, но классические издания не всегда позволяют купить и читать только любимые стихи. В магистратуре Цифровые методы в гуманитарных науках в НИУ ВШЭ организовали учебный проект, где попытались выработать принципы составления такого издания, которое предлагает читателю то, к чему тот расположен.
Например, в творчестве Вознесенского есть множество текстов с правильным метром и точной рифмой, типичными лирическими сюжетами. Но есть и другие стихи, в которых встретятся и акцентный стих, и каламбурная рифма. Настроения в текстах середины и конца XX века тоже могут очень сильно различаться. Что хотел бы видеть читатель? Может быть, и то и другое. А может быть, что-то одно.
Как подстроить сборник под читателя?
Способ, которым произведения отбираются для читателя в рамках проекта магистрантов, называется «сценарий». Чтобы реализовать сценарий, нужно разбить все тексты на классы по какому-то параметру, а потом показывать читателю тексты только из одного такого класса. Для начала можно установить, классический (регулярный) стих перед нами или неклассический. Так можно отделить стихи с менее очевидной формой (вроде лесенки Маяковского) от классический силлаботоники, как в «Ты меня на рассвете разбудишь…»
Ещё один полезный цифровой инструмент — тематическое моделирование. С его помощью можно собрать вместе стихи поэта, например, на «женскую» тему. Наконец, можно даже посчитать, насколько сложно текст воспринимается, его «удобочитаемость».
О плюсах и минусах такого отбора, о том, как работают описанные методы, и о том, почему в качестве примера Борис Орехов выбрал именно Вознесенского, узнаете из полной версии текста.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Про цифровые издания - Системный Блокъ
О том, какие возможности предоставляет электронная форма издания поэзии, если смотреть на это не глазами традиционного филолога, а глазами читателя и цифрового гуманитария.
Кибербуллинг в школе
Первая неделя учебы подходит к концу, но школа и университет – это не только радость новых знакомств и знаний. Для многих обучение сопряжено с трудностями и сложностями в коллективе. Например, с буллингом, который в современном мире выходит за пределы классов и аудиторий в онлайн.
С проблемой кибербуллинга сталкиваются школьники по всему миру. Однако оценить её масштаб бывает сложно из-за отсутствия статистики. Сегодня мы хотим рассказать вам о том, как эту тему изучают в Японии, и узнать о вашем опыте столкновения с травлей в интернете.
🇯🇵 В Японии
Министерство культуры Японии ежегодно публикует отчёты о случаях издевательств над учениками. В них фиксируется количество случаев буллинга во всех школах. Согласно отчётам, в 2016 году было зафиксировано 10 779 случаев кибертравли среди школьников, а к 2022 году их количество выросло до 23 920.
Главным следствием издевательств в школах является отказ ребенка посещать уроки, но в самых тяжелых случаях последствием травли может стать самоубийство. В Японии резкий скачок суицидов из-за школьного буллинга пришёлся на 2018 год и с тех пор их уровень оставался высоким. В 2020 году отметка перешагнула порог в 400 самоубийств.
🇷🇺 В России
В России такой же показательной статистики нет, но согласно исследованию Microsoft уже в 2012 году с кибербуллингом сталкивались 49% детей, а к 2019 году этот процент мог вырасти до 70%. От общего числа людей, сталкивающихся с кибербуллингом, подростки составляют 56%. Больше об этой статистике мы рассказывали в посте, а из полной версии статьи можно узнать о том, как можно защититься от кибербуллинга.
В опросе ниже мы предлагаем вам поделиться своим опытом столкновения с жертвами и агрессорами онлайн-буллинга. Подробнее о нём можно рассказать в комментариях.
🤖 «Системный Блокъ» @sysblok
Первая неделя учебы подходит к концу, но школа и университет – это не только радость новых знакомств и знаний. Для многих обучение сопряжено с трудностями и сложностями в коллективе. Например, с буллингом, который в современном мире выходит за пределы классов и аудиторий в онлайн.
С проблемой кибербуллинга сталкиваются школьники по всему миру. Однако оценить её масштаб бывает сложно из-за отсутствия статистики. Сегодня мы хотим рассказать вам о том, как эту тему изучают в Японии, и узнать о вашем опыте столкновения с травлей в интернете.
🇯🇵 В Японии
Министерство культуры Японии ежегодно публикует отчёты о случаях издевательств над учениками. В них фиксируется количество случаев буллинга во всех школах. Согласно отчётам, в 2016 году было зафиксировано 10 779 случаев кибертравли среди школьников, а к 2022 году их количество выросло до 23 920.
Главным следствием издевательств в школах является отказ ребенка посещать уроки, но в самых тяжелых случаях последствием травли может стать самоубийство. В Японии резкий скачок суицидов из-за школьного буллинга пришёлся на 2018 год и с тех пор их уровень оставался высоким. В 2020 году отметка перешагнула порог в 400 самоубийств.
🇷🇺 В России
В России такой же показательной статистики нет, но согласно исследованию Microsoft уже в 2012 году с кибербуллингом сталкивались 49% детей, а к 2019 году этот процент мог вырасти до 70%. От общего числа людей, сталкивающихся с кибербуллингом, подростки составляют 56%. Больше об этой статистике мы рассказывали в посте, а из полной версии статьи можно узнать о том, как можно защититься от кибербуллинга.
В опросе ниже мы предлагаем вам поделиться своим опытом столкновения с жертвами и агрессорами онлайн-буллинга. Подробнее о нём можно рассказать в комментариях.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Кибербуллинг в японских школах: что говорят данные о проблеме травли в Японии?
«Системный Блокъ» рассказывает, как министерство культуры Японии фиксирует случаи и последствия кибербуллинга в школах.
С Днем рождения, Лев Толстой!
Сегодня день рождения Льва Николаевича Толстого — важнейшего русского писателя, мыслителя и пацифиста. А в последние годы Толстой стал ещё и одним из главных лиц «цифровой трансформации» русской культуры. Вспоминаем, где искать наследие Толстого онлайн.
Электронный ресурс «Слово Толстого»
«Слово Толстого» открывает читателю доступ к 90-томному собранию сочинений Льва Толстого — самому полному изданию текстов писателя, которое создавалось в течение трех десятилетий с 1928 по 1958 годы. Более 15000 файлов с текстами писателя были размечены в TEI формате. Этот специализированный язык разметки позволяет хранить не только сам текст, но и множество метаданных о нем. Поэтому «Слово Толстого» — не просто поисковая система, но особенное концептуальное пространство.
Портал tolstoy.ru
Портал tolstoy.ru — самый крупный ресурс о творчестве и деятельности писателя. Сайт состоит из описания работ и биографии Толстого и его окружения. Там же можно найти фотографии писателя с близкими, рубрику «День в истории» и информацию о тематических музеях и событиях.
Проект «Весь Толстой в один клик»
«Весь Толстой в один клик» были первопроходцами в переводе писателя в электронный формат. В 2013 году проект запустила компания ABBYY совместно с Государственным музеем Л. Н. Толстого и тремя тысячами волонтеров. Задача заключалась в оцифровке и распознавании текста в полном собрании сочинений Толстого. Теперь произведения Толстого можно найти в формате PDF с текстовым слоем, а также в .fb2, .mobi и html и ePub.
Поисковик «Толстой Digital»
«Толстой Digital» — это семантическое издание, в котором тексты писателя дополняются метаданными. Для писем это дата, время написания и адресат. Благодаря поисковику можно, например, найти все письма Толстого Фету за определенный период времени.
Подробнее об этих и других проектах о Толстом узнаете из нашей статьи.
😎 «Системный Блокъ» @sysblok
Сегодня день рождения Льва Николаевича Толстого — важнейшего русского писателя, мыслителя и пацифиста. А в последние годы Толстой стал ещё и одним из главных лиц «цифровой трансформации» русской культуры. Вспоминаем, где искать наследие Толстого онлайн.
Электронный ресурс «Слово Толстого»
«Слово Толстого» открывает читателю доступ к 90-томному собранию сочинений Льва Толстого — самому полному изданию текстов писателя, которое создавалось в течение трех десятилетий с 1928 по 1958 годы. Более 15000 файлов с текстами писателя были размечены в TEI формате. Этот специализированный язык разметки позволяет хранить не только сам текст, но и множество метаданных о нем. Поэтому «Слово Толстого» — не просто поисковая система, но особенное концептуальное пространство.
Портал tolstoy.ru
Портал tolstoy.ru — самый крупный ресурс о творчестве и деятельности писателя. Сайт состоит из описания работ и биографии Толстого и его окружения. Там же можно найти фотографии писателя с близкими, рубрику «День в истории» и информацию о тематических музеях и событиях.
Проект «Весь Толстой в один клик»
«Весь Толстой в один клик» были первопроходцами в переводе писателя в электронный формат. В 2013 году проект запустила компания ABBYY совместно с Государственным музеем Л. Н. Толстого и тремя тысячами волонтеров. Задача заключалась в оцифровке и распознавании текста в полном собрании сочинений Толстого. Теперь произведения Толстого можно найти в формате PDF с текстовым слоем, а также в .fb2, .mobi и html и ePub.
Поисковик «Толстой Digital»
«Толстой Digital» — это семантическое издание, в котором тексты писателя дополняются метаданными. Для писем это дата, время написания и адресат. Благодаря поисковику можно, например, найти все письма Толстого Фету за определенный период времени.
Подробнее об этих и других проектах о Толстом узнаете из нашей статьи.
Please open Telegram to view this post
VIEW IN TELEGRAM