На последнем дыхании: туберкулез в России в цифрах и фактах
Цифровые методы помогают «Системному Блоку» изучать не только гуманитарные науки, но и социально значимые проблемы. Одна из них – заболеваемость туберкулезом. Самая литературная болезнь по-прежнему распространена в России. Рассказываем о её причинах и о том, почему пациенты с туберкулезом до сих пор остаются стигматизированными.
Кратко: о чем статья?
Согласно данным Росстата, с 2010 по 2022 год заболеваемость туберкулёзом снизилась в разных возрастных группах и разных регионах России. Но есть и менее приятные новости: главный способ профилактики заболевания – вакцина, а в последнее время количество невакцинированных детей увеличивается, о чём прямо говорится в отчётах институтов Минздрава.
При этом риску заражения и развития туберкулёза подвержены прежде всего люди, живущие в неблагополучных социально-экономических условиях: с ограниченным доступом к качественному питанию, жилью и медицинской помощи. Главные факторы, влияющие на статистику болезни в разных регионах, мы собрали в инфографике.
Как рассказала «Системному Блоку» Ирина Васильева, главный фтизиатр Минздрава России, заболевание не только сопровождается тяжелыми симптомами, но и негативно отражается и на отношениях пациента с социумом. Поскольку «специфика туберкулеза и его лечения заключается в длительном отрыве от семьи и привычной профессиональной деятельности», пациенты становятся несдержанными, склонными к конфликтам, либо заторможенными, чрезвычайно ранимыми, робкими и застенчивыми.
Узнать больше о статистике, связанной с заболеванием, и о том, как уберечь себя и своих близких от заражения можно из полной версии статьи.
Время чтения: 15,5 минут.
🤖 «Системный Блокъ» @sysblok
Цифровые методы помогают «Системному Блоку» изучать не только гуманитарные науки, но и социально значимые проблемы. Одна из них – заболеваемость туберкулезом. Самая литературная болезнь по-прежнему распространена в России. Рассказываем о её причинах и о том, почему пациенты с туберкулезом до сих пор остаются стигматизированными.
Кратко: о чем статья?
Согласно данным Росстата, с 2010 по 2022 год заболеваемость туберкулёзом снизилась в разных возрастных группах и разных регионах России. Но есть и менее приятные новости: главный способ профилактики заболевания – вакцина, а в последнее время количество невакцинированных детей увеличивается, о чём прямо говорится в отчётах институтов Минздрава.
При этом риску заражения и развития туберкулёза подвержены прежде всего люди, живущие в неблагополучных социально-экономических условиях: с ограниченным доступом к качественному питанию, жилью и медицинской помощи. Главные факторы, влияющие на статистику болезни в разных регионах, мы собрали в инфографике.
Как рассказала «Системному Блоку» Ирина Васильева, главный фтизиатр Минздрава России, заболевание не только сопровождается тяжелыми симптомами, но и негативно отражается и на отношениях пациента с социумом. Поскольку «специфика туберкулеза и его лечения заключается в длительном отрыве от семьи и привычной профессиональной деятельности», пациенты становятся несдержанными, склонными к конфликтам, либо заторможенными, чрезвычайно ранимыми, робкими и застенчивыми.
Узнать больше о статистике, связанной с заболеванием, и о том, как уберечь себя и своих близких от заражения можно из полной версии статьи.
Время чтения: 15,5 минут.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Эволюция литературы: может ли Дарвин объяснить Конан Дойла и футуризм
Сегодня 165 лет Артуру Конан Дойлу — автору детективов про Шерлока Холмса и одному из создателей жанра. Помимо прочего, детективы Конан Дойля интересны тем, что они стали невероятно успешными на фоне огромного числа конкурентов, тоже писавших детективные истории. О поиске причин этого успеха формальными методами, вдохновлёнными биологией, читайте в нашей статье.
Кратко: о чем статья?
Филологи чаще всего обращаются к одному из двух эволюционных подходов для описания процессов, происходящих в истории литературы:
подход русских формалистов и дарвинистский подход социолога литературы Франко Моретти.
Формалисты предлагали смотреть на литературу как на поле со своими «центром» и «периферией», где то, что еще вчера казалось читателю маргинальным, сегодня смещает то, что было доминирующим в литературном процессе. Моретти же сравнивал процесс эволюции литературы с бойней, где мясниками оказываются «сами читатели, которые читают роман» и так поддерживают его жизнь в следующих поколениях.
В такой «бойне» выжили и рассказы о Шерлоке Холмсе. От детективов, которые читатели благополучно забыли, их отличало наличие улик, на основании которых читатели смогли самостоятельно прийти к разгадке. Правда, от одного дарвиновского принципа natura non facit saltus. (лат. — «природа не делает скачков») Моретти отказался и заявил, что литература, напротив, меняется только через скачки. «Скачок — Конан Дойл. Еще прыжок — Кристи».
Подробнее об этих скачках и экспериментах, на которых основывается Моретти, узнаете из полного текста статьи.
Время чтения: 11 минут.
🤖 «Системный Блокъ» @sysblok
Сегодня 165 лет Артуру Конан Дойлу — автору детективов про Шерлока Холмса и одному из создателей жанра. Помимо прочего, детективы Конан Дойля интересны тем, что они стали невероятно успешными на фоне огромного числа конкурентов, тоже писавших детективные истории. О поиске причин этого успеха формальными методами, вдохновлёнными биологией, читайте в нашей статье.
Кратко: о чем статья?
Филологи чаще всего обращаются к одному из двух эволюционных подходов для описания процессов, происходящих в истории литературы:
подход русских формалистов и дарвинистский подход социолога литературы Франко Моретти.
Формалисты предлагали смотреть на литературу как на поле со своими «центром» и «периферией», где то, что еще вчера казалось читателю маргинальным, сегодня смещает то, что было доминирующим в литературном процессе. Моретти же сравнивал процесс эволюции литературы с бойней, где мясниками оказываются «сами читатели, которые читают роман» и так поддерживают его жизнь в следующих поколениях.
В такой «бойне» выжили и рассказы о Шерлоке Холмсе. От детективов, которые читатели благополучно забыли, их отличало наличие улик, на основании которых читатели смогли самостоятельно прийти к разгадке. Правда, от одного дарвиновского принципа natura non facit saltus. (лат. — «природа не делает скачков») Моретти отказался и заявил, что литература, напротив, меняется только через скачки. «Скачок — Конан Дойл. Еще прыжок — Кристи».
Подробнее об этих скачках и экспериментах, на которых основывается Моретти, узнаете из полного текста статьи.
Время чтения: 11 минут.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Эволюция литературы: может ли Дарвин объяснить Пушкина
Как соседствуют друг с другом эволюционные подходы для описания эволюции литературы: антидарвинистский vs. давринистский подходы
Берестяные грамоты от раскопа до компьютера
На этой неделе отмечается День славянской письменности и культуры — и это хороший повод перечитать наш материал об исследованиях берестяных грамот и их цифровом сохранении.
Берестяные грамоты — важнейший источник живого древнерусского языка (а точнее, новгородского диалекта). Из берестяных грамот мы узнали множество слов, которых нет в других древнерусских источниках. Вспоминаем эти слова — и их исследователей.
Кратко: о чем статья?
Сейчас кажется естественным, что люди из разных городов России легко понимают друг друга, даже если кто-то выходит из подъезда, а кто-то — из парадной. Но в IX-XI вв. ситуация была иной. Благодаря берестяным грамотам ученые узнали и смогли хорошо изучить древненовгородский диалект. Этот язык заметно отличался от того варианта древнерусского языка, на котором говорили в Суздале, Москве или Киеве.
Древнерусский язык берестяных грамот — живой язык, на нем обсуждались совершенно обычные бытовые и интимные вопросы: покупки, продажи, хозяйство, любовные связи… Грамоты открыли нам множество слов, которых нет в других древнерусских источниках. Например, гречьскыи бобъ означает фасоль, а исполовница — корова, взятую на время по договору. Есть в грамотах и обидные слова, вроде недума (пустомеля), и ругательства, например, знаменитое уже аесова (буквально — сователь яйца).
Одним из известнейших исследователей грамот и древненовгородского диалекта был знаменитый лингвист А.А. Зализняк. Именно Зализняк обратил внимание на отличие говоров Новгорода и Пскова от остальных, что привело к пересмотру сложившейся схемы диалектов Древней Руси. До самой своей смерти Зализняк каждый год читал лекцию о вновь найденных грамотах — и эта лекция становилась «филологическим праздником урожая», неизменно собирая переполненный зал.
Главный цифровой ресурс, посвященный берестяным грамотам, — сайт «Древнерусские берестяные грамоты». Его база данных включает фотографии берестяных грамот, их прориси, древнерусские тексты, переводы на современный русский язык и основную информацию о документах.
Посмотреть на отсканированные берестяные грамоты, а также подробнее узнать о том, как формировался современный русский язык и какой вклад в исследование этого процесса внес А.А. Зализняк, можно в полной версии статьи
Время чтения: 7 минут
🤖 «Системный Блокъ» @sysblok
На этой неделе отмечается День славянской письменности и культуры — и это хороший повод перечитать наш материал об исследованиях берестяных грамот и их цифровом сохранении.
Берестяные грамоты — важнейший источник живого древнерусского языка (а точнее, новгородского диалекта). Из берестяных грамот мы узнали множество слов, которых нет в других древнерусских источниках. Вспоминаем эти слова — и их исследователей.
Кратко: о чем статья?
Сейчас кажется естественным, что люди из разных городов России легко понимают друг друга, даже если кто-то выходит из подъезда, а кто-то — из парадной. Но в IX-XI вв. ситуация была иной. Благодаря берестяным грамотам ученые узнали и смогли хорошо изучить древненовгородский диалект. Этот язык заметно отличался от того варианта древнерусского языка, на котором говорили в Суздале, Москве или Киеве.
Древнерусский язык берестяных грамот — живой язык, на нем обсуждались совершенно обычные бытовые и интимные вопросы: покупки, продажи, хозяйство, любовные связи… Грамоты открыли нам множество слов, которых нет в других древнерусских источниках. Например, гречьскыи бобъ означает фасоль, а исполовница — корова, взятую на время по договору. Есть в грамотах и обидные слова, вроде недума (пустомеля), и ругательства, например, знаменитое уже аесова (буквально — сователь яйца).
Одним из известнейших исследователей грамот и древненовгородского диалекта был знаменитый лингвист А.А. Зализняк. Именно Зализняк обратил внимание на отличие говоров Новгорода и Пскова от остальных, что привело к пересмотру сложившейся схемы диалектов Древней Руси. До самой своей смерти Зализняк каждый год читал лекцию о вновь найденных грамотах — и эта лекция становилась «филологическим праздником урожая», неизменно собирая переполненный зал.
Главный цифровой ресурс, посвященный берестяным грамотам, — сайт «Древнерусские берестяные грамоты». Его база данных включает фотографии берестяных грамот, их прориси, древнерусские тексты, переводы на современный русский язык и основную информацию о документах.
Посмотреть на отсканированные берестяные грамоты, а также подробнее узнать о том, как формировался современный русский язык и какой вклад в исследование этого процесса внес А.А. Зализняк, можно в полной версии статьи
Время чтения: 7 минут
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Берестяные грамоты от раскопа до компьютера. Памяти А.А. Зализняка. Часть I - Системный Блокъ
Аесова и другие: откуда и благодаря кому мы знаем, как ругались русские люди в XII веке?
Google встраивает языковую модель в поиск, Скарлетт Йоханссон обвиняет OpenAI, исследователи стали лучше понимать и контролировать ИИ
Рассказываем, что произошло в мире ИИ за прошедшие две недели.
Google теперь генерирует ответы на запросы пользователей
На недавно прошедшей конференции для разработчиков Google I/O корпорация анонсировала обновления своих генеративных моделей, а также новые функции поисковика, использующие языковую модель Gemini. Одно из ключевых нововведений – генерация ответа на поисковый запрос с использованием информации с разных сайтов. Эта функция уже доступна американским пользователям. По сообщениям многих из них, Google часто галлюцинирует или, другими словами, генерирует фактологически неверные ответы. Например, на вопрос пользователя «Как сделать так, чтобы сыр не сползал с пиццы?» поисковик предлагает использовать клей. Подобные ошибки возникают из-за недостоверной информации на некоторых сайтах и несовершенства языковых моделей. Про галлюцинации и механизм генерации, дополненной поиском, мы рассказывали в нашей статье про RAG (Retrieval Augmented Generation).
Скандал вокруг голоса GPT-4o
Голливудская актриса Скарлетт Йоханссон обвинила OpenAI в использовании её голоса для озвучки GPT-4o без её согласия. По заявлениям актрисы, в прошлом сентябре CEO OpenAI, Сэм Альтман, предложил ей озвучить голосового ассистента компании, однако она отказалась. После презентации GPT-4o многие пользователи в интернете отметили сходство голоса ассистента Sky (помимо него пользователь может также выбрать другие голоса) и актрисы. Более того, сам Альтман опубликовал твит с текстом «Her», названием фильма про интеллектуальную систему, озвученную Скарлетт Йоханссон. Также актриса утверждает, что CEO OpenAI повторно связывался с ней за два дня до презентации новой модели, чтобы выяснить, не пересмотрела ли она своё решение касательно сотрудничества. Однако к тому моменту, когда представители актрисы ответили, модель была уже анонсирована. После обращения юристов OpenAI согласилась убрать этот вариант озвучки.
Новое исследование интерпретируемости нейронных сетей
Компания Anthropic, основанная бывшими сотрудниками OpenAI, выпустила новое исследование, в котором авторы анализируют механизмы работы языковой модели Claude 3 Sonnet.
Суть метода, который используют авторы, заключается в выявлении набора признаков, которыми «оперирует» модель. Под признаком понимается численное (понятное компьютеру) представление какой-то концепции либо информации. Например: сведения об известных людях и достопримечательностях, лингвистические концепции, эмоции и т.д. Однако зачастую признаки представляют сразу несколько концептов или хранят информацию о совершенно разных объектах. Такая многозначность сильно усложняет задачу интерпретации нейросети и её контроля.
Главное достижение исследователей Anthropic – разработка метода, который позволяет выявлять только однозначные признаки, то есть признаки, которые не могут представлять несколько концепций одновременно. В своей статье авторы смогли идентифицировать большой и разнообразный набор однозначных признаков в языковой модели, сопоставимой по качеству и размеру с GPT-4. Также они показали, как можно управлять поведением модели, имея информацию о её признаках. В качестве демонстрации Anthropic на день дала пользователям доступ к своей языковой модели, которую с помощью разработанного метода заставили думать, что она является мостом «Золотые ворота». Модель всё так же, как и раньше, была способна отвечать на произвольные запросы пользователей, однако во всех ответах вставляла различную информацию о мосте.
Интерпретируемость нейронных сетей – одна из главных задач, решение которой позволит сделать ИИ более надёжным, безопасным и применимым в задачах, где важна обоснованность и прозрачность решений (например, в медицинских задачах).
В ближайшее время «Системный Блокъ» выпустит подробный разбор работ Anthropic по этой теме.
🤖 «Системный Блокъ» @sysblok
Рассказываем, что произошло в мире ИИ за прошедшие две недели.
Google теперь генерирует ответы на запросы пользователей
На недавно прошедшей конференции для разработчиков Google I/O корпорация анонсировала обновления своих генеративных моделей, а также новые функции поисковика, использующие языковую модель Gemini. Одно из ключевых нововведений – генерация ответа на поисковый запрос с использованием информации с разных сайтов. Эта функция уже доступна американским пользователям. По сообщениям многих из них, Google часто галлюцинирует или, другими словами, генерирует фактологически неверные ответы. Например, на вопрос пользователя «Как сделать так, чтобы сыр не сползал с пиццы?» поисковик предлагает использовать клей. Подобные ошибки возникают из-за недостоверной информации на некоторых сайтах и несовершенства языковых моделей. Про галлюцинации и механизм генерации, дополненной поиском, мы рассказывали в нашей статье про RAG (Retrieval Augmented Generation).
Скандал вокруг голоса GPT-4o
Голливудская актриса Скарлетт Йоханссон обвинила OpenAI в использовании её голоса для озвучки GPT-4o без её согласия. По заявлениям актрисы, в прошлом сентябре CEO OpenAI, Сэм Альтман, предложил ей озвучить голосового ассистента компании, однако она отказалась. После презентации GPT-4o многие пользователи в интернете отметили сходство голоса ассистента Sky (помимо него пользователь может также выбрать другие голоса) и актрисы. Более того, сам Альтман опубликовал твит с текстом «Her», названием фильма про интеллектуальную систему, озвученную Скарлетт Йоханссон. Также актриса утверждает, что CEO OpenAI повторно связывался с ней за два дня до презентации новой модели, чтобы выяснить, не пересмотрела ли она своё решение касательно сотрудничества. Однако к тому моменту, когда представители актрисы ответили, модель была уже анонсирована. После обращения юристов OpenAI согласилась убрать этот вариант озвучки.
Новое исследование интерпретируемости нейронных сетей
Компания Anthropic, основанная бывшими сотрудниками OpenAI, выпустила новое исследование, в котором авторы анализируют механизмы работы языковой модели Claude 3 Sonnet.
Суть метода, который используют авторы, заключается в выявлении набора признаков, которыми «оперирует» модель. Под признаком понимается численное (понятное компьютеру) представление какой-то концепции либо информации. Например: сведения об известных людях и достопримечательностях, лингвистические концепции, эмоции и т.д. Однако зачастую признаки представляют сразу несколько концептов или хранят информацию о совершенно разных объектах. Такая многозначность сильно усложняет задачу интерпретации нейросети и её контроля.
Главное достижение исследователей Anthropic – разработка метода, который позволяет выявлять только однозначные признаки, то есть признаки, которые не могут представлять несколько концепций одновременно. В своей статье авторы смогли идентифицировать большой и разнообразный набор однозначных признаков в языковой модели, сопоставимой по качеству и размеру с GPT-4. Также они показали, как можно управлять поведением модели, имея информацию о её признаках. В качестве демонстрации Anthropic на день дала пользователям доступ к своей языковой модели, которую с помощью разработанного метода заставили думать, что она является мостом «Золотые ворота». Модель всё так же, как и раньше, была способна отвечать на произвольные запросы пользователей, однако во всех ответах вставляла различную информацию о мосте.
Интерпретируемость нейронных сетей – одна из главных задач, решение которой позволит сделать ИИ более надёжным, безопасным и применимым в задачах, где важна обоснованность и прозрачность решений (например, в медицинских задачах).
В ближайшее время «Системный Блокъ» выпустит подробный разбор работ Anthropic по этой теме.
Please open Telegram to view this post
VIEW IN TELEGRAM
Что такое обучение с подкреплением?
Что если бы компьютеры могли самостоятельно исследовать окружающий мир, экспериментировать и корректировать свои действия на основе реального опыта? Они уже могут! Благодаря обучению с подкреплением (от англ. Reinforcement Learning, сокращённо RL), принципы которого очень похожи на то, как мы, люди, учимся в реальном мире.
Кратко: о чем статья?
В основе обучения с подкреплением — несколько ключевых понятий: окружение, состояние, aгент, действие, награда. Они формируют фундамент, на котором строится процесс обучения.
Окружение — это среда, в которой действует агент. Оно может быть как физическим (например, комната для робота-пылесоса или тестовый полигон для машины с автопилотом), так и виртуальным (карта, по которой ходит персонаж компьютерной игры). Состояние — описание окружения в момент времени, понятное компьютеру. Агент — сущность, выполняющая действия в окружении. Например, программа, робот или нейросеть. Наконец, награда – это сигнал от окружения, который оценивает эффективность действий агента.
Меняя состояние окружения с помощью различных действий, агент получает награду, анализирует результаты своих действий и обновляет стратегию, чтобы улучшить будущие результаты. Это похоже на то, как шахматист продумывает свой следующий шаг, основываясь на ходах соперника и текущем состоянии доски. Уникальность такого подхода в том, что агент не просто учится на основе данных: он сам формирует их в процессе взаимодействия со средой.
Подробнее о пяти шагах в процессе обучения и о том, какой прорыв совершила программа AlphaGo благодаря RL, узнаете из полной версии статьи.
Время чтения: 8 минут.
🤖 «Системный Блокъ» @sysblok
Что если бы компьютеры могли самостоятельно исследовать окружающий мир, экспериментировать и корректировать свои действия на основе реального опыта? Они уже могут! Благодаря обучению с подкреплением (от англ. Reinforcement Learning, сокращённо RL), принципы которого очень похожи на то, как мы, люди, учимся в реальном мире.
Кратко: о чем статья?
В основе обучения с подкреплением — несколько ключевых понятий: окружение, состояние, aгент, действие, награда. Они формируют фундамент, на котором строится процесс обучения.
Окружение — это среда, в которой действует агент. Оно может быть как физическим (например, комната для робота-пылесоса или тестовый полигон для машины с автопилотом), так и виртуальным (карта, по которой ходит персонаж компьютерной игры). Состояние — описание окружения в момент времени, понятное компьютеру. Агент — сущность, выполняющая действия в окружении. Например, программа, робот или нейросеть. Наконец, награда – это сигнал от окружения, который оценивает эффективность действий агента.
Меняя состояние окружения с помощью различных действий, агент получает награду, анализирует результаты своих действий и обновляет стратегию, чтобы улучшить будущие результаты. Это похоже на то, как шахматист продумывает свой следующий шаг, основываясь на ходах соперника и текущем состоянии доски. Уникальность такого подхода в том, что агент не просто учится на основе данных: он сам формирует их в процессе взаимодействия со средой.
Подробнее о пяти шагах в процессе обучения и о том, какой прорыв совершила программа AlphaGo благодаря RL, узнаете из полной версии статьи.
Время чтения: 8 минут.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Что такое обучение с подкреплением?
Изучим принципы машинного обучения с подкреплением — методику, которая позволяет компьютеру «учиться на своих ошибках».
Как устроено закулисье современного интернета: подборка интервью «Системного Блока»
Интернет — параллельный мир, в котором возникают новые культуры, формируется новый язык, разворачиваются ожесточенные словесные битвы. Он виртуален, но происходящее в нём напрямую влияет на реальную жизнь каждого из нас. Политика, буллинг, скорбь, торговля, флирт, преступления и благотворительность — как этот видимый хаос определяет нашу жизнь? Читайте в подборке интервью «Системного Блока», где интернет-исследователи делятся наблюдениями и опытом.
«К идее разных интернетов мы пока не привыкли»: Полина Колозариди об исследованиях интернета
Часто вопросы, связанные с интернетом, на самом деле не про сам интернет, а про отношения между людьми, любовь, детские страхи, политику, приличия и так далее. Об этом в интервью «Системному Блоку» рассказывает интернет-исследовательница, рукводительница магтсратуры DH в ИТМО и со-основательница Клуба любителей интернета и общества, Полина Колозариди. Например, для подростков интернет это не технология, а скорее способ публичной жизни, они используют онлайн-площадки для того, чтобы фильтровать и лучше понимать свои круги общения. О том, чем и почему отличается интернет в разных городах России, сильно ли влияют на общество TikTok и Tinder, как стать интернет-исследователем и зачем это нужно, читайте в интервью.
«Отличить бота от трамвайного хама»: Оксана Мороз о спорах в интернете, цифровом бессмертии и языке онлайн-скорби
Оксана Мороз, культуролог, исследователь цифровой среды, академический руководитель образовательной программы НИУ ВШЭ «Практики кураторства в современном искусстве», рассказала «Системному Блоку» об особенностях коммуникации в интернете. Например, о том, что в онлайн-среде усиленно воспроизводится то, что характерно для офлайн-среды, поэтому в кризисных ситуациях люди особенно интенсивно спорят и возвращаются к архаичным моделям определения мира через своих и чужих. А ещё – об изменения в общении после 24 февраля 2022 года, эзопове языке, мутизме и коллективном интернет-горевании. Подробнее – в интервью.
«Виртуальные НКО — это будущее»: интервью с руководителем красноярского «Мемориала»*
Руководитель красноярского общества «Мемориал»*, а также один из первопроходцев Рунета Алексей Бабий занимается сохранением памяти о жертвах репрессий в Красноярском крае и развитием цифровой инфраструктуры красноярского «Мемориала». В интервью «Системному Блоку» Алексей рассказал, что может дать интернет гражданским активистам (спойлер:в 2005 году он помог остановить установку памятника Сталину благодаря большому информационному шуму ), как опыт работы на советских ЭВМ 1970-х годов позволяет обеспечивать сохранность данных о репрессиях и почему современным «облачным НКО» не страшна ликвидация.
«Интернет-среда влияет на политическую активность»: интервью с Ольгой Гулевич
В 2021 году «Системный Блокъ» поговорил с психологом Ольгой Гулевич, профессором департамента психологии НИУ ВШЭ. Она рассказала, в частности, что термин «интернет-зависимость» появился ещё до соцсетей, её нельзя определить просто по количеству времени, которое человек проводит в интернете. Из интервью узнаете, по каким симптомам можно, а ещё – чем кибербуллинг отличается от обычного буллинга, как пандемия повлияла на интернет, а интернет — на политические настроения.
*«Мемориал» в России официально ликвидирован решением суда
🤖 «Системный Блокъ» @sysblok
Интернет — параллельный мир, в котором возникают новые культуры, формируется новый язык, разворачиваются ожесточенные словесные битвы. Он виртуален, но происходящее в нём напрямую влияет на реальную жизнь каждого из нас. Политика, буллинг, скорбь, торговля, флирт, преступления и благотворительность — как этот видимый хаос определяет нашу жизнь? Читайте в подборке интервью «Системного Блока», где интернет-исследователи делятся наблюдениями и опытом.
«К идее разных интернетов мы пока не привыкли»: Полина Колозариди об исследованиях интернета
Часто вопросы, связанные с интернетом, на самом деле не про сам интернет, а про отношения между людьми, любовь, детские страхи, политику, приличия и так далее. Об этом в интервью «Системному Блоку» рассказывает интернет-исследовательница, рукводительница магтсратуры DH в ИТМО и со-основательница Клуба любителей интернета и общества, Полина Колозариди. Например, для подростков интернет это не технология, а скорее способ публичной жизни, они используют онлайн-площадки для того, чтобы фильтровать и лучше понимать свои круги общения. О том, чем и почему отличается интернет в разных городах России, сильно ли влияют на общество TikTok и Tinder, как стать интернет-исследователем и зачем это нужно, читайте в интервью.
«Отличить бота от трамвайного хама»: Оксана Мороз о спорах в интернете, цифровом бессмертии и языке онлайн-скорби
Оксана Мороз, культуролог, исследователь цифровой среды, академический руководитель образовательной программы НИУ ВШЭ «Практики кураторства в современном искусстве», рассказала «Системному Блоку» об особенностях коммуникации в интернете. Например, о том, что в онлайн-среде усиленно воспроизводится то, что характерно для офлайн-среды, поэтому в кризисных ситуациях люди особенно интенсивно спорят и возвращаются к архаичным моделям определения мира через своих и чужих. А ещё – об изменения в общении после 24 февраля 2022 года, эзопове языке, мутизме и коллективном интернет-горевании. Подробнее – в интервью.
«Виртуальные НКО — это будущее»: интервью с руководителем красноярского «Мемориала»*
Руководитель красноярского общества «Мемориал»*, а также один из первопроходцев Рунета Алексей Бабий занимается сохранением памяти о жертвах репрессий в Красноярском крае и развитием цифровой инфраструктуры красноярского «Мемориала». В интервью «Системному Блоку» Алексей рассказал, что может дать интернет гражданским активистам (спойлер:
«Интернет-среда влияет на политическую активность»: интервью с Ольгой Гулевич
В 2021 году «Системный Блокъ» поговорил с психологом Ольгой Гулевич, профессором департамента психологии НИУ ВШЭ. Она рассказала, в частности, что термин «интернет-зависимость» появился ещё до соцсетей, её нельзя определить просто по количеству времени, которое человек проводит в интернете. Из интервью узнаете, по каким симптомам можно, а ещё – чем кибербуллинг отличается от обычного буллинга, как пандемия повлияла на интернет, а интернет — на политические настроения.
*«Мемориал» в России официально ликвидирован решением суда
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Подборка интервью об интернет-среде
Беседы «Системному Блока» про интернет и про то, что в нём происходит.
Почему информацию надо спасать: проблема цифрового архива
Интернет создает ложное ощущение: всё, что мы выгрузили в сеть, останется там навсегда. На самом деле нет. Одни сервисы закрываются, и всё, что на них было опубликовано, пропадает, другие платформы страдают от утечек и проблем с серверами, третьи просто удаляют данные тех пользователей, которые долго не заходили в свой аккаунт. О том, как можно решить проблему архива в XXI веке, рассуждает доцент НИУ ВШЭ и соосновательница сообщества DHCLOUD Анастасия Бонч-Осмоловская
📎 Что будет с коллективной памятью
Мы ежесекундно создаём огромный цифровой архив человечества, но при этом непонятно, сложится ли из этого так коллективная память, без которой невозможно будет представить наше будущее.
Проблему сохранения воспоминаний в новую технологическую эпоху, когда документов очень много, а живут они очень недолго, впервые артикулировал в 1975 году архивист Джеральд Хэм. С тех пор проблема стала только острее. Сегодня мы создаем множество born digital документов, которые никогда не существовали в материальном виде, а сразу были созданы «в цифре». Про born digital говорят, что они одновременно перманентны и эфемерны: с одной стороны, «интернет помнит всё», и опубликованное однажды в интернете практически невозможно вывести из публичного поля, с другой — цифровые документы очень легко изменяются или становятся недоступными.
⛓️ Где хранится интернет
Первыми инициаторами цифровой архивации стали институты памяти — музеи, библиотеки, архивы. Например, в 1976 году был создан Окфордский текстовый архив. С развитием интернета достаточно быстро возникло понимание необходимости архивного хранилища сайтов — Интернет-архива. WaybackMachine, открытый в 1996 году, за это время вырос в огромное хранилище сайтов и документов, обнаруженных в сети.
🔗 Куда ведут ссылки
В 2017 году вышло исследование того, насколько актуальны ссылки на веб-ресурсы в научных статьях, опубликованных с 1997 до 2012 годы. Результаты были совершенно поразительны: более 75% веб-ресурсов, ссылки на которые имеются в научных статьях, изменили с тех пор свое содержание. Получается, что цифровизация фантастически ускоряет обмен научным знанием, но одновременно ставит под удар сам процесс его трансляции будущим поколениям ученых — то, что до сих пор считалось основой развития науки.
О том, важны ли архивы электронных переписок (спойлер:очень! ), какую роль в создании архивов играет краудсорсинг и какую еще сыграет искусственный интеллект, узнаете из полной версии текста.
🤖 «Системный Блокъ» @sysblok
Интернет создает ложное ощущение: всё, что мы выгрузили в сеть, останется там навсегда. На самом деле нет. Одни сервисы закрываются, и всё, что на них было опубликовано, пропадает, другие платформы страдают от утечек и проблем с серверами, третьи просто удаляют данные тех пользователей, которые долго не заходили в свой аккаунт. О том, как можно решить проблему архива в XXI веке, рассуждает доцент НИУ ВШЭ и соосновательница сообщества DHCLOUD Анастасия Бонч-Осмоловская
📎 Что будет с коллективной памятью
Мы ежесекундно создаём огромный цифровой архив человечества, но при этом непонятно, сложится ли из этого так коллективная память, без которой невозможно будет представить наше будущее.
Проблему сохранения воспоминаний в новую технологическую эпоху, когда документов очень много, а живут они очень недолго, впервые артикулировал в 1975 году архивист Джеральд Хэм. С тех пор проблема стала только острее. Сегодня мы создаем множество born digital документов, которые никогда не существовали в материальном виде, а сразу были созданы «в цифре». Про born digital говорят, что они одновременно перманентны и эфемерны: с одной стороны, «интернет помнит всё», и опубликованное однажды в интернете практически невозможно вывести из публичного поля, с другой — цифровые документы очень легко изменяются или становятся недоступными.
⛓️ Где хранится интернет
Первыми инициаторами цифровой архивации стали институты памяти — музеи, библиотеки, архивы. Например, в 1976 году был создан Окфордский текстовый архив. С развитием интернета достаточно быстро возникло понимание необходимости архивного хранилища сайтов — Интернет-архива. WaybackMachine, открытый в 1996 году, за это время вырос в огромное хранилище сайтов и документов, обнаруженных в сети.
🔗 Куда ведут ссылки
В 2017 году вышло исследование того, насколько актуальны ссылки на веб-ресурсы в научных статьях, опубликованных с 1997 до 2012 годы. Результаты были совершенно поразительны: более 75% веб-ресурсов, ссылки на которые имеются в научных статьях, изменили с тех пор свое содержание. Получается, что цифровизация фантастически ускоряет обмен научным знанием, но одновременно ставит под удар сам процесс его трансляции будущим поколениям ученых — то, что до сих пор считалось основой развития науки.
О том, важны ли архивы электронных переписок (спойлер:
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Проблема цифрового архива: почему информацию надо спасать - Системный Блокъ
Интернет создает ложное ощущение: всё, что мы выгрузили в сеть, останется там навсегда. На самом деле нет. Одни сервисы закрываются, и всё, что на них было опубликовано, пропадает, другие платформы страдают от утечек и проблем с серверами, третьи просто удаляют…
Музыкальная «энциклопедия русской жизни»: о чём пел русский рок и русский поп?
Как русскоязычная поп- и рок-музыка представляла пространство быта с 1990 по 2019 год? Что пили, ели и куда хотели поехать герои музыкальных текстов? Авторы исследования проанализировали корпус из 1129 популярных песен разных жанров — и получили неожиданные результаты.
🪗Что считать популярной музыкой?
За основу списка исследователи взяли рейтинги музыкальных журналов, радио и телеканалов и просветительские материалы. Каждому исполнителю была приписана условная категория «поп» или «альтернатива». Для каждой декады (1990-е, 2000-е, 2010-е) было выбрано по 10 исполнителей из каждой категории, и от каждого в выборку попало около 20 песен. Так в списке оказались, например, Кино, Сплин, Леонид Агутин и Егор Крид.
🎤О чем поют в корпусе?
В музыкальных текстах в список самых частотных существительных слова, связанные с описанием или выражением чувств: любовь, день, ночь, небо, сердце, свет, душа… Для сравнения, в обычных русских текстах (НКРЯ) эти слова не входят в топ 30 существительных, там вместо них год, человек, время, дело, жизнь... Самые частотные слова в песенном корпусе — местоимения. На первом месте — я, на втором — ты. В НКРЯ местоимение ты — лишь 33-е по частотности слово.
🎻Чем наполнен мир популярных песен?
Какие собственные имена встречаются в песнях? Исполнители часто упоминают типовые российские топонимы (Москву, Россию, Питер), а еще Нью-Йорк, Париж и Лондон … и самих себя. Это видно по списку имен собственных, в котором лидируют Настя, Потап и Каста. Ещё в мире постсоветсткой музыки много пьют и едят, особенно в текстах Касты и Ленинграда. В категории «еда и напитки», кстати, лидируют вино, водка, хлеб и кофе. Вино одинаково упоминается и в песнях жанра «поп» (19 раз), и в «альтернативе» (44 раза). А вот в упоминании водки «альтернатива» лидирует со счетом 25:3.
🎸Чем отличаются разные жанры?
Рэперы описывают весь мир сразу: их тексты в основном концентрируются на окружающей реальности, но часто выходят за ее пределы за счет множества культурных отсылок. Поп-музыка описывает путешествия и мечты своих героев о дальних странах — это места из реального мира, к которым действительно можно приблизиться. Русский рок описывает мистические переживания и больше говорит о внутренней стороне жизни.
Узнать подробнее о бытовом и сверхъественном в песнях разных исполнителях можно из полной версии статьи. А если хочется провести сделать собственные выводы, созданный корпус опубликован на платформе linghub.
🤖 «Системный Блокъ» @sysblok
Как русскоязычная поп- и рок-музыка представляла пространство быта с 1990 по 2019 год? Что пили, ели и куда хотели поехать герои музыкальных текстов? Авторы исследования проанализировали корпус из 1129 популярных песен разных жанров — и получили неожиданные результаты.
🪗Что считать популярной музыкой?
За основу списка исследователи взяли рейтинги музыкальных журналов, радио и телеканалов и просветительские материалы. Каждому исполнителю была приписана условная категория «поп» или «альтернатива». Для каждой декады (1990-е, 2000-е, 2010-е) было выбрано по 10 исполнителей из каждой категории, и от каждого в выборку попало около 20 песен. Так в списке оказались, например, Кино, Сплин, Леонид Агутин и Егор Крид.
🎤О чем поют в корпусе?
В музыкальных текстах в список самых частотных существительных слова, связанные с описанием или выражением чувств: любовь, день, ночь, небо, сердце, свет, душа… Для сравнения, в обычных русских текстах (НКРЯ) эти слова не входят в топ 30 существительных, там вместо них год, человек, время, дело, жизнь... Самые частотные слова в песенном корпусе — местоимения. На первом месте — я, на втором — ты. В НКРЯ местоимение ты — лишь 33-е по частотности слово.
🎻Чем наполнен мир популярных песен?
Какие собственные имена встречаются в песнях? Исполнители часто упоминают типовые российские топонимы (Москву, Россию, Питер), а еще Нью-Йорк, Париж и Лондон … и самих себя. Это видно по списку имен собственных, в котором лидируют Настя, Потап и Каста. Ещё в мире постсоветсткой музыки много пьют и едят, особенно в текстах Касты и Ленинграда. В категории «еда и напитки», кстати, лидируют вино, водка, хлеб и кофе. Вино одинаково упоминается и в песнях жанра «поп» (19 раз), и в «альтернативе» (44 раза). А вот в упоминании водки «альтернатива» лидирует со счетом 25:3.
🎸Чем отличаются разные жанры?
Рэперы описывают весь мир сразу: их тексты в основном концентрируются на окружающей реальности, но часто выходят за ее пределы за счет множества культурных отсылок. Поп-музыка описывает путешествия и мечты своих героев о дальних странах — это места из реального мира, к которым действительно можно приблизиться. Русский рок описывает мистические переживания и больше говорит о внутренней стороне жизни.
Узнать подробнее о бытовом и сверхъественном в песнях разных исполнителях можно из полной версии статьи. А если хочется провести сделать собственные выводы, созданный корпус опубликован на платформе linghub.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Музыкальная «энциклопедия русской жизни»: о чём пела русскоязычная поп-эстрада с 1990 по 2019 год
Что такое «русская музыка» на постсоветском пространстве? Авторы исследования провели анализ текстов популярных песен за 30 лет. Рассказываем, как русскоязычные музыканты отражали быт.
Всемирная история картотек: как учёные и библиотекари пытались упорядочить всё
Зачем разрезать конспекты книги на полоски? Как крючки в шкафу заменяли библиотекарем теги? Антон Басов, сотрудник факультета компьютерных наук НИУ ВШЭ и исследователь истории науки и техники, рассказал об истории упорядочивания книг и изучил, как развивалась идея библиотечного каталога с XVI века и до наших дней.
Как возникла идея каталогов?
После изобретения книгопечатания мир пережил первый в истории информационный взрыв: количество напечатанных книг росло с 12,5 тысяч экземпляров в начале XVI века до 138 тысяч в его второй половине. Изменилось не только количество книг, но и их качество: кроме религиозной литературы, стали появляться греческие и римские философы, сочинения самих европейцев по всем вопросам. Это требовало создания «навигационных инструментов» для книжного мира.
Когда появился первый каталог?
Первый литературный каталог создал Конрад Геснер — швейцарский ботаник и зоолог Нового времени. Он выпустил две книги: Bibliotheca universalis, в которой упорядочена вся известная ему литература на латыни, греческом и иврите, и Pandectarum sive Partitionum Universalium, которая распределяет все книги из первой части по 21-й области знаний. Еще Геснер предложил такой метод: выписывать все важное на лист бумаги с новой строки, разрезать лист на полоски и сортировать в необходимом порядке.
Какие ещё были идеи?
Первый каталожный шкаф был создан Томасом Харрисоном примерно в 1640-м году и назван им Arca studiorum, «ковчег познания». Англичанин предложил выписывать факты на отдельные карточки, а затем сделать доску с крючками, каждый из которых соответствовал бы какому-либо ключевому слову. Карточки, связанные с тем или иным словом, вешались на соответствующий крючок.
А как же библиотечные каталоги?
Первый карточный каталог библиотеки создал Готфрид Лейбниц, один из главных европейских интеллектуалов XVII века. Лейбниц сделал каталог с помощью отдельных листков бумаги для каждой книги, рассортированных по предметам и авторам. После Лейбница понадобится ещё сто лет и череда случайностей, чтобы появился первый настоящий библиотечный карточный каталог.
Почему фрагменты знаний Геснера, записанные на полосках бумаги, отражали мировосприятие Нового времени? Какой известный ученый заинтересовался изобретением Харрисона? Обо всём этом и более подробно об истории каталогов книг, читайте в полной версии статьи.
Время чтения: 11 минут.
🤖 «Системный Блокъ» @sysblok
Зачем разрезать конспекты книги на полоски? Как крючки в шкафу заменяли библиотекарем теги? Антон Басов, сотрудник факультета компьютерных наук НИУ ВШЭ и исследователь истории науки и техники, рассказал об истории упорядочивания книг и изучил, как развивалась идея библиотечного каталога с XVI века и до наших дней.
Как возникла идея каталогов?
После изобретения книгопечатания мир пережил первый в истории информационный взрыв: количество напечатанных книг росло с 12,5 тысяч экземпляров в начале XVI века до 138 тысяч в его второй половине. Изменилось не только количество книг, но и их качество: кроме религиозной литературы, стали появляться греческие и римские философы, сочинения самих европейцев по всем вопросам. Это требовало создания «навигационных инструментов» для книжного мира.
Когда появился первый каталог?
Первый литературный каталог создал Конрад Геснер — швейцарский ботаник и зоолог Нового времени. Он выпустил две книги: Bibliotheca universalis, в которой упорядочена вся известная ему литература на латыни, греческом и иврите, и Pandectarum sive Partitionum Universalium, которая распределяет все книги из первой части по 21-й области знаний. Еще Геснер предложил такой метод: выписывать все важное на лист бумаги с новой строки, разрезать лист на полоски и сортировать в необходимом порядке.
Какие ещё были идеи?
Первый каталожный шкаф был создан Томасом Харрисоном примерно в 1640-м году и назван им Arca studiorum, «ковчег познания». Англичанин предложил выписывать факты на отдельные карточки, а затем сделать доску с крючками, каждый из которых соответствовал бы какому-либо ключевому слову. Карточки, связанные с тем или иным словом, вешались на соответствующий крючок.
А как же библиотечные каталоги?
Первый карточный каталог библиотеки создал Готфрид Лейбниц, один из главных европейских интеллектуалов XVII века. Лейбниц сделал каталог с помощью отдельных листков бумаги для каждой книги, рассортированных по предметам и авторам. После Лейбница понадобится ещё сто лет и череда случайностей, чтобы появился первый настоящий библиотечный карточный каталог.
Почему фрагменты знаний Геснера, записанные на полосках бумаги, отражали мировосприятие Нового времени? Какой известный ученый заинтересовался изобретением Харрисона? Обо всём этом и более подробно об истории каталогов книг, читайте в полной версии статьи.
Время чтения: 11 минут.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Всемирная история картотек: как учёные и библиотекари пытались упорядочить книги
Исследователь истории науки и техники, сотрудник Центра непрерывного образования факультета компьютерных наук НИУ ВШЭ Антон Басов специально для «Системного Блока» изучил, как развивалась идея библиотечного каталога с XVI века и до наших дней.
Три гайда для востоковедов: китайский, корейский и японский
Многие задачи, связанные с автоматической обработкой текста, начинаются с токенизации — деления текста на слова (токены). Текст на русском языке, например, можно поделить на слова по пробелам, но что делать с японскими и китайскими текстами, где пробелов нет?
Одно из популярных решений — использование словаря, в котором прописаны леммы и их всевозможные словоформы, а также некоторые морфологические сведения. Такие словари лежат в основе библиотек из этой подборки. Рассказываем о них подробнее!
🇨🇳 Text-mining китайского языка: библиотека Jieba
Jieba — одна из самых популярных на сегодняшний день Python-библиотек для токенизации китайских текстов. Например, именно её использовали разработчики Яндекса, когда внедряли функцию перевода видео с китайского языка в браузере. Как с ней работать, узнаете из нашего гайда.
🇯🇵 Text-mining японского языка: библиотека fugashi
fugashi – библиотека, позволяющая самостоятельно провести токенизацию текстов на японском. Она способна не только определить наиболее вероятные границы слов, но также провести морфологический анализ и выделять именованные сущности. А ещё для неё можно скачать дополнительные словари: современный письменный, современный устный и одиннадцать видов словарей для классического японского. О том, как устроена fugashi и как ей пользоваться, узнаете из гайда.
🇰🇷 Text-mining корейского языка: библиотека koNLPy
Библиотека koNLPy выделяет токены, определяет морфемы и части речи. Для этого она предлагает пользователю пять методов: Kkma, Hannanum, Komoran, Mecab и Twitter. Все они отличаются по своему функционалу и подходят для решения разных задач. Подробнее об их особенностях и о том, как устроена работа в koNLPy узнаете из материала.
🤖 «Системный Блокъ» @sysblok
Многие задачи, связанные с автоматической обработкой текста, начинаются с токенизации — деления текста на слова (токены). Текст на русском языке, например, можно поделить на слова по пробелам, но что делать с японскими и китайскими текстами, где пробелов нет?
Одно из популярных решений — использование словаря, в котором прописаны леммы и их всевозможные словоформы, а также некоторые морфологические сведения. Такие словари лежат в основе библиотек из этой подборки. Рассказываем о них подробнее!
🇨🇳 Text-mining китайского языка: библиотека Jieba
Jieba — одна из самых популярных на сегодняшний день Python-библиотек для токенизации китайских текстов. Например, именно её использовали разработчики Яндекса, когда внедряли функцию перевода видео с китайского языка в браузере. Как с ней работать, узнаете из нашего гайда.
🇯🇵 Text-mining японского языка: библиотека fugashi
fugashi – библиотека, позволяющая самостоятельно провести токенизацию текстов на японском. Она способна не только определить наиболее вероятные границы слов, но также провести морфологический анализ и выделять именованные сущности. А ещё для неё можно скачать дополнительные словари: современный письменный, современный устный и одиннадцать видов словарей для классического японского. О том, как устроена fugashi и как ей пользоваться, узнаете из гайда.
🇰🇷 Text-mining корейского языка: библиотека koNLPy
Библиотека koNLPy выделяет токены, определяет морфемы и части речи. Для этого она предлагает пользователю пять методов: Kkma, Hannanum, Komoran, Mecab и Twitter. Все они отличаются по своему функционалу и подходят для решения разных задач. Подробнее об их особенностях и о том, как устроена работа в koNLPy узнаете из материала.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Text-mining китайского текста: гайд по библиотеке Jieba
Рассказываем, как пользоваться библиотекой Jieba, которая помогает в токенизации китайского языка.
Какой результат получился при анализе 3 романов Гончарова и 3 романов Тургенева?
Anonymous Quiz
36%
Все романы Тургенева похожи друг на друга, а один из романов Гончарова заметно отличается от других
13%
Наоборот, похожи романы Гончарова, а отличаются романы Тургенева
51%
Все романы каждого из писателей лексически близки друг к другу
Stylo: какие слова отличают один текст от другого?
Stylo — программа для исследования количественной стилистики текста. «Системный Блокъ» подготовил для вас уже третий гайд по этому инструменту (вот ссылки на первые два, базовый и продвинутый). На этот раз разбираемся с функцией oppose(), которая помогает найти отличия между лексическими составами двух корпусов текстов. Например, выяснить, чем Толстой отличается от Достоевского, а Тургенев — от Гончарова.
Для каждого из корпусов oppose() показывает, какие слова характерны для входящих в него текстов и в то же время редко встречаются во втором наборе. Также функция может учитывать дополнительный, контрольный, корпус — его добавляют, если нужно проверить точность результатов или определить, какой из двух исследуемых корпусов больше похож на контрольный (используется при определении автора текста).
oppose() анализирует текст по фрагментам (длины можно выбрать самостоятельно), и благодаря этому учитывает распределение слов в тексте: даже если какое-то слово встречается часто, но лишь в одном фрагменте длинного текста, оно не будет отмечено как характерное для всего корпуса.
В полной версии гайда мы сравнили романы Тургенева «Накануне» и «Дворянское гнездо» с «Обрывом» и «Обыкновенной историей» Гончарова, добавив контрольный корпус из «Обломова» и «Рудина». В результате получилось, что у Тургенева персонажи больше говорят (для выбранных романов характерны слова типа промолвить, воскликнуть, возразить), а у Гончарова — смотрят (романы отличают слова поглядеть, смотреть, посмотреть, взгляд).
Если изменить параметры визуализации, то можно получить график, где будет показано, насколько далеко отстоят друг от друга тексты из разных корпусов — то есть, насколько сильно они отличаются и, наоборот, какие похожи друг на друга. Предлагаем читателям угадать, какие выводы удалось сделать на основе получившегося у нас графика.
🤖 «Системный Блокъ» @sysblok
Stylo — программа для исследования количественной стилистики текста. «Системный Блокъ» подготовил для вас уже третий гайд по этому инструменту (вот ссылки на первые два, базовый и продвинутый). На этот раз разбираемся с функцией oppose(), которая помогает найти отличия между лексическими составами двух корпусов текстов. Например, выяснить, чем Толстой отличается от Достоевского, а Тургенев — от Гончарова.
Для каждого из корпусов oppose() показывает, какие слова характерны для входящих в него текстов и в то же время редко встречаются во втором наборе. Также функция может учитывать дополнительный, контрольный, корпус — его добавляют, если нужно проверить точность результатов или определить, какой из двух исследуемых корпусов больше похож на контрольный (используется при определении автора текста).
oppose() анализирует текст по фрагментам (длины можно выбрать самостоятельно), и благодаря этому учитывает распределение слов в тексте: даже если какое-то слово встречается часто, но лишь в одном фрагменте длинного текста, оно не будет отмечено как характерное для всего корпуса.
В полной версии гайда мы сравнили романы Тургенева «Накануне» и «Дворянское гнездо» с «Обрывом» и «Обыкновенной историей» Гончарова, добавив контрольный корпус из «Обломова» и «Рудина». В результате получилось, что у Тургенева персонажи больше говорят (для выбранных романов характерны слова типа промолвить, воскликнуть, возразить), а у Гончарова — смотрят (романы отличают слова поглядеть, смотреть, посмотреть, взгляд).
Если изменить параметры визуализации, то можно получить график, где будет показано, насколько далеко отстоят друг от друга тексты из разных корпусов — то есть, насколько сильно они отличаются и, наоборот, какие похожи друг на друга. Предлагаем читателям угадать, какие выводы удалось сделать на основе получившегося у нас графика.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Гайд по проведению стилометрического анализа с помощью Stylo на языке R
Системный Блокъ уже рассказывал о том, что такое стилометрия, и о многих стилометрических исследованиях. Читайте подробный гайд, как самому провести такой эксперимент — с помощью stylo, библиотеки языка R и самого популярного инструмента для стилометрии.
Новые открытые языковые модели, критика OpenAI от бывшего сотрудника и большой отчёт об опасностях общего ИИ
Рассказываем, что произошло в мире ИИ за прошедшие две недели.
Qwen2 – новые лучшие открытые языковые модели
Компания Alibaba Group (владелица AliExpress, Taobao и ряда других площадок) представила второе поколение языковых моделей Qwen. Всего модель доступна в шести размерах: 0.5, 1.5, 7, 57 и 72 млрд параметров. Самая большая версия поддерживает 29 языков и по метрикам в основных тестах является лучшей на данный момент публичной доступной моделью. Все модели можно использовать в коммерческих целях.
Бывший сотрудник OpenAI рассказал о проблемах с безопасностью
Бывший исследователь OpenAI Даниэль Кокотайло, который занимался прогнозированием развития ИИ, дал интервью New York Times. Он рассказал об инцидентах внутри OpenAI, которые могут свидетельствовать о смещении фокуса с безопасного развития ИИ в пользу стремления победить в гонке за общим ИИ (он же AGI), способным решать широкий спектр задач не хуже или лучше человека.
По словам Даниэля, в 2022 году до релиза GPT-4 компания Microsoft (одна из главных инвесторов и партнёров OpenAI) дала доступ к модели пользователям из Индии до одобрения совета безопасности (Deployment Safety Board). В совет входили как сотрудники OpenAI, так и Microsoft. OpenAI не стала вступать в конфронтацию, опасаясь потери сотрудничество с Microsoft. До публикации этого интервью, Microsoft отрицала произошедшее, однако после подтвердила.
Что настораживает в решениях Сэма Альтмана
Опасения вызывает и намерение Сэма Альтмана, гендиректора OpenAI, привлечь существенные средства для разработки собственных вычислительных чипов, необходимых для обучения ИИ. Желание компании сильно увеличить вычислительные мощности может привести к резкому улучшению моделей, что противоречит политике компании, согласно которой ИИ должен развиваться постепенно.
Увольнение Сэма Альтмана из совета директоров и скорое возвращение его на пост в 2023 году усугубили ситуацию и ещё сильнее сместили фокус с безопасности. Многим из работников компании казалось, что увольнение Альтмана было мотивировано желанием правления замедлить разработку моделей в целях безопасности, против чего якобы и выступал Альтман. Такое представление о случившемся сильно поляризовало настроения в компании. Несколько недель назад ключевые сотрудники команды, ответственной за исследования способов контроля ИИ, ушли из компании.
Цена критики в OpenAI
Даниэль также рассказал, что OpenAI вынуждает подписывать при увольнении соглашение, запрещающее критиковать компанию. В случае неподписания, сотрудник лишается опционов. Сам Даниэль отказался подписывать документ и лишился опционов стоимость 1.7 миллионов долларов.
После обнародования этих сведений Сэм Альтман вскоре заявил, что не знал о существовании этой практики и что отныне она прекращена.
Несколько бывших и нынешних сотрудников OpenAI, включая Даниэля, сформировали группу Whistle-Blowers (от английского — осведомителей). По задумке группа должна обеспечить исследователей и инженеров возможностью анонимно информировать регуляторов о своих опасениях касательно потенциальных рисках, связанных с ИИ.
Отчёт о будущем ИИ и сопутствующих рисках
Леопольд Ашенбреннер, бывший исследователь OpenAI, выпустил 165-страничный отчёт, в котором описывает свои прогнозы касательно развития общего искусственного интеллекта, а также риски, с которыми столкнётся человечество после его появления, включая политические.
По мнению исследователя, появление общего ИИ может произойти уже 2027 году. Далее благодаря этому произойдёт автоматизация исследований в области машинного обучения, что ускорит появление ИИ, который сможет решать задачи лучше, чем человек. Рост спроса на вычислительные ресурсы приведёт к увеличению вложений в энергетический сектор, разработку новых чипов и построение новых суперкомпьютеров.
Появление ИИ, превосходящего по когнитивным способностям человека, потребует оперативное решение задачи контроля беспрецедентно продвинутой и сложной системой.
🤖 «Системный Блокъ» @sysblok
Рассказываем, что произошло в мире ИИ за прошедшие две недели.
Qwen2 – новые лучшие открытые языковые модели
Компания Alibaba Group (владелица AliExpress, Taobao и ряда других площадок) представила второе поколение языковых моделей Qwen. Всего модель доступна в шести размерах: 0.5, 1.5, 7, 57 и 72 млрд параметров. Самая большая версия поддерживает 29 языков и по метрикам в основных тестах является лучшей на данный момент публичной доступной моделью. Все модели можно использовать в коммерческих целях.
Бывший сотрудник OpenAI рассказал о проблемах с безопасностью
Бывший исследователь OpenAI Даниэль Кокотайло, который занимался прогнозированием развития ИИ, дал интервью New York Times. Он рассказал об инцидентах внутри OpenAI, которые могут свидетельствовать о смещении фокуса с безопасного развития ИИ в пользу стремления победить в гонке за общим ИИ (он же AGI), способным решать широкий спектр задач не хуже или лучше человека.
По словам Даниэля, в 2022 году до релиза GPT-4 компания Microsoft (одна из главных инвесторов и партнёров OpenAI) дала доступ к модели пользователям из Индии до одобрения совета безопасности (Deployment Safety Board). В совет входили как сотрудники OpenAI, так и Microsoft. OpenAI не стала вступать в конфронтацию, опасаясь потери сотрудничество с Microsoft. До публикации этого интервью, Microsoft отрицала произошедшее, однако после подтвердила.
Что настораживает в решениях Сэма Альтмана
Опасения вызывает и намерение Сэма Альтмана, гендиректора OpenAI, привлечь существенные средства для разработки собственных вычислительных чипов, необходимых для обучения ИИ. Желание компании сильно увеличить вычислительные мощности может привести к резкому улучшению моделей, что противоречит политике компании, согласно которой ИИ должен развиваться постепенно.
Увольнение Сэма Альтмана из совета директоров и скорое возвращение его на пост в 2023 году усугубили ситуацию и ещё сильнее сместили фокус с безопасности. Многим из работников компании казалось, что увольнение Альтмана было мотивировано желанием правления замедлить разработку моделей в целях безопасности, против чего якобы и выступал Альтман. Такое представление о случившемся сильно поляризовало настроения в компании. Несколько недель назад ключевые сотрудники команды, ответственной за исследования способов контроля ИИ, ушли из компании.
Цена критики в OpenAI
Даниэль также рассказал, что OpenAI вынуждает подписывать при увольнении соглашение, запрещающее критиковать компанию. В случае неподписания, сотрудник лишается опционов. Сам Даниэль отказался подписывать документ и лишился опционов стоимость 1.7 миллионов долларов.
После обнародования этих сведений Сэм Альтман вскоре заявил, что не знал о существовании этой практики и что отныне она прекращена.
Несколько бывших и нынешних сотрудников OpenAI, включая Даниэля, сформировали группу Whistle-Blowers (от английского — осведомителей). По задумке группа должна обеспечить исследователей и инженеров возможностью анонимно информировать регуляторов о своих опасениях касательно потенциальных рисках, связанных с ИИ.
Отчёт о будущем ИИ и сопутствующих рисках
Леопольд Ашенбреннер, бывший исследователь OpenAI, выпустил 165-страничный отчёт, в котором описывает свои прогнозы касательно развития общего искусственного интеллекта, а также риски, с которыми столкнётся человечество после его появления, включая политические.
По мнению исследователя, появление общего ИИ может произойти уже 2027 году. Далее благодаря этому произойдёт автоматизация исследований в области машинного обучения, что ускорит появление ИИ, который сможет решать задачи лучше, чем человек. Рост спроса на вычислительные ресурсы приведёт к увеличению вложений в энергетический сектор, разработку новых чипов и построение новых суперкомпьютеров.
Появление ИИ, превосходящего по когнитивным способностям человека, потребует оперативное решение задачи контроля беспрецедентно продвинутой и сложной системой.
Please open Telegram to view this post
VIEW IN TELEGRAM
Тест: Из России – с данными
Насколько хорошо вы знаете… Россию? 12 июня предлагаем вам пройти тест о том, как цифры могут рассказывать о социальных проблемах в стране. Узнаете, в каком регионе уже несколько лет растет число разводов (спойлер:здесь замешаны выплаты родителям-одиночкам ), где сконцентрировано больше всего моногородов, которые появились ещё в СССР, и в каком городе в 1,5 раза выросло число убийств, но не трупов.
Мы подготовили этот материал на основе открытых данных проекта «Если быть точным» @tochno_st.
🤖 «Системный Блокъ» @sysblok
Насколько хорошо вы знаете… Россию? 12 июня предлагаем вам пройти тест о том, как цифры могут рассказывать о социальных проблемах в стране. Узнаете, в каком регионе уже несколько лет растет число разводов (спойлер:
Мы подготовили этот материал на основе открытых данных проекта «Если быть точным» @tochno_st.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Из России — с данными. Узнайте регион по статистике - Системный Блокъ
Тест о том, как числа могут рассказывать о социальных проблемах. Узнайте, насколько хорошо вы представляете себе Россию
Всемирная история картотек: как в эпоху Просвещения классифицировали знание
Во второй части материала об истории развития картотек с XVI века и до наших дней Антон Басов, сотрудник факультета компьютерных наук НИУ ВШЭ и исследователь истории науки и техники, рассказывает о методе Линнея и использовании игральных карт для каталогизации.
Как Линней использовал картотеку?
Из первого текста вы узнали о способах создания каталога знаний с помощью нанизывания фактов на крючки и разрезания конспектов на полоски. После Готфрида Лейбница карточки стали использовать для двух целей: исследований и создания библиотечных каталогов. Например, Карл Линней для бинарной классификации живых организмов каждое растение помещал на отдельный лист бумаги, а после сортировал их по семействам растений в ячейках особого шкафа.
Из чего делали карточки?
Линней использовал обычную писчую бумагу, а два других деятеля того времени — немецкий юрист Мозер и швейцарский писатель Лафатер — предпочли делать записи на оборотах игральных карт. Они были практичными и дешевыми, ведь их делали из плотной бумаги и выпускали в большом количестве.
Где появился первый карточный каталог?
Первый карточный каталог создала Австрийская библиотека. Перфект императорской библиотеки Готфрид ван Свитен был озабочен постоянно увеличивающимся количеством книг. Он и его помощник разработали свой метод: данные о книгах переписывались на отдельных карточках стандартного размера, они включали в себя название, имя автора, выходные данные, дефекты книги.
Как во Франции хотели упорядочить библиотеки?
В конце XVIII века в революционной Франции появляется идея создания общенационального библиотечного каталога. В Лувре создается Библиографическое бюро, которое просит департаменты переписать каталоги местных библиотек на оборотах игральных карт и в таком виде прислать в Париж. Однако реализовать идею не удалось, и ни один том нового каталога так и не вышел.
Сколько человек потребовалось, чтобы создать каталог Австрийской библиотеки из 50 тысяч книг? Почему крах проекта национальной библиографии во Франции отразил конец эпохи Просвещения? Обо всем этом читайте в полной версии статьи.
Время чтения: 11 минут.
🤖 «Системный Блокъ» @sysblok
Во второй части материала об истории развития картотек с XVI века и до наших дней Антон Басов, сотрудник факультета компьютерных наук НИУ ВШЭ и исследователь истории науки и техники, рассказывает о методе Линнея и использовании игральных карт для каталогизации.
Как Линней использовал картотеку?
Из первого текста вы узнали о способах создания каталога знаний с помощью нанизывания фактов на крючки и разрезания конспектов на полоски. После Готфрида Лейбница карточки стали использовать для двух целей: исследований и создания библиотечных каталогов. Например, Карл Линней для бинарной классификации живых организмов каждое растение помещал на отдельный лист бумаги, а после сортировал их по семействам растений в ячейках особого шкафа.
Из чего делали карточки?
Линней использовал обычную писчую бумагу, а два других деятеля того времени — немецкий юрист Мозер и швейцарский писатель Лафатер — предпочли делать записи на оборотах игральных карт. Они были практичными и дешевыми, ведь их делали из плотной бумаги и выпускали в большом количестве.
Где появился первый карточный каталог?
Первый карточный каталог создала Австрийская библиотека. Перфект императорской библиотеки Готфрид ван Свитен был озабочен постоянно увеличивающимся количеством книг. Он и его помощник разработали свой метод: данные о книгах переписывались на отдельных карточках стандартного размера, они включали в себя название, имя автора, выходные данные, дефекты книги.
Как во Франции хотели упорядочить библиотеки?
В конце XVIII века в революционной Франции появляется идея создания общенационального библиотечного каталога. В Лувре создается Библиографическое бюро, которое просит департаменты переписать каталоги местных библиотек на оборотах игральных карт и в таком виде прислать в Париж. Однако реализовать идею не удалось, и ни один том нового каталога так и не вышел.
Сколько человек потребовалось, чтобы создать каталог Австрийской библиотеки из 50 тысяч книг? Почему крах проекта национальной библиографии во Франции отразил конец эпохи Просвещения? Обо всем этом читайте в полной версии статьи.
Время чтения: 11 минут.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Всемирная история картотек: как в эпоху Просвещения классифицировали знание
Исследователь истории науки и техники, сотрудник Центра непрерывного образования факультета компьютерных наук НИУ ВШЭ Антон Басов специально для «Системного Блока» изучил, как развивалась идея библиотечного каталога с XVI века и до наших дней. Во второй…
О влиянии учёных на интерфейс и интерфейса на наш выбор, поведение и привычки: подборка интервью «Системного Блока»
Что хотят знать о нас учёные, следя за нашими действиями в интернете? Как это изменит выдачу нам контента умной лентой в соцсетях? И как повлияет на вид и расположение кнопок в приложении? Мы не замечаем работу антропологов, этнографов, социологов и многих других в виртуальном пространстве, но каждый день пользуемся результатами их труда. И каждый день это меняет нашу этику, взгляды и привычки.
Цифровая этнография и «дьявольский значок» уведомлений
Жизнь в окружении гаджетов и «забота» о нас алгоритмов интернет-пространства — добро, зло или просто наша новая реальность? Цифровой этнограф Аннет Маркхэм в интервью «Системному Блоку» рассказала, как умная лента может довести до трагедии, какие социальные стереотипы мы переносим в нашу виртуальную жизнь, что меняют в нашем поведении и восприятии Google и Netflix, а еще — как можно изучать самого себя в цифровой среде (и почему после этого люди начинают ненавидеть уведомления).
«И пусть все читают “Одумайтесь”»: Анастасия Бонч-Осмоловская о цифровом Толстом и пересборке DH после 24 февраля
Анастасия Бонч-Осмоловская ― лингвист, филолог, цифровая исследовательница, идейная вдохновительница и душа российских Digital Humanities. В своём интервью «Системному Блоку» она рассказала, как с помощью DH 2D — печатная книга превращается в 3D-вселенную творчества писателя. И как благодаря цифровым технологиям ты можешь показать рукописи глазами автора и прочесть их так, как читал первый редактор этих произведений, — без купюр, с сокращениями и непередаваемым авторским видением. А также о том, как события 2022 года повлияли на русскую часть DH-сообщества.
UX в(c) DH. Интервью про UX-исследования, Human-Computer Interaction и связь юикса с цифровой гуманитаристикой
Хороший интерфейс — это не про кнопки и красивый дизайн. Это про серьёзные научные исследования людей, их привычек и особенностей поведения, лежащих в основе любого цифрового продукта. О закулисье UX и о том, когда и почему разработчики отправляются за помощью к антропологам, социологам, врачам и лингвистам, «Системный Блокъ» подробно поговорил с Алексеем Евстифеевым, UX-исследователем, координатором проектной группы по UX в Пушкине <цифровом> от КБ «Собака Павлова», и Полиной Колозариди, академической руководительницей магистерской программы по DH в ИТМО.
🤖 «Системный Блокъ» @sysblok
Что хотят знать о нас учёные, следя за нашими действиями в интернете? Как это изменит выдачу нам контента умной лентой в соцсетях? И как повлияет на вид и расположение кнопок в приложении? Мы не замечаем работу антропологов, этнографов, социологов и многих других в виртуальном пространстве, но каждый день пользуемся результатами их труда. И каждый день это меняет нашу этику, взгляды и привычки.
Цифровая этнография и «дьявольский значок» уведомлений
Жизнь в окружении гаджетов и «забота» о нас алгоритмов интернет-пространства — добро, зло или просто наша новая реальность? Цифровой этнограф Аннет Маркхэм в интервью «Системному Блоку» рассказала, как умная лента может довести до трагедии, какие социальные стереотипы мы переносим в нашу виртуальную жизнь, что меняют в нашем поведении и восприятии Google и Netflix, а еще — как можно изучать самого себя в цифровой среде (и почему после этого люди начинают ненавидеть уведомления).
«И пусть все читают “Одумайтесь”»: Анастасия Бонч-Осмоловская о цифровом Толстом и пересборке DH после 24 февраля
Анастасия Бонч-Осмоловская ― лингвист, филолог, цифровая исследовательница, идейная вдохновительница и душа российских Digital Humanities. В своём интервью «Системному Блоку» она рассказала, как с помощью DH 2D — печатная книга превращается в 3D-вселенную творчества писателя. И как благодаря цифровым технологиям ты можешь показать рукописи глазами автора и прочесть их так, как читал первый редактор этих произведений, — без купюр, с сокращениями и непередаваемым авторским видением. А также о том, как события 2022 года повлияли на русскую часть DH-сообщества.
UX в(c) DH. Интервью про UX-исследования, Human-Computer Interaction и связь юикса с цифровой гуманитаристикой
Хороший интерфейс — это не про кнопки и красивый дизайн. Это про серьёзные научные исследования людей, их привычек и особенностей поведения, лежащих в основе любого цифрового продукта. О закулисье UX и о том, когда и почему разработчики отправляются за помощью к антропологам, социологам, врачам и лингвистам, «Системный Блокъ» подробно поговорил с Алексеем Евстифеевым, UX-исследователем, координатором проектной группы по UX в Пушкине <цифровом> от КБ «Собака Павлова», и Полиной Колозариди, академической руководительницей магистерской программы по DH в ИТМО.
Please open Telegram to view this post
VIEW IN TELEGRAM
Всемирная история картотек: движение к мировому стандарту
«Системный Блокъ» продолжает рассказывать о том, как развивалась идея библиотечного каталога с XVI века и до наших дней. В третьей части исследователь истории науки и техники, сотрудник Центра непрерывного образования факультета компьютерных наук НИУ ВШЭ Антон Басов рассказывает, как каталожные карточки и библиотечные коды стали мировым стандартом и как картотеки повышают работоспособность философов.
Картотеки и XIX век
Уже в начале XIX века картотеками активно пользуются писатели и ученые, с 1862 года доступ к картотечному каталогу появляется у студентов Гарварда, а с 1871 – у посетителей Бостонской публичной библиотеки. На пути к всеобщему распространению картотеки остаётся только одна проблема — отсутствие стандарта.
Появление стандарта
В 1877 году съезд Американской библиотечной ассоциации утверждает стандарт библиотечной карточки — 7,5×12,5 сантиметра. Он быстро становится сначала национальным, а затем – мировым. Этим мы обязаны прежде всего библиотекарю Мелвилу Дьюи: сначала он усовершенствовал систему классификации книг, а затем активно продвигал её, делая большие заказы у производителей бумаги и мебели и продавая карточки и шкафы по низким ценам.
Что изменилось в XX веке
К началу XX века ещё одной областью применения карточек становится бизнес. Уже к 1890 году Library Bureau Мелвила Дьюи получает первый заказ на картотеку от Emigrant Savings Bank. После этого фирма Дьюи успела наладить сотрудничество с американским правительством, создав картотеку для учёта данных преступников, а еще с компанией Tabulating Machine Co., предшественницей IBM.
Появляется новая разновидность бухгалтерии — loose-leaf accounting, то есть бухгалтерия на отдельных листах. Массово создаются новые конструкции папок-скоросшивателей, шкафов хранения документов, картотек.
Путь к всемирной библиографии
В 1895 году в Брюсселе появляется Международный библиографический институт, главной задачей которого было создание Универсального библиографического указателя, то есть каталога всех книг (а также прессы, фотографий, иллюстраций). С 1895 по 1934 год в нём накапливается 18 млн карточек, разделенных по разным областям знаний. Теперь любой человек мог направить в институт запрос на подбор библиографии по определённой теме. Правда, в 1934 году Международный библиографический институт лишился правительственного финансирования и закрылся.
Как с этой историей связана УДК (универсальная десятичная классификация)? Какое применение картотекам придумали химики? Чем Дьюи похож на Томаса Эдисона? Узнаете из полной версии статьи. А об идее картотек, первом каталоге, материалах для карточек и попытках упорядочить библиотеки узнаете из первой и второй частей материала.
Время чтения: 14 минут.
🤖 «Системный Блокъ» @sysblok
«Системный Блокъ» продолжает рассказывать о том, как развивалась идея библиотечного каталога с XVI века и до наших дней. В третьей части исследователь истории науки и техники, сотрудник Центра непрерывного образования факультета компьютерных наук НИУ ВШЭ Антон Басов рассказывает, как каталожные карточки и библиотечные коды стали мировым стандартом и как картотеки повышают работоспособность философов.
Картотеки и XIX век
Уже в начале XIX века картотеками активно пользуются писатели и ученые, с 1862 года доступ к картотечному каталогу появляется у студентов Гарварда, а с 1871 – у посетителей Бостонской публичной библиотеки. На пути к всеобщему распространению картотеки остаётся только одна проблема — отсутствие стандарта.
Появление стандарта
В 1877 году съезд Американской библиотечной ассоциации утверждает стандарт библиотечной карточки — 7,5×12,5 сантиметра. Он быстро становится сначала национальным, а затем – мировым. Этим мы обязаны прежде всего библиотекарю Мелвилу Дьюи: сначала он усовершенствовал систему классификации книг, а затем активно продвигал её, делая большие заказы у производителей бумаги и мебели и продавая карточки и шкафы по низким ценам.
Что изменилось в XX веке
К началу XX века ещё одной областью применения карточек становится бизнес. Уже к 1890 году Library Bureau Мелвила Дьюи получает первый заказ на картотеку от Emigrant Savings Bank. После этого фирма Дьюи успела наладить сотрудничество с американским правительством, создав картотеку для учёта данных преступников, а еще с компанией Tabulating Machine Co., предшественницей IBM.
Появляется новая разновидность бухгалтерии — loose-leaf accounting, то есть бухгалтерия на отдельных листах. Массово создаются новые конструкции папок-скоросшивателей, шкафов хранения документов, картотек.
Путь к всемирной библиографии
В 1895 году в Брюсселе появляется Международный библиографический институт, главной задачей которого было создание Универсального библиографического указателя, то есть каталога всех книг (а также прессы, фотографий, иллюстраций). С 1895 по 1934 год в нём накапливается 18 млн карточек, разделенных по разным областям знаний. Теперь любой человек мог направить в институт запрос на подбор библиографии по определённой теме. Правда, в 1934 году Международный библиографический институт лишился правительственного финансирования и закрылся.
Как с этой историей связана УДК (универсальная десятичная классификация)? Какое применение картотекам придумали химики? Чем Дьюи похож на Томаса Эдисона? Узнаете из полной версии статьи. А об идее картотек, первом каталоге, материалах для карточек и попытках упорядочить библиотеки узнаете из первой и второй частей материала.
Время чтения: 14 минут.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Всемирная история картотек: создание библиографических стандартов
Исследователь истории науки и техники, сотрудник Центра непрерывного образования факультета компьютерных наук НИУ ВШЭ Антон Басов специально для «Системного Блока» изучил, как развивалась идея библиотечного каталога с XVI века и до наших дней. Во третьей…
Туберкулез в России в цифрах и фактах
Весной мы рассказывали о том, как цифровые методы помогли ученым изучить туберкулез в России. Исследователи проанализировали связь между количеством заболевших в разных регионах и социальными факторами: размером их жилья, качеством воды и еды, финансовым благополучием и так далее.
Выяснилось, что чем напряжённее ситуация в регионе, тем меньше разнообразных социальных факторов влияют на заболеваемость. Зато те немногие, что влияют, оказывают определяющее влияние. И наоборот: в регионах, где заболевших не так много, на распространение болезни понемногу влияют самые разные факторы. Мы собрали статистику из исследования и обновили нашу инфографику: на карточках — наглядно о том, как связаны туберкулёз и качество жизни.
🤖 «Системный Блокъ» @sysblok
Весной мы рассказывали о том, как цифровые методы помогли ученым изучить туберкулез в России. Исследователи проанализировали связь между количеством заболевших в разных регионах и социальными факторами: размером их жилья, качеством воды и еды, финансовым благополучием и так далее.
Выяснилось, что чем напряжённее ситуация в регионе, тем меньше разнообразных социальных факторов влияют на заболеваемость. Зато те немногие, что влияют, оказывают определяющее влияние. И наоборот: в регионах, где заболевших не так много, на распространение болезни понемногу влияют самые разные факторы. Мы собрали статистику из исследования и обновили нашу инфографику: на карточках — наглядно о том, как связаны туберкулёз и качество жизни.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Девушки, живущие в сети: женщины-хакеры на экране
23 года назад вышел фильм «Пароль рыба-меч» — первый массовый фильм современности, целиком посвященный хакерству, и первое в XXI веке появление на экране хакерши. Мы решили изучить, как изменились образы женщин-хакеров за это время и что объединяет их экранные воплощения.
Кратко: о чём статья?
Пионером хакинга принято считать Джона Дрейпера по прозвищу Капитан Кранч, который взламывал телефоны с помощью пластмассового свистка в 1960-х — 1970-х. Одна из первых женщин-хакеров, Сьюзен Хэдли по прозвищу Гром, также начинала со взломов телефонов, а затем перешла на компьютеры голосовой почты Pacific Bell, заставляя людей раскрывать личные данные.
Что же касается кино, первые фильмы, где девушки хотя бы просто используют компьютер, появились только к концу 1980-х (для сравнения: мужчина-хакер оказался на экране уже в 1969). И только в 1990-х возник образ хакерши.
Фильм «Хакеры» 1995 года заложил визуальные каноны образа хакерши: андрогинность, короткие волосы, макияж «смоки айс» и пространство для интерпретации сексуальности героини. Более того, долгое время героини-хакеры оказывались на втором плане и помогали мужчинам в выполнении их важной и основной для сюжета фильма задачи. Изменить это удалось только в 2011 году благодаря выходу «Девушки с татуировкой дракона» Дэвида Финчера. Здесь героине до мужчин подчеркнуто нет дела.
Подробнее о будущем и настоящем хакерш в кино и о том, как это соотносится с гендерным неравенством в сфере IT, узнаете из полной версии статьи.
Время чтения: 7 минут.
🤖 «Системный Блокъ» @sysblok
23 года назад вышел фильм «Пароль рыба-меч» — первый массовый фильм современности, целиком посвященный хакерству, и первое в XXI веке появление на экране хакерши. Мы решили изучить, как изменились образы женщин-хакеров за это время и что объединяет их экранные воплощения.
Кратко: о чём статья?
Пионером хакинга принято считать Джона Дрейпера по прозвищу Капитан Кранч, который взламывал телефоны с помощью пластмассового свистка в 1960-х — 1970-х. Одна из первых женщин-хакеров, Сьюзен Хэдли по прозвищу Гром, также начинала со взломов телефонов, а затем перешла на компьютеры голосовой почты Pacific Bell, заставляя людей раскрывать личные данные.
Что же касается кино, первые фильмы, где девушки хотя бы просто используют компьютер, появились только к концу 1980-х (для сравнения: мужчина-хакер оказался на экране уже в 1969). И только в 1990-х возник образ хакерши.
Фильм «Хакеры» 1995 года заложил визуальные каноны образа хакерши: андрогинность, короткие волосы, макияж «смоки айс» и пространство для интерпретации сексуальности героини. Более того, долгое время героини-хакеры оказывались на втором плане и помогали мужчинам в выполнении их важной и основной для сюжета фильма задачи. Изменить это удалось только в 2011 году благодаря выходу «Девушки с татуировкой дракона» Дэвида Финчера. Здесь героине до мужчин подчеркнуто нет дела.
Подробнее о будущем и настоящем хакерш в кино и о том, как это соотносится с гендерным неравенством в сфере IT, узнаете из полной версии статьи.
Время чтения: 7 минут.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Девушки, живущие в сети: женщины-хакеры на экране - Системный Блокъ
23 года назад вышел фильм «Пароль “Рыба-меч”» — знаковая лента о хакерах с Джоном Траволтой. Это не только первый массовый фильм современности, целиком посвящённый хакерству, но и первое в XXI веке появление на экране хакерши. Мы решили вспомнить, когда женщины…