Системный Блокъ
8.84K subscribers
239 photos
2 videos
1 file
800 links
«Системный Блокъ» — издание о цифровых технологиях в культуре, искусстве, образовании и обществе.

Финалист премии «Просветитель»

sysblok.ru
vk.com/sysblok
fb.com/sysblok
instagram.com/sysblok/

Присоединяйтесь к команде: sysblok.ru/join
Download Telegram
Подборка материалов «Системного Блока» ко Дню учителя

5 октября в России и других странах отмечают профессиональный праздник — День учителя (World Teachers' Day). Ко Дню учителя  «Системный Блокъ» сделал подборку статей, которые будут полезны преподавателям. В этих материалах мы рассказываем о тенденциях в современном образовании и конкретных профессиональных инструментах. 

Гендерный дисбаланс в школьном образовании

По данным Министерства просвещения РФ, больше всего мужчин среди учителей ОБЖ, а самые «женские» дисциплины — русский язык и литература. Если не считать педагогов начальной школы: там учителей-мужчин всего 0,7%. О том, как эта ситуация различается в частных и государственных школах и в каких регионах преподавателей-мужчин аномально много, узнаете из нашего поста.

Цифровые технологии помогают преодолеть образовательное неравенство

По данным ООН, закрытие школ во время пандемии, сокращение и автоматизация рабочих мест негативно повлияли на равноправие женщин и мужчин. В статье мы рассказываем о том, как онлайн-образование сокращает этот разрыв. Например, цифровые технологии помогают вовлекать девочек в STEM (новый подход, в котором естественные науки, техника, инженерия и математика объединены в одну систему). А работа в EdTech (от англ. Education Technology — технологии в образовании)  становится одним из самых открытых для женщин карьерных направлений в IT.

Мотивирует ли учеников виртуальная валюта?

Геймификация — одна из тенденций современного образования. Школы и преподаватели заимствуют у игровой индустрии разные способы мотивации учащихся. Среди них — внедрение виртуальной валюты, которую ученики получают за выполнение заданий. О том, как она влияет на образовательные результаты, узнаете из нашего поста

Цифровые технологии делают образование более доступным

Каждый человек имеет право на образование, но не всем легко его получить.  Несмотря на то, что в России, как и в Европе, инклюзивное образование начало развиваться с 1960-х годов, до сих пор полностью решить проблему доступности обучения для людей с физическими или ментальными особенностями здоровья пока не удалось. Цифровые технологии позволяют ещё на один шаг приблизиться к этой цели. 
В нашем материале вы найдёте примеры успешного применения инклюзивных технологий в школах и университетах России и других стран. А ещё узнаете об адаптивных технологиях, которые подстраиваются к уровню знаний и способностей ученика. 

Как использовать дипфейки в образовании?

Ещё один инструмент для увеличения вовлечённости на занятиях — дипфейки. Это технология создания реалистичных аудио, фото и видео на основе искусственного интеллекта. При помощи дипфейков можно, например, «оживить» персонажа обсуждаемой книги или создать обучающий курс с меньшими затратами со стороны учителя. Способами применения дипфейков в образовании делимся здесь

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Большие изменения в OpenAI, долгожданное обновление голосового режима GPT, новые LLama

Рассказываем, что произошло за последнее время в мире ИИ.

Исход людей из OpenAI продолжается

25 сентября Мира Мурати, техническая директриса OpenAI, сообщила о своём увольнении. Этот пост Мира занимала шесть с половиной лет, а уход объяснила стремлением разобраться в собственных желаниях и целях.

1 октября один из сооснователей OpenAI Дёрк Кингма рассказал, что присоединился к Anthropic, главному конкуренту OpenAI. Ранее мы также писали об уходе ключевых сотрудников из компании. Таким образом, из четырёх главных лиц компании в штате остался только генеральный директор — Сэм Альтман.

Новый голосовой режим GPT и другие обновления от OpenAI

На недавней презентации для разработчиков компания объявила о запуске обновления голосового режима, благодаря которому GPT может проявлять эмоции, смеяться и петь во время беседы. Релиз обновления состоялся ещё в мае, однако из-за сложностей с правами на голос Скарлетт Йоханссон и мер безопасности обновление стало доступно только сейчас в США и Великобритании. Пользователи из Европейского союза не смогут протестировать нововведения из-за законов, регулирующих ИИ.

Также на презентации OpenAI рассказала о нескольких новых сервисах: Realtime API, который позволит генерировать аудиоответы GPT на текстовые/голосовые вопросы пользователей в реальном времени; возможность дообучать GPT на изображениях (раньше можно было только на текстах), а также дообучать их модели, используя другие (например, обучать маленькую GPT на ответах большой версии).

Новые LLama

Компания Meta* пополнила семейство моделей LLama. Теперь пользователям доступны две компактные LLM: с 1 и 3 млрд параметров. Обе модели были обучены для работы с текстами на разных языках и по качеству несущественно уступают большим версиям LLama. Благодаря своим компактным размерам модели можно использовать на мобильных устройствах.

Помимо этого были представлены две LLM, способные работать не только с текстами, но и с изображениями, в размерах 11 и 90 млрд параметров. По показателям в основных тестах модели сопоставимы с конкурентами.

Все модели доступны для скачивания и коммерческого использования, однако официально модели недоступны на территории Европейского союза.

Google обновила свои LLM

Компания Google обновила свою флагманскую LLM Gemini Pro и компактную модель Gemini Flash. Обе языковые модели теперь могут работать с более длинными текстами: Gemini Pro поддерживает 2 миллиона входных токенов против миллиона у предыдущей версии (токен — единица измерения текста), а Gemini Flash — 32 тысячи против восьми тысяч предшественника. Обновлённые модели существенно лучше в понимании текстов и изображений, а Flash стала ещё быстрее.

*Компания Meta признана экстремистской, а её деятельность запрещена на территории РФ


🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Пионеры нейросетей и глубинного обучения получили Нобелевскую премию по физике

Нобелевский комитет в Стокгольме объявил лауреатов Нобелевской премии 2024 года по физике. Ими стали «крестный отец диплернинга» Джеффри Хинтон и Джон Хопфилд, создатель нейронных «сетей Хопфилда». Оба исследователя занимались нейронными сетями с 1980-х годов. При этом нейросетевые алгоритмы десятилетиями оставались маргинальной областью машинного обучения, многие считали их тупиковым и бесперспективным направлением. Благодаря деятельности таких ученых, как Хинтон и Хопфилд, исследования нейросетей продолжались и привели к расцвету LLM в наши дни.

Хотя заслуги обоих исследователей в области искусственного интеллекта и компьютерных наук не вызывают сомнений, в научном сообществе уже идут горячие споры о том, уместно ли вручать за эти заслуги Нобелевскую премию по физике. Вероятно, решение комитета продиктовано тем, что исторически Нобелевская премия не имеет математической номинации, и физика была единственной номинацией, с которой получилось связать работу Хинтона и Хопфилда. В любом случае, мы как энтузиасты развития машинного обучения и искусственного интеллекта поздравляем всю эту область с таким признанием.

А если вам интересно, за что вообще дают “нобелевки”, где нужно родиться, в каком университете работать и до скольких лет ждать, чтобы получить признание Нобелевского комитета, то можете перечитать наше прошлогоднее дата-исследование:

https://sysblok.ru/visual/recept-nobelevskoj-premii-issleduem-otkrytye-dannye-o-laureatah/

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Все художественные тексты похожи друг на друга: как сюжетные тенденции выражаются на уровне слов 

Герой покидает дом в поисках чего-то ценного. Герой находит большую любовь в конце истории или, наоборот, трагически погибает. Таинственный незнакомец приносит вести, становящиеся фундаментом для завязки сюжета. Вы наверняка встречали такие ходы во множестве сюжетов. А как выглядит «усреднённая» история? Существуют ли слова, которые наиболее характерны для завязки или финала книги? Попробуем разобраться, используя методы цифровой гуманитаристики!

Кратко: о чем статья?

Вы наверняка слышали о формуле волшебной сказки от Владимира Проппа, четырех типах сюжетов Хорхе Борхеса или 36-ти драматических ситуациях Жоржа Польти. Все они изучали сходства сюжетов художественных произведений. 

Современные исследователи, Бен Шмидт и Дэвид Макклюр, задавались похожими вопросами, но применяли методы цифровой гуманитаристики. Мы решили последовать их примеру и изучить корпус русскоязычной художественной литературы, собранный в рамках проекта СОЦИОЛИТ, в котором можно найти тексты от Карамзина до Солженицына. 

Оказалось, что русскоязычные и англоязычные тексты очень во многом похожи: и те, и другие произведения чаще всего начинаются с описания «характеристик» героев, семейных обстоятельств и места жительства. Зато вероятность найти любовь или погибнуть заметно возрастает к концу текста. Удивительно, но даже на месте очень частотного русскоязычного «гостя» возникает англоязычный stranger. Это выглядит так, что в европейском лингвокультурном коде есть единое понимание того, что может являться завязкой сюжета и наиболее интересно читателю, а что тяготеет к драматичному финалу или развязке произведения.

Проследить за ходом исследования и посмотреть, в какой части текста чаще встречается «лошадь», а в какой – «Россия», можно благодаря полной версии материала.

Время чтения: 10 минут.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Как делать большую науку в бесконечном бегстве: Роман Якобсон vs XX век

Сегодня день рождения Романа Якобсона — человека невероятной судьбы, одного из главных русских лингвистов XX века и настоящего гражданина мира. Постоянная вынужденная миграция не помешала Якобсону развивать фонологию, исследовать русский авангард, заниматься сербо-хорватским эпосом, изучать нейрофизиологические нарушения речи и создавать работы, которые окажут влияние на Леви-Стросса. Вспоминаем его биографию в нашей статье.

Кратко: о чем статья?

Якобсон родился в 1896 году и уже в 19 лет стал сооснователем Московского лингвистического кружка. В нём обсуждали проблемы теории и истории литературы, теории и истории языка, следили за всеми достижениями западноевропейской лингвистики.

В 1920-х годах Якобсон эмигрировал в Прагу и продолжил заниматься наукой там. В конце 1930-х, когда город был оккупирован нацистами, Якобсон пытался получить документы на выезд в Данию и писал, что хотел бы использовать месяцы в Копенгагене, чтобы закончить свою книгу о структуре и классификации фонем. В 1941 добрался до Нью-Йорка, где стал соучредителем… Нью-Йоркского лингвистического кружка. А затем преподавал в Гарвардском университете и Массачусетском технологическом институте.

Якобсон продолжал работать над исследованиями независимо от своего местоположения и проблем, которые ему преподносила история XX века. Подробнее о его работе и её обстоятельствах узнаете из полного текста материала.

Время чтения: 13 минут.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Что изучают антропологи в интернете? Подборка материалов «Системного Блока»

Развитие интернета и цифровых технологий открыло новое поле исследований для антропологов. Учёные осознали, что в онлайн-среде формируются уникальные сообщества, культуры и практики, которые можно и нужно изучать. 

Публикуем подборку наших материалов о цифровой антропологии. Из неё вы узнаете, какие методы можно применить к исследованию интернет-пространства, как за последние 40 лет изменились интернет-интерфейсы и зачем собирать слухи в соцсетях?

Этнография в цифровую эпоху: от полей к потокам, от описаний к воздействию

Для начала погрузимся в общие проблемы цифровой антропологии и этнографии и почитаем статью профессора информационных наук Аннет Маркхам. Она специализируется на изучении цифровых пространств и предлагает исследователям новые понятия и методы для работы с онлайн-средой. Несмотря на доступность больших данных и популярность количественных исследований, она подчеркивает важность качественных методов и объясняет, как важно сохранить чувствительность к человеческим голосам и культурам в условиях цифровизации. Мы наблюдаем новые перспективы в цифровой этнографии, где традиционные подходы переплетаются с инновационными методами исследования, пишет Маркхам.

Интернет как способ существования и Big Data как угроза

Во второй части статьи профессор Аннет Маркхам углубляется в опасности, которые несет «датафикация» человеческого опыта. Хотя большие данные и полезны для анализа сложных социальных процессов, важно помнить о культурных и локализованных смыслах, которые могут ускользнуть при чрезмерном увлечении цифрами. Маркхам призывает учёных к социальной ответственности, особенно в тех случаях, когда исследователи консультируют индустрию IT. Ведь технологии могут не только улучшать, но и ограничивать нашу жизнь.

«Цифровой антрополог отличается от Data Scientist’а вниманием к деталям»


В интервью «Системному Блоку» заместитель руководителя Центра городской антропологии КБ «Стрелка» Дарья Радченко рассказывает, как пандемия COVID-19 изменила повседневные практики людей и оставила свои следы в цифровом пространстве. Используя данные из соцсетей, она показывает, как люди заново открыли для себя свои спальные районы во время самоизоляции, и размышляет над ограничениями Data Science в социальных исследованиях. 

Зачем фольклористы и социальные антропологи собирают слухи и считают репосты

В завершение подборки — интервью Александры Архиповой (признана иноагентом в РФ), в котором она раскрывает ещё одну грань цифровой антропологии — сбор слухов и исследование конспирологических теорий. Архипова объясняет, как цифровые базы данных помогают в исследовании фольклора и почему важно учитывать как количественные, так и качественные методы. Она приводит примеры из повседневной жизни: лозунги митингующих, народные рецепты лечения COVID-19 — и подчеркивает, насколько многослойными могут быть цифровые и социальные феномены. Этот материал позволяет взглянуть на антропологию через призму современной культуры и социальных изменений.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Знаете ли вы термины машинного обучения?

Проверяем вместе с сегодняшним опросом. В коротком описании мы заменили на Х один из ключевых терминов машинного обучения. Постарайтесь догадаться, что мы здесь зашифровали, а вечером мы расскажем не только об Х, но и о четырех других важных понятиях.

Описание:


Х — это набор данных, который используется для обучения или анализа модели. Х содержит входные данные и — опционально — выходные данные, которые модель должна предсказать. В случае, когда выходные данные присутствуют, их называют разметкой, а саму Х — размеченной. 

Примеры Х с разметкой: изображения цветов и их названия, песни и их жанры, аудиодорожки и их расшифровки.

Примеры Х без разметки: списки просмотренных видео пользователей YouTube, набор текстов одного писателя.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Какое слово мы спрятали под Х в посте выше?
Anonymous Quiz
3%
лемматизация
17%
генеральная совокупность
72%
выборка
8%
кластеризация
5 слов машинного обучения

Объясняем основные термины машинного обучения из глоссария «Системного Блока». Из первой части материала узнаете о языковых моделях, нейросетях и выборках, на которых их обучают.

Машинное обучение 

Машинное обучение — это набор методов, которые позволяют компьютеру решать задачи, не используя заранее заданный человеком алгоритм решения. Например, машинное обучение позволяет обучить компьютер отличать кошек от собак на фотографиях, хотя у компьютера нет конкретных инструкций, вроде «если есть острые уши и усы, то это кошка».

Вместо инструкций и правил компьютеру «показывают» много разных примеров с ответами. В случае с классификацией животных образцом будет изображение кошки или собаки с правильным названием объекта.

Когда компьютеру показывают примеры, он обучается извлекать из них не только все необходимые закономерности, но и информацию о том, как использовать эти закономерности для решения задачи. Машинное обучение изучает методы обучения. Набор примеров образует выборку, а результатом процесса обучения является обученная модель.

Модель

Модель — это математическое описание зависимости между входными данными и выходными. В задаче классификации кошек и собак входные данные — это изображение, а выходные данные — название животного на изображении. Другой пример: входные данные — дата, выходные данные — температура воздуха в этот день. 

Есть много способов описывать зависимости математически. Каждый способ имеет определённые свойства и подходит под определённый вид зависимости. Например, в экономике зачастую используют линейные модели, которые описывают пропорциональное изменение выходной величины (количество товара) при изменении входной величины (цены/спроса и т. д.).

Примеры других популярных моделей, помимо линейных: деревья решений, случайный лес, нейросети.

Выборка

Выборка — это набор данных, который используется для обучения или анализа модели. Она содержит входные данные и — опционально — выходные данные, которые модель должна предсказать. В случае, когда выходные данные присутствуют, их называют разметкой, а саму выборку — размеченной. 

Примеры выборок с разметкой: изображения цветов и их названия, песни и их жанры, аудиодорожки и их расшифровки.

Примеры выборок без разметки: списки просмотренных видео пользователей YouTube, набор текстов одного писателя.

Существует и более широкое определение выборки, о котором можно прочитать в другом нашем материале.

Нейросеть

Нейросеть — это один из видов моделей машинного обучения. Её отличительная черта — способность описывать самые разные зависимости, за счёт чего нейросети можно использовать в большом количестве задач.

Ещё нейросети можно дообучать на новых данных. Например, модель, которая умеет определять вид растений, можно относительно легно обучить распознавать новый вид.

Наконец, нейросети хорошо масштабируются: при правильном увеличении количества параметров и обучающих данных качество нейросети растёт.

Языковая модель

Языковая модель — модель машинного обучения, которая при данном ей контексте предсказывает для каждого слова в языке вероятность того, что оно является продолжением данного контекста. Простейший пример такой модели — это набор текста в смартфонах. 

Современные языковые модели (вроде GPT) могут не только оценивать вероятность продолжений, но и следовать инструкциям пользователя, например, кратко пересказывать текст и оценивать его эмоциональную окраску. Такие способности у модели появляются за счёт дополнительного дообучения на выборке из инструкций и соответствующих ответах. Такое обучение называют инструктивным.

Благодаря выразительной способности языка и инструктивному обучению языковые модели могут выполнять широкий спектр задач. Подробнее об этом можно узнать в нашем материале.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Гендерное неравенство в литературе: от персонажей до писательниц

Проблема гендерного неравенства заметна во всех сферах общества — в том числе в литературе. Писательниц было традиционно меньше, чем писателей, сюжетные линии между персонажами разного пола представлены неравномерно, а гендерные стереотипы касаются и героев, и героинь произведений.

В подборке материалов «Системного Блока» мы рассказываем о роли женщин в литературном процессе и о том, почему представители обоих полов по-разному воспринимаются как авторами, так и читателями.

Толстой и Пушкин — сексисты? 

В первой части корпусного исследования мы изучали, есть ли гендерное неравенство в русской классической литературе. Вы узнаете, как описывали мужчин и женщин Толстой, Достоевский и Пушкин. Например, что женщины не только чаще «устают», но и чаще «исчезают». А еще женщины и мужчины в русской лиетратуре зачастую по-разному говорят и любят: это помогли понять прилагательные и глаголы. Подробнее – здесь

Кстати, в этом исследовании мы не рассматривали «Повести покойного Ивана Петровича Белкина» и «Капитанскую дочка», но написали про них отдельный материал.

Набоков и Булгаков — сексисты? 

Это вторая часть корпусного исследования русской классики, но более поздней: в неё вошли тексты Владимира Набокова и Михаила Булгакова. Прочитав статью, вы узнаете, насколько сильно изменилось описание мужчин и женщин в русской литературе за столетие. К примеру, мужчины у Набокова стали более эмоциональными, а женщины в романах Булгакова чаще говорят и действуют. Это что, проблески равноправия?

А что в английской литературе?

В XX веке шла усиленная борьба за права женщин, и, казалось бы, за ней должны были последовать изменения и в литературном процессе: увеличение количества авторов-женщин и более достоверная репрезентация женщин в произведениях. Однако исследователи, применив методы машинного обучения на материале английской литературы, доказали обратное. О том, всегда ли были такие тенденции в книгах на английском языке, читайте в нашем материале.

Автор или авторка: влияет ли пол автора на восприятие произведения?

Важен ли пол автора для читателя? Оказывается, да! Чем отличаются произведения авторов-женщин от произведений авторов-мужчин? Как пол читателя влияет на оценку книг, написанных женщинами? Мы кратко описали эксперименты и результаты исследования Корнелии Кулен, автора (авторки?) книги Reading beyond the female: The relationship between perception of author gender and literary quality.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Тест: Угадайте произведение по частотным словам из Национального корпуса русского языка

С помощью НКРЯ можно выявить слова, которые чаще встречаются в каком-то одном произведении, чем во всём остальном корпусе. Некоторые из них могут быть совсем не примечательны (например, «улыбка» в «Войне и мире»), а некоторые сразу выдают текст (как «черномор» в «Руслане и Людмиле»). Мы постарались найти золотую середину и собрали для вас по пять слов из текстов школьной программы. Благодаря тесту вспомните (или узнаете):

🎁 где часто встречались «дар» и «друг»;

🪆 кто писал про «Русь» и «дрянь»;

🐸 какой классический текст можно определить по слову «лягушка»;

📚 и многое другое!

Пройти тест

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM