Forwarded from Как устроены медиа (Алексей Березовой)
10 направлений, в которых искусственный интеллект помогает делать медиа
По материалам проекта JournalismAI Лондонской школы экономики
1. Создание новостей ← мы здесь
2. Журналистские расследования
3. Актуализация архивов
4. Понимание аудитории
5. Вовлечение и конверсия
6. Факт-чекинг и верификацию
7. Модерация комментариев
8. Оптимизация изображений
9. Управление рисками
10. Структурирование главного
Направление
Искусственный интеллект помогает делать контент / новости
Принцип работы: нейронная сеть ищет и определяет цитаты в первоисточниках, получает данные из открытых источников и пишет на их основе тексты / новости
Где применяется: The Guardian, Agence France-Presse, проект Radar (UK)
Какие инструменты используются*:
Spacy — библиотека с открытым исходным кодом для расширенной обработки естественного языка с использованием глубоких нейронных сетей.
Prodigy — веб-интерфейс для маркировки обучающих данных.
Создатель инструментов — компания Explosion.
* не ограничиваясь этими инструментами
Как выглядит процесс:
Для создания локализованных историй используются открытые наборы данных, которые сведены в таблицу по географическим районам.
Истории упаковываются в шаблоны, управляемые данными, которые включают фрагменты текста и логические правила if-then-else о том, как преобразовать данные в текст, специфичный для конкретного местоположения.
Структура историй схожа в разных версиях, но детали адаптируются к местным условиям.
При работе с цитатами для формирования массива исходных данных, новостные статьи размечаются тремя объектами: содержание (цитата в кавычках), источник (говорящий, которым может быть человек, организация и т.д.) и реплика (обычно глагольная фраза, указывающая на акт речи или выражения).
Как выглядит результат
«Данные Департамента транспорта показывают, что в 2017 году на дорогах Шропшира погибли 18 человек и 162 человека получили серьезные ранения», — говорится в тексте, написанном AI на основе данных о происшествиях в графстве Шропшир на Западе Англии.
Для чего ещё можно использовать AI
Создать пользовательский интерфейс для поиска цитат конкретных лиц или привязанных к событиям. Это позволит журналистам находить предыдущие цитаты, чтобы сверить их с текущими заявлениями или обогатить свои статьи.
Важный нюанс
Для того, чтобы обучать нейронку писать тексты в нужной ститлтике и правильно использовать цитаты, редакции вынуждены менять свои редполитики и руководства по стилю.
Читать по теме
→ 2020, Associated Press, Newsday What the AP and Newsday learned from automating coverage of 124 school districts
→ 2019, BBC News Stories by numbers: How BBC News is experimenting with semi-automated journalism
→ 2018, Press Association UK Press Association’s news service RADAR has written 50,000 individual local news stories in three months with AI technology
→ 2017, The Washington Post The Washington Post’s robot reporter has published 850 articles in the past year
Алексей Березовой
@glavred_izdatel
#JournalismAI #AI_in_media
По материалам проекта JournalismAI Лондонской школы экономики
1. Создание новостей ← мы здесь
2. Журналистские расследования
3. Актуализация архивов
4. Понимание аудитории
5. Вовлечение и конверсия
6. Факт-чекинг и верификацию
7. Модерация комментариев
8. Оптимизация изображений
9. Управление рисками
10. Структурирование главного
Направление
Искусственный интеллект помогает делать контент / новости
Принцип работы: нейронная сеть ищет и определяет цитаты в первоисточниках, получает данные из открытых источников и пишет на их основе тексты / новости
Где применяется: The Guardian, Agence France-Presse, проект Radar (UK)
Какие инструменты используются*:
Spacy — библиотека с открытым исходным кодом для расширенной обработки естественного языка с использованием глубоких нейронных сетей.
Prodigy — веб-интерфейс для маркировки обучающих данных.
Создатель инструментов — компания Explosion.
* не ограничиваясь этими инструментами
Как выглядит процесс:
Для создания локализованных историй используются открытые наборы данных, которые сведены в таблицу по географическим районам.
Истории упаковываются в шаблоны, управляемые данными, которые включают фрагменты текста и логические правила if-then-else о том, как преобразовать данные в текст, специфичный для конкретного местоположения.
Структура историй схожа в разных версиях, но детали адаптируются к местным условиям.
При работе с цитатами для формирования массива исходных данных, новостные статьи размечаются тремя объектами: содержание (цитата в кавычках), источник (говорящий, которым может быть человек, организация и т.д.) и реплика (обычно глагольная фраза, указывающая на акт речи или выражения).
Как выглядит результат
«Данные Департамента транспорта показывают, что в 2017 году на дорогах Шропшира погибли 18 человек и 162 человека получили серьезные ранения», — говорится в тексте, написанном AI на основе данных о происшествиях в графстве Шропшир на Западе Англии.
Для чего ещё можно использовать AI
Создать пользовательский интерфейс для поиска цитат конкретных лиц или привязанных к событиям. Это позволит журналистам находить предыдущие цитаты, чтобы сверить их с текущими заявлениями или обогатить свои статьи.
Важный нюанс
Для того, чтобы обучать нейронку писать тексты в нужной ститлтике и правильно использовать цитаты, редакции вынуждены менять свои редполитики и руководства по стилю.
Читать по теме
→ 2020, Associated Press, Newsday What the AP and Newsday learned from automating coverage of 124 school districts
→ 2019, BBC News Stories by numbers: How BBC News is experimenting with semi-automated journalism
→ 2018, Press Association UK Press Association’s news service RADAR has written 50,000 individual local news stories in three months with AI technology
→ 2017, The Washington Post The Washington Post’s robot reporter has published 850 articles in the past year
Алексей Березовой
@glavred_izdatel
#JournalismAI #AI_in_media