Системный Блокъ
10.8K subscribers
241 photos
2 videos
1 file
845 links
«Системный Блокъ» — издание о цифровых технологиях в культуре, искусстве, образовании и обществе.

Финалист премии «Просветитель»

sysblok.ru
vk.com/sysblok
fb.com/sysblok
instagram.com/sysblok/

Присоединяйтесь к команде: sysblok.ru/join
Download Telegram
​​Берлинале-2020 глазами российских и американских критиков
#arts #visualisation

29 февраля завершился 70-й Берлинский кинофестиваль. Программа вышла разнообразная — здесь и вызвавший этические споры в Берлине «Дау. Наташа», и новое переложение культового немецкого романа «Берлин, Александерплац» из 1920-х в контекст современной Европы, и многое другое. Иранская лента об ужасах тоталитарного режима «Зла не существует» получила в этом году главный приз — Золотого Медведя.

Вместе с журналом «Искусство Кино» @kinoartru «Системный Блокъ» подготовил инфографику с оценками фильмов конкурсной программы фестиваля. Мы использовали оценки российских критиков, собранные на сайте Искусства Кино, и Tomatometer — совокупный рейтинг сайта Rotten Tomatoes, составленный на основе отзывов американских критиков. Российские критики оценивали ленты по пятибалльной шкале, далее считалась средняя оценка для каждого фильма. Tomatometer представлен в виде оценки по стобалльной шкале, поэтому мы перевели её в пятибалльную шкалу для более удобного сравнения: например, у фильма «Первая корова» Tomatometer равен 91 из 100, т.е. (91/100) * 5 = 4,6 из 5.

Интересно, что российские критики оценили фильм-победитель Берлинале довольно сдержанно — на 3 балла. Американские критики и вовсе не уделяют ему должного внимания — рейтинг для этого фильма пока не доступен, как и ещё для пяти фильмов-участников (он становится видимым только после того, как ленту оценят хотя бы 5 экспертов).

Наибольший разрыв между оценками российских и американских критиков наблюдается у фильма «Чужак» («The Intruder») — средняя оценка российских кинокритиков составила всего 2,2 балла, в то время как рейтинг их американских коллег составил 3,8 балла (75 из 100). А вот оценка фильма «DAU. Наташа» Ильи Хржановского от российских критиков оказалась на полбалла выше, чем оценка американских — и это наибольший разрыв в обратную сторону.

Данные

1. Оценки фильмов, данные российскими критиками
2. Рейтинг фильмов с сайта Rotten Tomatoes
​​Проект OneSoil Map: как нейросеть помогает сельскому хозяйству
#visualisation

Про Никиту Хрущева шутили, что он запустил не только спутник, но и сельское хозяйство… Но с появлением искусственного интеллекта эти две сферы подружились: теперь спутниковые технологии работают на успех аграрного производства. Разбираемся, как искусственный интеллект и снимки из космоса помогают выбрать плодородное поле для посадки картошки.

Многие наверняка слышали о роли технологий в сельском хозяйстве. Это и альтернативные источники энергии, и генно-модифицированные организмы, и беспилотные машины для уборки урожая. С каждым десятилетием хозяйство вести все легче. У использования новых технологий в сельском хозяйстве есть название: точное (или «прецизионное», от англ. precision) земледелие.

Точное земледелие позволят эффективнее расходовать семена и удобрения, чтобы получать богатый урожай. Среди ресурсов, относящихся к точному земледелию, — проект OneSoil Map. Это карта всех полей Европы и США за три года, на которой видно, кто где что сажает и как и где развивается сельское хозяйство.

Карта — интерактивная, и работает на алгоритмах искусственного интеллекта и спутниковых снимках. Она располагает информацией о 60 миллионах полей и 27 культурах в 44 странах мира. Этот инструмент помогает фермерам, инвесторам и правительству в оптимизации отрасли сельского хозяйства.

Функционал OneSoil Map

При разработке сервиса OneSoil Map использовались снимки спутника Sentinel-2. Данные со спутника представляют собой около 250 терабайт информации о полях США и Европы. Спутниковые фотографии обработали следующим образом:

1. Сделали препроцессинг снимков: почистили облака, тени и снег. После этого этапа объем данных сократился до 50 терабайт.

2. Нашли границы полей, создали классификаторы для разных полей. Итог этого этапа — 250 гигабайт данных, содержащих векторные карты полей с сельскохозяйственными культурами.

3. Вычислили статистику, рейтинг и популярность разных культур в странах мира.

4. Для улучшения алгоритмов предоставили пользователям возможность уведомлять разработчиков о различных ошибках на картах.

При создании карт применялись два подхода. Во-первых, создали растровую карту: поделили карту на квадраты и выполнили последующий рендер в картинки. Браузер подгружает несколько картинок, а когда пользователь перемещается по карте — двигает их. Из плюсов — все поля отображаются без фильтрации, из минусов — растровые изображения довольно долго загружаются из-за большого объема файлов.

Во-вторых, создали векторную карту: анимировали векторные данные в браузере, как в картах Google и Yandeх. Из плюсов — можно использовать файлы меньшего объема, а также кастомизировать способ отображения данных.

Визуальная часть проекта также тщательно продумана. Для визуализации использовался сервис Mapbox. Для популярных культур выбрали контрастные цвета, для остальных — наименее контрастные. А чтобы привлечь к сервису внимание не только узких специалистов, разработали кнопку «рандомные красивые поля». Например, ниже прикреплена карта полей одного из регионов Франции.

В итоге разработчики стали первыми людьми, кто нанес на карту все поля США и Европы за три года, что не могло не привлечь внимание инвесторов, научных исследователей и фондов. Проект планируют развивать и дальше: цель на ближайшее будущее — автоматически распознавать поля и в остальных странах. Разработчики карты ведут блог, в котором пишут о мониторинге полей, экспериментах, больших данных и историях фермеров.

Колобов Денис

https://sysblok.ru/visual/kak-nejroset-sazhaet-kartoshku-iz-kosmosa/
​​Оттенки онлайн: новая жизнь каталога цветов XIX века
#visualisation

Как создать универсальный каталог цветов, когда цветная фотография еще не изобретена? Эта проблема стояла перед людьми на протяжении многих веков. Единственный возможный вариант — идентифицировать цвета с помощью словесного описания. В этом случае, чтобы избежать субъективности, было решено опираться на природные объекты, которые имеют соответствующие оттенки.

В конце XVIII века ученый-геолог Абраам Готлоб Вернер выпустил каталог минералов для идентификации их по ряду внешних признаков: весу, запаху, твердости или цвету. При этом он выделил 8 основных цветов и 55 дополнительных оттенков. Эту идею систематизации было логично применить и для художественных целей и по аналогии с каталогом минералов создать каталог цветов.

В начале XIX века такой проект был осуществлен. Шотландский художник-натуралист Патрик Сайм, основываясь на классификации Вернера, создал такой каталог цветов. Он был опубликован в 1814 году и содержал подробные описания 110 различных оттенков. Взяв за основу работу своего предшественника, Патрик Сайм добавил цветовые образцы и примеры того, где можно найти эти цвета в природе среди растений, животных и минералов. В результате получился наиболее полный для своего времени каталог, который приобрел широкую известность.

Конечно, в наши дни существует большое количество подробных и специализированных справочников по колористике. Тем не менее каталог Вернера по-прежнему представляет интерес и как объект изучения историков, и как полезный справочник для художников. Однако цвета, напечатанные на бумаге, со временем блекнут, а ведь именно они представляют наибольший интерес в данном случае. Одним из выходов может стать оцифровка издания, что и было сделано. Оцифрованный каталог цветов Сайма можно полистать в интернет-архиве проекта Гутенберг.

Однако использовать эту книгу для работы по-прежнему затруднительно. Во-первых, в ней есть много упоминаний о растениях и животных, которые могут быть неочевидны для неспециалиста. Например, для красновато-сиреневого (Red Lilac Purple) автор отсылает читателя к цвету точек на переднем крыле бабочки павлиний глаз, а для желтовато-серого (Yellowish Grey) — к веточкам барбариса. Во-вторых, при рассмотрении описания того или иного оттенка читателю придется все время перелистывать книгу, возвращаясь к описанным ранее цветам, что может показаться утомительным занятием.

Новая жизнь каталога

Николас Руже — веб-дизайнер, который специализируется на художественной обработке данных и их представлении в необычном и красивом виде. Одним из его проектов стало создание оцифрованной версии каталога Вернера, дополненного Саймом.

Сначала цветовые образцы из книги были отсканированы, а текст набран на компьютере. На этом этапе получился старый каталог в новом виде. Затем Николас Руже добавил фотографии тех растений, животных и минералов, которые были приняты за образцы автором каталога. Кликнув на определенный цвет, можно посмотреть, как он выглядит в природе.

Для каждого оттенка в каталоге Вернера указано, какие цвета надо смешать, чтобы его получить. Поэтому на следующем этапе работы в каталог были добавлены гиперссылки, чтобы можно было быстро переключаться между подробными справками о цветах и не искать их вручную. Кроме того, была создана единая схема смешиваний.

Ниже прикрепляем скриншот, на котором один из оттенков оранжевого охарактеризован с помощью цвета бородавчатого тритона. А полную версию каталога можно посмотреть на личном сайте-портфолио Руже.

Другие его проекты по визуализации включают оцифровку старинной книги с описаниями растений, упоминания названий оттенков в литературе, распространенность цветов на флагах различных стран, представление музыки в виде комбинации разноцветных точек разного диаметра и многое другое.

https://sysblok.ru/visual/ottenki-onlajn-novaja-zhizn-kataloga-cvetov-xix-veka/

Светлана Филатова
​​Визуализация: самые популярные книги библиотек Москвы
#visualisation

В библиотеках Москвы — более 11 млн книг. Учет всех книг ведется через единую систему, поэтому можно проанализировать, какие из них наиболее популярны среди читателей.

Лидеры в июне—июле 2020 года (по данным data.mos.ru):
• сатирический роман Андрея Волоса «Шапка Шпаковского» — у взрослой аудитории.
• «Конь с розовой гривой» Виктора Астафьева — у детей до 16 лет. Недавно произведение было включено в школьную программу.

В топе-10 самых популярных книг за 2014–2019 годы — современная российская проза. ­­­Первое место — «Авиатор» Евгения Водолазкина, второе — «Зулейха открывает глаза» Гузель Яхиной, а третье место делят «Любовь к трем цукербринам» Виктора Пелевина и «Обитель» Захара Прилепина. Из зарубежной литературы в рейтинг попал только роман «Сто лет одиночества» Габриэля Гарсиа Маркеса.

https://sysblok.ru/dataviz/markes-i-shest-let-rossijskih-pisatelej/

Павел Лебедев
Данные победы: подборка материалов «Системного Блока», посвященных исследованию Великой Отечественной войны
#best #research #visualisation

Каждый год перед 9 мая возрастает посещаемость сайтов ОБД «Мемориал», «Память народа» и «Подвиг народа». Это оцифрованные военные архивы с десятками миллионов записей об участниках Великой Отечественной — выживших или погибших на фронтах войны. В прошлом году «Системный Блокъ» поговорил с техническим руководителем этих проектов — Виктором Тумаркиным: https://sysblok.ru/interviews/my-vytaskivaem-ljudej-iz-nebytija/

У нас есть собственное исследование данных Великой Отечественной войны. В прошлом году мы обработали 26 млн карточек военно-пересыльных пунктов, с которых солдат отправляли на фронт, и таким образом посмотрели на историю ВОВ через историю призыва: https://sysblok.ru/history/neizvestnyj-soldat/

Теперь мы выпустили видеоверсию этого data-исследования: https://youtu.be/xJcPJ-QfE9A

Динамика призыва в годы войны в РСФСР

Также мы подготовили инфографику по нашему исследованию, прикрепляем ее ниже.

Самый большой подъем призыва ожидаемо совпадает с началом Великой Отечественной войны, он значительно превышает плановые призывы. Призыв начинается за несколько месяцев до июня, хотя плановый призыв должен был проходить ближе к осени. В РСФСР призывная кампания продолжалась до самого конца войны и ослабла только с июня 1945.

Четыре крупных пика связаны призывами на фронт новобранцев, родившихся в 1924, 1925, 1926 и 1927 году. Эти пики выделяются возрастным составом — они почти полностью состоят из молодежи.