Журналистика данных
4.32K subscribers
1K photos
32 videos
16 files
1.29K links
Инструменты современных медиа, массивы информации, наблюдения и тренды
Download Telegram
Forwarded from Журналистика
This media is not supported in your browser
VIEW IN TELEGRAM
Очередной кейс от Bloomberg Graphics по теме коронавируса: отображение данных по случаям заболеваний и смертей от COVID-19 для американских штатов. Временной ползунок работает в диапазоне дат от 12 марта до 12 ноября этого года.

https://www.bloomberg.com/graphics/us-covid-regional-proximity-cases-deaths/#county-36001
Мир, разбитый на 100 прямоугольников по 1% мирового населения в каждом
Анализ твитов американских медсестёр о ковиде
https://precisionforcovid.org/providers
Визуализация смертей от ковида в США. Каждому умершему соответствует маленький шарик. Этими шариками c марта по ноябрь 2020 года заполняется ящик. Секунда визуализации соответствует 6 дням. Получилось очень наглядно
https://www.reddit.com/r/dataisbeautiful/comments/jv0wf4/oc_visualizing_covid19_deaths_as_spheres_in_a_tank/
Мы тут раньше помимо прочего занимались анализом медийных хайпов и их причинами, и отмечали:

В России важно отношение к Великой Отечественной войне и фашизму. Любые намеки на кощунство вызывают волну возмущения, которая, накладываясь на новизну, порождает хайп -- тут и уже упомянутый тверк в Новороссийске, и неуклюжий вопрос, а не стоило ли сдать Ленинград, и выступление уренгойского мальчика в бундестаге — https://xn--r1a.website/digitalfan/541

Случившаяся на днях дискуссия из-за "фэшн-съёмок" рядом с музеем Зои Космодемьянской подтвердила эти выводы. Подробнее об этом в репортаже @burrowingowlhttps://vz.ru/society/2020/11/17/1070963.html
Путешествие в направлении роста массы. От атома до всей Вселенной, транзитом через комара и корову
Что могли бы сделать журналисты с теми огромными массивами данных, которые появятся по итогам переписи в апреле-2021 ? Обычно процесс так и идёт: государство выкатывает массивы данных -- журналисты начинают искать там интересное. Это естественно. Журналистика данных родилась вслед политике государства по раскрытию данных, да иначе ей не из чего было и родиться -- ведь организовать полный сбор данных только государство и может.

Но есть нюанс. Раньше журналисты всегда отставали. Первая версия сайта госзакупок например, с которого у нас вообще всё началось, появилась в 2006-м, а бум заметок о закупках возник только в 2009-м.

Причин, кмк, две. На сайте закупок сначала был ужасный поиск -- искать можно было только по заголовкам тендеров, а по документации (где самое интересное) нельзя. Ну и не хватало ярких сенсаций, чтобы все увидели потенциал сайта закупок. Как только прогремели "золотая кровать МВД" и "поддельная кириллица", на сайт госзакупок потянулись караваны журналистов.

Аналогичный лаг, кстати, получился в истории с раскруткой Flight Radar 24. Он был создан еще в 2007-м, но всеобщую известность получил в 2010-м -- в связи с извержением Эйяфьятлайокудля, когда все бросились следить за бортами, летящими сквозь пепел

В целом мы продолжаем отставать от государственных открытых данных. Однажды давно я попытался посчитать, а сколько всего уже есть полезных баз -- досчитал примерно до 400 и сбился. Но тем интереснее случай с переписью -- здесь возникает шанс не отстать, поскольку Росстат обещает вместе с наборами данных выкатить удобное API -- обрабатывай данные не хочу. И кто не поленится подготовиться, тот сможет удивить конкурентов. "Ну надо же -- мы ещё новость толком не получили, а у них уже инфографика готова!"
Любопытные факты из области демографии. Почему не нужно переживать из-за экспоненциального роста населения Земли. Лекция одного из основателей "Врачей без границ", шведского врача и статистика Ханса Рослинга (по наводке @revealthedata)
https://vimeo.com/79878808
Курс математики на журфаке МГУ читают второй год — программу можно посмотреть по ссылке. Как она вам? На мой взгляд, всё в целом разумно, разве что добавить комбинаторики и логики — может быть, за счет сокращения количества времени на интегралы
http://www.journ.msu.ru/downloads/2020/AN_Mediakom_Osnovy%20vysshey%20matematiki.pdf
Иждивенцы и кормильцы. Районы, покрашенные жёлтым, создают более 50% ВВП США
Telegram-каналы банков, платежных систем и сотовых операторов
https://xn--r1a.website/GovInfo/222
Работа Федерики Фрагапане к 25 ноября — Международному дню борьбы против насилия в отношении женщин. Очень простая и наглядная графика (хотя данные по некоторым странам, думаю, было не всегда легко достать). Количество красных полосок — процент женщин в той или другой стране, подвергавшихся физическому или сексуальному насилию
https://www.behance.net/gallery/108475111/25-November
Оцените взлёт Новосибирска. И вообще красиво
Сегодня день рождения отмечает Борис Гребенщиков, один из родоначальников отечественной рок-музыки. Мы нашли одну из самых ранних его публикаций - 11 марта 1970 года ленинградская газета "Смена" опубликовала стихи ученика 9-го класса 239-й физико-математической школы Бориса Гребенщикова.
Поздравляем БГ с днём рождения!
О том, насколько сложна (или проста?) журналистика данных, рассказывает экономический журналист The New York Times Бен Кассельман.

Главные мысли:
— достаточно простого ноутбука;
— самый ценный инструмент дата-журналиста — городской телефон;
— одних данных мало, без людей истории нет;
— большая часть анализа данных — на языке R;
— вообще всем журналистам программировать не обязательно, но нужно хорошо разбираться в основах статистики.

Здесь перевод материала.

#журналистика #медиа #руководство #IT #NewYorkTimes #ИноСМИ
Forwarded from Журналистика
Премия для дата-журналистов Sigma Awards 2021 принимает заявки от участников со всего мира. Призовые $5000 будут разделены между победителями. Отмечается, что в этом конкурсе не будет категорий и ограничений по количеству работ-победителей — https://sigmaawards.website/rules/

В жюри — представители Reuters Graphics, The Economist, WSJ, Financial Times, Bloomberg и др.

Конкурс проводится при поддержке The Google News Initiative.
Отличный пример для лекции "Как накручивать цитируемость" -- дада, я понимаю, что и этот пост помогает накрутке, но уж больно яркая штука. Ну какой к лешему худший год в истории, вы че. Уверен, что и в Time это понимают. Просто хотят лайков и шеров -- в том числе критических и возмущенных
Сайт любителя "дурацких корреляций" Тайлера Виргена перезапустил свой сайт. По-моему, стало симпатичнее. Ясно видно: чем больше снимается фильмов с Николасом Кейджем, тем больше народу тонет в плавательных бассейнах. Корреляция двух показателей составляет аж 66% c хвостиком

Только мне не нравится, что Вирген называет эти корреляции spurious, то есть ложными или поддельными. Корреляции-то настоящие, только толку от них никакого -- ежу ведь понятно, что похожесть двух графиков чисто случайная. Так что лучше называть сами корреляции дурацкими (insane), а вот выводы о зависимости количества утопающих от Кейджа -- ложными.

Вообще у термина интересная судьба. Изначально это было простое латинское слово correlatio, которое означало "соотношение" или ту же самую зависимость чего-то одного от другого. Затем его забрали к себе в профессиональный словарь математики, придав ему числовой смысл, как меры той самой похожести графиков. Ну забрали, казалось бы, и пёс с ним

Проблема, однако, в том, что сейчас это слово вернулось в чиновничий и даже разговорный русский язык и употребляется оно для обозначения не похожести графиков, а как раз для зависимости и причинно-следственной связи между разными показателями. То есть, скажешь сейчас кому-нибудь, что Николас Кейдж коррелирует с количеством утопленников -- этот кто-то запросто может решить, что связь и правда есть

Причем на практике полно не таких очевидных и откровенно нелепых примеров. Давайте чуть усложним. Вытащите из холодильника редиску и огурец и каждые 5 минут измеряйте их температуры -- вы увидите, что они обе растут с корреляцией почти 100%. Значит ли это, что редиска нагревает огурец, или наоборот? Конечно, нет. Но чтобы понять, что же их нагрело, одной статистики мало -- нужно ещё немножко знать физику

Представляете, насколько сложнее вопрос с определением, от чего именно умер пациент -- от ковида или чего-то другого? И чем именно будут объясняться цифры, которые предстоящей весной покажет перепись населения -- тем же ковидом или наследием предыдущих поколений? Голой статистики для адекватных выводов здесь тоже не хватит. Чтобы понять, что от чего зависит, стоит обратиться не только к математикам, но и к биологам с медиками или, соответственно, демографам

А пока они размышляют, мы сделаем салат из редиски и огурца

http://www.tylervigen.com/spurious-correlations