Графики и жизнь
3.06K subscribers
250 photos
3 videos
7 files
108 links
Работаю в j.tinkoff.ru

Сайт — ourcountryindata.ru
Ютуб — youtube.com/c/gizhru
Блог — gizh.ru
Трансляция ВК — vk.com/gizhru

Для связи — @aretm
Download Telegram
Бомбануло от «фактчека», который «Медуза» сделала Навальному. В нем непонимание самых базовых вещей 😞

Когда пишут «ожидаемая продолжительность жизни» — что это значит «физически»? Кто там чего ожидает?

Это значит, что если сейчас родится человек, и на всем протяжении его жизни люди во всех возрастах будут умирать такими же темпами, как сейчас, то он проживет столько-то. В среднем.

«Ожидаемая продолжительность жизни при рождении», она же «ожидаемая продолжительность жизни», она же «средняя продолжительность жизнь», она же, в особо ленивых СМИ, просто «продолжительность жизни» — это важный показатель, который подытоживает огромные демографические таблицы смертности. Но это ИНТЕГРАЛЬНЫЙ показатель, как, например, рост ВВП для экономики. По нему невозможно понять, сколько живут люди.

Некоторое приближение к этому пониманию — распределение умерших по возрасту. Чтобы приблизиться еще ближе — надо смотреть смертность по каждому возрасту. Можно приблизиться еще ближе — да, вообще, надо больше двигаться и меньше есть.

#демография #теория
Рожают меньше и позже, продолжительность (активной) жизни растет, количество браков... — это все уныние.

Можно так: чем дальше — тем более плотным кольцом пап, мам, транс-дядь и биологических теть будет окружен ребенок. Зататуированных дедушек, их бывших жен и сводных, но бывших очень близкими, сестер покойных прабабушек.

Будет ли этот ребенок общаться с людьми, которые не в состоянии, условно, отправить СМСку через нейроинтерфейс умных часов, и как — другой вопрос.

Как социальный прогресс собирается догонять технологический — вот что интересно. Демография определенно сдувает пыль с концепции «глобальной деревни».

#мета #теория
Есть данные, что политические убеждения человека зависят от того, где и кем он работает. Не лично ваши, конечно. Вы — независимо мыслящий, совершенно рациональный человек. Но вот у большинства американцев — зависят.

В культуре, науке и айти больше леваков, демократов (ну кто бы мог подумать!). Чем «реальнее» сектор экономики (нефтяники, строители) — тем больше там консерваторов, правых.

К России этот подход тоже применим. С поправкой на то, что спектр политических взглядов не настолько одномерный, а все слова (левые и правые, либералы и консерваторы) значат не то, что в Штатах. Именно в этом я пытаюсь разобраться в серии видео «Структура нашего общества».

Политическая дискуссия имеет смысл, если начинается с точки «Если б я был тобой, я бы думал, как ты».

📊 Пересказ пары статей со ссылками — https://theotherlifenow.com/occupations-and-their-ideologies
📊 Ищут еще биологические основы политических убеждений, но это (в силу профессии) мне не кажется слишком убедительным https://en.wikipedia.org/wiki/Our_Political_Nature

#политика #теория
И вообще, есть миллион способов адекватно передать информацию о распределении социальных показателей без привязки к виду страны из космоса. Вот обзор картографических решений.

https://zen.yandex.ru/media/gizh/pravilnaia-karta-rossii-5b4279a78bcd5700a97723e0?from=channel

#теория #карта #регионы
Министра труда и соцзащиты Саратовской области уволили за то, что она сказала правду: на прожиточный минимум прожить можно.

Как считается ПМ? Врачи составляют меню, как нужно питаться человеку, чтобы его здоровье не ухудшалось. Это зависит от возраста и климата: 30-летнему вахтовику на Крайнем Севере надо больше калорий, чем пенсионеру на Черноморском побережье.

Экономисты ежеквартально считают, сколько стоит этот набор продуктов. По минимальным ценам в каждом регионе (мониторинг цен — отдельное большое направление государственной статистики).

Не едой единой жив человек. До 2013 непродовольственные товары и услуги тоже считались по научно разработанному нормативу: 3,75 пар трусов, 5 пар носков в год, новое пальто раз в 2,5 года, и так далее. Чтение этой таблицы доставляет какое-то особенное печальное удовольствие, но практического смысла в ней уже нет. Каждый квартал считать для каждого региона считать стоимость минимального набора носков... Явно лучше заняться чем-то более полезным.

Сейчас стоимость продуктовой корзины просто умножается на два — вот тебе и прожиточный минимум.

ПМ — один из главных параметров социальной политики.

📊Человек с доходами меньше 1 ПМ может получать пособие и льготы — он считается неимущим
📊С 2010 пенсия по старости не может быть меньше, чем 1 ПМ
📊С 2018 семьи с детьми получают льготы при доходах меньше 1,5 ПМ
📊С 2019 минимальная зарплата приравнена к 1 ПМ

Поэтому дискуссия о размере ПМ важна.

Сплю и вижу: коалиция КПРФ и «Справедливой России» вносит в Госдуму законопроект о том, чтоб для пенсионеров стоимость услуг считалась с повышенным коэффициентом (медицина!), и чтоб базовая стоимость продовольственной корзины для всех считалась по минимальным ценам умножить на 1,5. Потому что покупать все товары по минимальным ценам — это сколько свободного времени нужно, и расходов на транспорт.

А ЛДПР говорит, мол, надо добавить стоимость безлимитного мобильного интернета в ПМ, а литр молока в день убрать. И вообще пора ПМ выбросить к чертовой матери и вместо него везде брать 0,7 медианного дохода.

И эксперты по социальной политике в праймтайм Первого канала показывают графики и таблицы, пересказывают научные публикации, и опыт разных стран, и экономисты говорят, что на дистанции низкая стоимость труда (низкие зарплаты) снижает объем инвестиций, а без инвестиций только шиш с пальмовым маслом будет, а МРОТ завязан на ПМ.

И зрители голосуют, кто был убедительней, и это ни на что не влияет, потому что кому интересно вообще мнение телезрителей, но зато люди сформировали себе более-менее осмысленное мнение, высказались, и выдохнули. Мол, нам объяснили, с нами обсудили, нас спросили. Уважение и забота. Только депутат наш какой-то кретин, судя по дискуссии. Не будем такого в следующий раз выбирать.

Здоровый человек, у которого есть крыша над головой, нет иждивенцев, долгов, хронических болезней и прочих неприятностей, прекрасно проживет на ПМ. Так есть, и так написано в определении «прожиточного минимума». Виноват в этом закон об определении прожиточного минимума, а не хамоватый министр соцзащиты.

#росстат #теория #бедность
Профессор географии, специалист по региональной политике Наталья Васильевна Зубаревич пришла в эфир телеканала РБК-Омск, и ведущий спрашивает:

— А как себя Омск чувствует, по сравнению с другими регионами? Какой у нас экономический рост, социальное положение...

Господи Иисусе, РБК-Омск! Заходишь на страницу http://russia.duck.consulting/regions/55, там все важные показатели по Омской области. Как сейчас, как было раньше, в чем регион лидер, в чем отстает, как дела в целом по стране.

Если последние две цифры поменять на код другого региона, получится такая же страница про другой регион.

https://youtu.be/yl619lgGk0k

#регионы #теория #мета
Предлагаю баттл между Росстатом и открытыми источниками данных на тему «Сколько в России айтишников?».

Вопрос пусть остается туманным (кто такие «айтишники», что значит «в России»), сейчас интересно все, что можно сказать по этому поводу, это стадия сбора данных.

Вот что насчитал Росстат.

📊Разработчики программ, приложений, сайтов, системные аналитики, архитекторы, проектировщики и тестировщики ПО — 598 тысяч человек.
📊 Специалисты по базам данных, сетям, сетевой безопасности, системные администраторы — 251 тысяча человек.
📊 Специалисты по эксплуатации программ, сайтов, баз данных и сетей, (вебмастера, техники, техподдержка) — 154 тысячи человек.

Из этого 1,25 миллиона 20% работает в компаниях, для которых разработка ПО — основной вид деятельности, остальные — в других отраслях экономики (промышленность, услуги, госуправление, торговля и т.д.). Но на каждого из этих 20% приходится четыре человека вспомогательного (с точки зрения айтишников) персонала, то есть специалистов по айти и людей, работающих в айти-отрасли, примерно одинаково, ≈1,3 млн человек.

Росстат стабильно недооценивает число занятых в малом бизнесе и в неофициальном секторе (а граждане недооценивают качество работы Росстата), это +5–7% сверху. Руководителей айти-отделов, подразделений и фирм я бы тоже прибавил, это еще +5–7%.

Итого 1,38—1,43 миллиона человек, ≈2% от всех работающих. Примерно как врачей. Раунд.

КТО НЕ СЧИТАЕТСЯ

📊 Инженеры, архитекторы, математики, финансисты и прочие, кто, скорее всего, умеет писать программный код, но решает с его помощью какие-то свои специальные сверхзадачи.
📊 Пользователи компьютеров, например, дизайнеры, СММщики, журналисты.
📊 Инженеры, монтажники и ремонтники по телекоммуникациям и электронике.
📊 Прочие операторы компьютеров, машин и станков с компьютерами.

КАК СЧИТАЛОСЬ

Приведена численность начальных групп №№ 251, 252 и 351 по ОКЗ по изданию «Индикаторы цифровой экономики» (1). Это расчеты НИУ ВШЭ на основе неопубликованных данных Росстата, поэтому не могу сказать наверняка, по какой методологии они собраны.

Основа, скорее всего, — ежеквартальное «Обследование рабочей силы» (2), оно проводится на основе опроса 77 тысяч домохозяйств, отобранных пропорционально общей численности таких домохозяйств по данным переписи–2010, плюс отчетность, которую отправляют отделы кадров.

В ЧЕМ ИНТЕРЕС?

Важно понимать, насколько адекватны данные Росстата по занятости (а значит, по зарплатам, экономике и вообще за жизнь).

Еще мне кажется, что от айтишников зависит примерно все, и чем дальше, тем больше, поэтому очень важно, что происходит с отраслью. Сколько людей, чем занимаются, зародилось ли там самосознание.

(1) https://www.hse.ru/primarydata/ice2018
(2) http://www.gks.ru/wps/wcm/connect/rosstat_main/rosstat/ru/statistics/publications/catalog/doc_1140097038766

#росстат #теория #работа #IT
Можно ли доверять соцопросам? Смотрим, как один и тот же вопрос измеряют три разных социологических службы.

Видно, что динамику все отслеживают примерно одинаково, а конкретная цифра плавает ±5%, что в принципе тоже терпимо. Буду теперь доверять. Если есть таймлайн.

На всякий случай: ВЦИОМ — это государственная социология, Левада — официальный «иностранный агент», ФОМ — просто бизнес.

#социология #теория #история
Обычная «социальная карта» хороша только тем, что всем привычна, удобно найти свой регион. А информацию она передает так себе.

#теория #карта
В муниципалитетах с низким качеством жизни (безработица, меньше жилья, низкие зарплаты) смертность на 30-50% выше, чем в муниципалитетах с высоким качеством жизни, — выяснили авторы статьи, опубликованной в 2016 в журнале «Известия УрГЭУ».

Это немножко «ученые изнасиловали журналиста», потому что зависимость нашлась на жалких 4 муниципалитетах, 5 экономических и 5 демографических показателях, это ну несерьезно.

Но вообще интересно: имея сотни статистических показателей по двум тысячам муниципалитетов, можно же понять, какие из них и в какой мере влияют на, например, ту же смертность? Или это и так всем очевидно?

#смертность #города #теория
Статья, снижающая уровень доверия ко всем другим научным статьям. Прям какая-то статья-убийца!

29 команд самых настоящих учёных аналитиков из разных университетов мира получило один и тот же набор данных и один и тот же вопрос: «удаляют ли темнокожих футболистов с поля чаще, чем светлокожих?». Не знаю, зачем кто-то ведет БД цвета кожи футболистов, но вот, пригодилась.

В общем, 29 команд аналитиков подсчитало корреляции — и 20 команд сказали что да или скорее да, 9 — что нет или скорее нет (odd ratio 0.89–2.93).

Отвечая на достаточно простой и прямолинейный вопрос, имея на руках чистые достоверные цифровые данные, ученые не могут даже убедительно установить истину большинством голосов!

И чего тогда ждать от экономики, социологии, психологии, где все намного более туманно с точки зрения первичных данных? Вот уже и больше половины психологических и социологических экспериментов не воспроизводится, и медицинские исследования спонсируют пищевые корпорации, и сексуальная контрреволюция сужает поле исследований, и архитектура грантовой системы заставляет учёных показывать быстрые положительные результаты, и безалаберных и мошенников среди ученых вряд ли сильно меньше, чем в среднем по популяции, — матерь божья, куда же катится наука!

Да всё с ней, наверное, в порядке.

📊 Проблемы есть везде. В Америке вон внешний долг какой.
📊 То, что проблемы становятся известны — первый шаг на пути к их решению.
📊 Продолжать использовать количественные методы — единственный способ двигаться вперед.
📊 Так эти методы и совершенствуются.

Короче, дела — отвратительно. Дела становятся лучше.

Ссылка на статью — http://journals.sagepub.com/doi/pdf/10.1177/2515245917747646

#теория
МОЛНИЯ! СМИ СООБЩАЮТ: ⚡️ Разделы сайта Росстата не обновлялись несколько лет⚡️ СП уличила Росстат в больших тратах на плохо работающий сайт ⚡️ Счетная палата заподозрила Росстат в завышении стоимости обслуживания сайта

НО ВЫ НЕ ПОВЕРИТЕ СВОИМ ГЛАЗАМ КОГДА УЗНАЕТЕ ЧТО ПРОИЗОШЛО НА САМОМ ДЕЛЕ...

1

Значит, некоторые разделы сайта Росстата не обновляются. Некоторые. Этот нюанс пропал почти во всех перепечатках, поэтому подчеркну.

Какие не обновляются? "Календарь корпоративных событий", "Проектные офисы", "Часто задаваемые вопросы". Корпоративный булщит.

Нормативка, методология, календарь публикаций и сама статистика — обновляются, еще как. Вон скриншот приложил, что опубликовано за последние несколько рабочих дней.

2

Претензия Счетной палаты — что стоимость работы, оплаченной в 2,5 миллиона рублей за год, возможно завышена.

2,5 млн за год, 200 тысяч в месяц, возможно завышена. Вперед, отважные журналисты! Куда же нас выведет этот денежный след?...

Претензия — в нарушении по исполнению пункта "Системное сопровождение интернет-портала Росстата с обеспечением публикаций материалов центрального аппарата Росстата" в госконтракте. Что за системное сопровождение? Ну сходил в Гугл, нашел документ (этого года; проверка проводилась по прошлым двум).

Госконтракт на техподдержку сайта, общей стоимостью 34 млн (в этом году). Классическая техподдержка: интранет, сервера, базы данных, выгрузки-загрузки данных (в статистике немало цифр!). И вот один из десяти пунктов — публикация новостей Центрального аппарата, вот с ней налажали. Написали, что будут новости Центрального аппарата, а их на сайте нет. Совсем беда.

3

Первая публикация этой новости https://tass.ru/ekonomika/6387258 ссылается на некий неназванный бюллетень Счетной палаты, но в последних выпусках издания "Бюллетень Счетной палаты" ничего про Росстат не говорится.

Видимо, это слив фрагмента некоего будущего отчета. С удовольствием почитал бы целиком. Если самое большое нарушение Росстата по результатам проверки — плохо составленный пункт контракта в одной госзакупке, который даже нельзя оценить больше, чем на 2,5 миллиона в год, то Росстат большой молодец, все бы так работали.

4

Счетная палата нашла нарушений на 750 млрд за прошлый год. 750 млрд. И от некоторых нарушений, например, кто-то может умереть раньше времени.

Почему же эти 2,5 миллиона вообще стали НОВОСТЬЮ? В чем тут общественная значимость?

Росстат публикует данные, которые к нему стекаются из органов власти. Люди не доверяют власти — и злятся на Росстат. Гонец с плохими новостями. Который в игре кремлевских престолов "у кого лучше циферки" всем только мешает. Вот его и казнят.

Под улюлюканье общественности, которая верит опросам типа "Какой ты сегодня помидор" и что в нормальных странах все зарплаты выше средней.

#росстат #теория
Опубликован отчет о проверке Росстата Счетной палатой! И я слышал много историй, похожих на эту, но встретить такое в аудиторском отчете никак не ожидал.

Работаете вы, допустим, в какой-то компании. Приходит новый руководитель, говорит: "Вы все делаете неправильно, нелогично, устарело, не по эджайлу, я заново все придумал, вот вам распоряжения и приказы". На практике оказывается, что распоряжения неадекватные, невозможные, противоречат друг другу, не учитывают специфику работы, и работать по ним невозможно. А работу делать надо. Поэтому работаете вы по старинке, пока не отлажена новая система. Потом нового руководителя увольняют, или повышают за успешно проведенные реформы, в общем, куда-то он исчезает. И так вы и живете с Временным регламентом.

Через десять лет после начала реформ приходит новый руководитель, в лице Счетной палаты проводит аудит, и приходит к выводу, что как все работает - непонятно. Вот прямая цитата из отчета:

¯\_(ツ)_/¯

Ой, не та. Вот правильная:

"Невозможно оценить достаточность финансового обеспечения на реализацию Росстатом полномочий по сбору, обработке и предоставлению статистической информации в рамках подпрограммы «Официальная статистика», поскольку работы производственных планов Росстата на 2017 и 2018 годы не коррелируются с позициями Федерального плана статистических работ"

Не коррелируются! Нужны новые приказы и распоряжения.

Есть ожидаемые лулзы, типа непонятных подрядчиков, помещений, фактически сданных в аренду без договора аренды, ставках, различающихся в 10 тысяч раз от региона к региону (готов поспорить, что просто один регион отчитывается в рублях, а другой в тысячах рублей; в муниципальной статистике такое сплошь и рядом), но это всё как-то меркнет перед ослепительным блеском русской модернизации.

#росстат #теория
Занятный график: если вы, допустим, республиканец, а у власти демократы (или наоборот), то вам кажется, что преступность в стране растет¹. Когда к власти приходят свои, хорошие ребята, вам так перестает казаться.

При этом объективно преступность снижается вне зависимости от того, какая партия у власти².

И это, понятно, не про преступность, не про Америку, и даже не про СМИ, торгующие тревогой (большинству кажется, что преступность всегда растет), а про то, как эффективно предубеждения застилают мозг.

_____
¹ https://agadjanianpolitics.wordpress.com/2018/05/04/2016-elite-cues-and-public-misperception-about-crime/
² https://www.pewresearch.org/fact-tank/2016/11/16/voters-perceptions-of-crime-continue-to-conflict-with-reality/

#теория #государство
Сегодня опубликован отчет о теневой занятости россиян, подготовленный рейтинговым агентством «Национальные кредитные рейтинги» (входит в холдинг РБК). НКР проверил данные Росстата данными о сумме уплаченного НДФЛ и пришел к двум выводам:

📊 Численность занятых на самом деле не 72 млн, как считает Росстат, а 58 млн
📊 Средняя зарплата на самом деле не 39 т.р, как считает Росстат, а 31 т.р

Наемных сотрудников, за которых работодатель перечисляет НДФЛ, действительно 58 млн, — тут НКР славно поработало. Но вот то, что 72.1 млн Росстата — это численность занятых и в формальном, и в неформальном секторе экономики, коллеги не заметили.

На стр. 29 издания «Рабочая сила, занятость и безработица–2018» Росстат дает 72,1 млн занятых (Данные за прошлый год), а на стр. 40 расшифровывает:

📊 58.8 млн — наемные работники юридических лиц (то есть те работники, за которых работодатель переводит НДФЛ по форме №5-НФДЛ, и именно на них зациклился НКР)
📊 8.8 млн — занято у ИП
📊 3.5 млн — сами ИП, фермеры и прочие нотариусы
📊 1.1 млн — занятые в собственном огороде

То есть НКР не учитывает численность ИП, нотариусов, адвокатов, фермеров и проч., не учитывает их зарплату (очевидно большую, чем у среднего наемного сотрудника), и поэтому получает намного меньшую среднюю зарплату.

TLDR: у Маши 2 яблока, у Пети 1 Яблоко. Росстат говорит, что в среднем у нас два человека с 1,5 яблоками. НКР говорит: но ведь если мы не будем считать Машу, то у нас всего один человек, и яблоко у него в среднем одно! Нас обманывают!

#росстат #теория
Допустим, вы сделали тест на антитела к ковиду и тест показал, что антитела есть. Какова вероятность, что антитела у вас реально есть?

Это зависит от параметров теста: какие используются в Москве — не вполне ясно, Би-Би-Си предполагает, что это тест «Миндрей».

А ещё от того, какая доля населения в принципе имеет антитела. Если доля маленькая, то вероятность что вы получили случайно положительный результат намного выше, чем вероятность, что вы попали в такое множество, которое одновременно и имеет антитела, и получило истинно-положительный результат.

При 12,5% иммунного населения (как в Москве, по последним данным) и выбранных параметрах теста ответ на заданный вопрос — 77,8%.

ССЫЛКИ

Теорема Байеса
Параметры теста
Результаты тестирования
Расчёт

#коронавирус #теория
К слову о визуализации рейтингов книг, фильмов и всего такого.

В КиноПоиске (который давеча купил Яндекс) визуализация фильмографий отдельных актеров / режиссеров теперь строится на базе Яндекс.ДатаЛенс, и понятно почему это сделано, но сильно нагляднее, кажется, не стало.

Хорошо представленная информация делает сервисы удобнее и помогает решать бизнес-задачи.

#теория