Ах, этот Минфин
1.05K subscribers
304 photos
3 videos
12 files
350 links
Заметки о новостях открытых финансовых данных, устройстве госфинансов и качестве открытых данных.
Для вопросов: http://xn--r1a.website/k0shk
Download Telegram
Если верить отчету об исполнении федерального бюджета на 1 сентября 2019 года, опубликованному на сайте Федерального казначейства, расходы федерального бюджета состоят только из внебюджета (см. скриншот).

Хотела написать об этом в Казначейство, но так и не удалось отправить запрос, т.к. он блокируется системой защиты. Судя по поясняющему тексту, есть три частых причины блокировки:

1. "Использовать можно только буквы русского и английского алфавита, символы цифр, а также точку и запятую" (в моем запросе были ":" и "//". Исправила, не помогло).

2. "Прикрепленный файл имеет некорректное название, содержит произвольный набор символов" (прикрепленный файл скачан с этого же сайта Казначейства и прикреплен без изменений. Тем не менее, исправила название, не помогло).

3. "Текст обращения был скопирован из другого текстового редактора" (Первое обращение было написано с нуля, а в последующих текст был скопирован из формы обращения сайта Казначейства. Исправила, не помогло).

Последняя возможность сделать что-то полезное - заполнить форму о том, что блокировка повторяется. Ответом мне было то же самое окно о блокировке.

В итоге у меня два вопроса:

а). И все-таки, как бюджет превратился в внебюджет? И где же все-таки бюджет?
б). Кому-то удавалось отправить запрос в Федеральное казначейство?
Forwarded from Ivan Begtin (Ivan Begtin)
Признаться мне очень не хотелось и не хочется сейчас комментировать инициативу по поводу большой советской российской энциклопедии как замену Википедии. Не хочется не потому что нечего сказать, а потому что жить в режиме обязательной реакции на негатив утомляет. Но, видимо, всё таки придётся.

Чтобы понять на что выделяют деньги федеральные власти важно вначале понять что такое Википедия и как устроено распространение знаний в современном мире.

За последние 10 месяцев (с 01.01.2019 по 01.11.2019)
- 26,5 миллионов просмотров страниц в сутки
- 11 тысяч активных участников
- 6 миллионов страниц
- 1,6 миллионов статей
- 103 миллиона правок
- 221 тысяча изображений

Много это или мало? Это очень много. Википедия является одним из наиболее посещаемых сайтов в мире, а российская версия - одним из наиболее популярных сайтов в России и во всех странах СНГ.

Почему Википедия так популярна? Здесь много факторов срабатывающих одновременно:
- изначальная благая цель на сохранение знания и нейтральная позиция
- набор критической массы саморегулируемого сообщества
- огромное число контрибьюторов со всех стран мира
- финансовая поддержка глобальных корпораций, частных лиц, частных фондов и тд.
и, конечно же, открытые данные и открытость в целом.

Вот уже много лет как все данные Википедии публиковались и публикуются под свободной лицензией Creative Commons [1], а все данные доступны как открытые данные на сайте дампов [2] фонда Викимедиа, где кроме Википедии есть ещё и все остальные проекты фонда.

Что означает доступность открытых данных? То что данные Википедии активно используются учёными, исследователями, учащимися для изучения программирования и, безусловно, они активно используются всеми крупнейшими корпорациями и сервисами. Google и Яндекс встраивают сведения в поиск не просто как ссылки в поисковой выдаче, а в виде подсказок и, хотя поисковые сервисы и создают до 84% трафика в Википедию [3] тем не менее они активно стараются использовать контент оттуда чтобы удержать пользователя в своей поисковой строке. Подобный качественный бесплатный контент создаваемый сотнями тысяч волонтеров по всему миру и приводит к тому что многие компании поддерживают Википедию технически, финансово и иными способами. Например, Яндекс в России поддерживает один из проектов фонда Викимедиа - Wikidata, и звучат призывы к Google и Facebook больше поддерживать Википедию [4].

Но и без их поддержки Википедия является ключевым, можно сказать одним из центральных ресурсов в сети, ключевым ресурсом на который ссылаются поисковые машины, ключевым источником структурированного знания доступного всему человечеству и пока не имеющему сколь бы то ни было сравнимых по управлению и масштабу альтернатив.

Конечно решение о создании "альтернативы Википедии" не экономическое, у него политическая предыистория, в которой больше страшилок, чем реальной необходимости и возникает много вопросов о том насколько далеко российские регуляторы будут готовы пойти в продвижении Большой Российской новой энциклопедии (далее - БРНЭ).


1. Основной трафик Википедии приходит из поиска, необходимо ли ожидать требований к поисковым системам в России по регулированию поисковой выдачи, в том числе удалению ссылок на Википедию и добавление ссылок на БРНЭ?
2. Как именно предполагается привлекать основной костяк из тысяч редакторов статей в БРНЭ?
3. Есть ли опыт у получившей финансирование команды в запуске проектов сравнимых с Википедией по масштабу и объёму статей?
4. Есть ли, в принципе, концепция и стратегия создания БРНЭ и если да, то где именно можно её увидеть?
5. Почему в показателях выданной субсидии [5] на создание БРНЭ отсутствуют показатели посещаемости, вовлечённых авторов, подготовленных статей?
6. Будут ли все созданные доступны под свободными лицензиями, а база целиком в виде открытых данных?

Да и рпыт ранее "утонувшего" [6] поисковика "Спутник" не даёт многих надежд на успешность БРНЭ.

У меня осталось ещё много вопросов, но я начинал с того что очень не хочется постоянно реагировать на негатив и очень хочу закончить на позитивной ноте.
Минфин России проводит опрос об оценке качества опубликованных наборов открытых данных: https://www.minfin.ru/ru/votes/opendata_qual/.

Кажется, у меня есть, что им ответить…
Forwarded from Госзатраты
26 ноября в 19:00 Юлия Апухтина, главный редактор самарского интернет-журнала «Другой город» и автор «Проекта», проведет вебинар о том, как работать с открытыми данными об образовании и проводить исследования.

В программе вебинара:
- Статистика в образовании: данные Минобрнауки, Минпросвещения, Рособрнадзора, Росстата и их зоны ответственности;
- Результаты образовательной деятельности: что может рассказать нам открытая информация об устройстве высшего, общего, дошкольного и профессионального образования в России;
- Финансовая отчетность государственных образовательных учреждений: работа с сайтом http://amp.gs/spy5 и особенности выгрузки данных;
Невидимые финансовые потоки из государственного бюджета;
- Рынок частного образования: теневой сектор дополнительного образования и закрытые или неполные данные о государственной поддержке и финансовых отчетов частных ВУЗов и школ.

Подробности и регистрация: http://amp.gs/spyF.
На конференции по цифровизации Росстата его представитель говорит: "Росстат данные не продает, мы бесплатно отдаем все, что можем по закону".

А как же те контракты, по которым муниципальные и региональные госорганы закупают статистику у Росстата? (на наши с вами налоги госорганы покупают друг у друга государственные данные)
Самое время представить то, над чем мы работали несколько месяцев и причину моего переезда в Москву - проект «Госрасходы» (spending.gov.ru), новый портал Счетной палаты Российской Федерации на основе открытых финансовых данных.

Мы в ближайшее время будем много о нем говорить и писать, поэтому я выделю несколько основных особенностей проекта и причин, по которым мы его создавали:

1. Создание единой точки входа в мир финансовых данных для граждан, программистов и специалистов (в том числе и аудиторов) с минималистическим и понятным интерфейсом.

2. Интеграция данных из разных источников и реестров. Главная цель нашего проекта - построение финансовых цепочек: от выделения средств в бюджете до конечных получателей и результатов, а не предоставление отдельных реестров.

3. Агрегация данных по организациям: как госорганам, так и коммерческим компаниям. Существующие государственные порталы, содержащие финансовые данные, в основном ориентированы на отдельные сущности (контракты, субсидии, гранты) и не занимаются задачей объединения и анализа деятельности участников бюджетного процесса.

4. Проект, запускающийся в конце 2019 года, не может обойти стороной национальные проекты. Мы предоставляем нигде не публиковавшиеся ранее агрегированные данные по контрактам, субсидиям, получателям и распределителям средств в рамках нацпроектов и федпроектов.

5. Отличием проекта «Госрасходы» от других проектов является наличие аналитического блока, в котором мы разрабатываем методики для подсчета различных рейтингов и индикаторов на основе данных проекта.

6. Все данные проекта можно скачать в виде открытых данных или получить по API (ссылки и документацию на которое мы опубликуем в ближайшие пару недель).

7. Одним из самых важных пунктов является то, что в процессе разработки проекта и интеграции новых данных, мы выявляем ошибки и недоработки в открытых данных, поэтому побочным результатом работы портала может быть повышение качества данных, публикуемых Казначейством России, Минфином России и другими финансовыми госорганами. Также мы планируем работать над расширением перечня открытых данных, публикуемых госорганами.

8. Мы планируем развивать дата-лабораторию, в рамках которой будем предоставлять данные и консультировать представителей исследовательских и научных центров и университетов. Надеюсь, что мой альма-матер, Университет ИТМО, будет одним из первых партнёров.

9. Бюджеты, отчеты об исполнении и сводные бюджетные росписи должны стать ключевым источником данных на следующий год. Поэтому мы надеемся, что Минфин России повысит корректность текущих данных по федеральному бюджету и начнёт публиковать региональные и муниципальные данные.

10. Проект «Госрасходы» предназначен не только для граждан, но и для специалистов «Счетной палаты РФ» и контрольно-счетных органов, а также других органов контроля и аудита.

Мы запускаемся в бета-версии и будем рады предложениям, которые вы можете написать на spending@ach.gov.ru. Пишите, если вы хотите партнёрство в рамках Дата-лаборатории на parkhimovich_ov@ach.gov.ru

Большое спасибо всем участникам нашей команды, внешним экспертам, и опыту, накопленному на проектах АНО «Инфокультура», за то, что в такие сжатые сроки смогли сделать отличный проект и, конечно, Счетной Палате и ее председателю за то, что в 2019 году есть федеральный госорган, поддерживающий открытость и готовый к таким вызовам.
Казначейство России и Минфин России опубликовали бюджетную отчетность на Едином портале бюджетной системы (budget.gov.ru). В целом эти данные публикуются не впервые, они доступны на сайте Федерального казначейства (roskazna.ru) в формах отчетности. Что можно сказать после первого беглого просмотра, например, бюджетной отчетности консолидированного бюджета?

Значения строк в отчетности, опубликованной на портале ЕПБС, расходятся с отчетностью, опубликованной на портале Казначейства России. В найденных случаях на копейки - где-то данные портала ЕПБС округляются до первого знака после запятой, а где-то представлены без округления. По сравнению с публикацией Сводной бюджетной росписи, где расхождения доходили до десятков триллионов по сравнению с данными Закона о бюджете, это мелочи, но их уже достаточно, чтобы снизить доверие к новым данным и продолжить использовать данные с сайта Казначейства России.

Есть комментарии и по структуре выгружаемых xls-файлов:

- При открытии файла Excel предупреждает о несоответствии формата файла разрешению и сообщает, что файл, возможно, небезопасен или поврежден (но к этому мы привыкли).

- Иерархия в xls файлах создается с помощью объединенных ячеек.

- В данных присутствуют технические символы «\n», также * и ** (примечания при этом отсутствуют). Эти символы также есть и в данных в формате pdf.

- При выгрузке данных не указана периодичность.
Минэкономразвития внезапно взялся за data.gov.ru и ООО «РуНетСофт» по его заказу проведет серию обучающих вебинаров по вопросам открытых данных. Очень интересно, что в третьем вебинаре расскажут про Open Data Barometer.

28 ноября в 10:00 - вебинар «Нормативное правовое регулирование открытых данных» (https://vcs.imind.ru/#join:tcbc04903-b71d-4a36-81c8-374fb5bd4c29).

3 декабря в 10:00 - вебинар «Как правильно публиковать открытые данные» (https://vcs.imind.ru/#join:t22088bc6-6f59-4f49-81a4-5049197ae238)

3 декабря в 13:00 - вебинаров "Результаты анализа международных рейтингов по открытым данным. Нельзя отстать" (https://vcs.imind.ru/#join:te09969db-c39b-4e06-add3-0d8ec4a7741e)
Об ошибках в финансовых данных начали говорить публично!

Статья РБК (https://www.rbc.ru/economics/02/12/2019/5de4e3119a7947f04f7c160c) о том, что Федеральное казначейство признало ошибки в данных Электронного бюджета о расходах на нацпроекты. Причем признали ошибки именно технические на самом портале budget.gov.ru, а не в первичных данных, заполняемых/передаваемых регионами. Интересно, что до этого Минфин России и Федеральное казначейство в ответах на запросы качество и некорректность данных объясняли ошибками "поставщиков данных", а не работой портала.

РБК как вы смотрите на то, чтобы продолжить эту тему и написать о некорректности данных о проекте и законе о федеральном бюджете, сводных бюджетных росписей по федеральному и региональным бюджетам, реестра субсидий из федерального бюджета и реестра участников и неучастников бюджетного процесса? Примеры ошибок у нас уже собраны 😉
Forwarded from Инфокультура
Завтра в 19:00 в Шанинке Алина Владимирова, научный сотрудник ИВ РАН и вице-председатель Исследовательского комитета по политической власти Международной ассоциации политической науки, проведет лекцию об открытых данных международных организаций и подробнее расскажет о базе данных внешней торговли «Комтрейд ООН». Алина расскажет про:
- основные вехи создания базы данных «Комтрейд ООН»;
- проблемы, с которыми столкнулись специалисты, собирая торговую статистику;
- особенности открытых данных международных организаций и их качество.

Лекция может быть интересна тем, кто использует статистику внешней торговли в своих исследованиях, а также тем, кто занимается сбором и публикацией открытых данных. Приглашаем к участию исследователей, аналитиков, научных сотрудников и всех желающих.
Forwarded from Госзатраты
12 декабря в 18:00 Дада Линделл, дата-журналистка РБК, проведет вебинар о том, как работать с открытыми государственными данными, понимать их, а также расскажет, как делать исследования для делового медиа.

Дада победитель в конкурса Data Journalism Awards от Global Editors Network и автор таких медиа-исследований, как «Старость и “другие”: что не так со статистикой смертности россиян», «Разрытие покажет: почему в Москве ремонтируют одни и те же улицы», и «Где и как в России умирают от пьянства». А материал-исследование «В России сменилась тройка регионов — лидеров по смертности от ВИЧ» стал номинантом на приз зрительских симпатий Data Journalism Awards.

Вебинар пройдет в рамках проекта КГИ «Госзатраты».

Подробности и регистрация: http://amp.gs/iz9U.
Правительство учредило АНО «Национальные приоритеты» для «эффективного решения задач в области информационного сопровождения хода реализации национальных проектов».

Основные виды деятельности новой организации:

- обеспечение коммуникационного и информационного сопровождения нацпроектов и входящих в них федеральных проектов;
- мониторинг, разработка и развитие форматов участия граждан в нацпроектах;
- создание, выявление и поддержка проектов и инициатив, способствующих реализации нацпроектов и федпроектов;
- формирование единой открытой базы данных проектов и инициатив социального развития по направлениям нацпроектов;
- создание и развитие механизмов публичной экспертизы нацпроектов;
- изучение общественного мнения и проведение социологических исследований по вопросам информированности общества о ходе реализации нацпроектов;
- мониторинг оценки гражданами результатов нацпроектов, создание постоянной обратной связи с обществом по поводу хода реализации нацпроектов;
- проведение информационных и рекламных кампаний, посвященных вопросам реализации нацпроектов;
- создание, публикация и распространение через СМИ материалов о значимых для граждан форматах участия в нацпроектах;
- инициирование, организация и проведение публичных мероприятий и акций, направленных на повышение информированности граждан о ходе реализации нацпроектов;
- создание и реализация прав на результаты интеллектуальной деятельности;
- деятельность в области дополнительного образования и дополнительного профобразования и т. п.

Нам нужно еще больше государственных АНО, у которых нет обязательств о раскрытии (финансовой) информации.

http://static.government.ru/media/files/9ShgofeUX4a4RWBD8MMYxsNksslOUusl.pdf
Какой у нас стандарт раскрытия информации, такой и прозрачный нефтегаз

https://supply.gazprom-neft.ru/about/documents/dokumenty-peb-ot-i-gz/plakaty-pamyatki/
Мне нравится, что проект Счетной палаты РФ "Госрасходы" (spending.gov.ru) "подсвечивает" качество данных ЕИС в сфере закупок, оператор которого - Федеральное казначейство. Это дает нам какой-то шанс на исправление Казначейством России ошибок в данных и повышение их качества в целом.

Вот, например, заказчик по 44-ФЗ "Тестовая организация 20". Он "заключил" 1,5 тыс. контрактов с общей суммой 48,7 млн рублей. И попутно "исказил" аналитику по поставщикам, количество и сумму контрактов, региональный и отраслевой разрез. И такой "заказчик" не один.

Учитываются ли "тестовые" контракты в официальной статистике, предоставляемой порталом госзакупок? А "технические" ошибки портала или опечатки представителя заказчика (сейчас уже не разберешься, что было именно в этом случае), которые превращают контракт на 36 тыс в контракт на 800 млрд? И почему ошибки в таких контрактах исправляются только после того, как попадут в СМИ? И как может организация (у которой объем госзаказа за все время существования составляет ~5 млрд) на протяжении 10 месяцев не замечать, что у нее "заключен" самый дорогой контракт за 2019 год на междугороднюю связь в размере 800 млрд руб.? И что делать гражданам и активистам с подобными контрактами по 223-ФЗ, по которым не только нет сканов и текстов контрактов, но и информация о поставщике с прошлого года засекречена?

И мы из-за недоступности данных по 223-ФЗ не могли бы быть уверены в том, что этот контракт действительно ошибочен (а вдруг там связь предполагалась с Луной и Марсом и такая цена оправдана), если бы не представители заказчика, удивленные вниманием СМИ к своей организации, исправившие информацию о госконтракте на официальном портале и попросившие нас исправить данные в проекте ГосЗатраты.
Сходила на Хакатон портала открытых данных 2019. В принципе подтвердилось все то, что и заранее предполагали:

1. Организатор хакатона - компания RunetSoft. Сначала на странице хакатона (которая была создана за три дня до мероприятия) были указаны представители Минэкономразвития, но потом исчезли (и я могу их понять). Во всех материалах (презентация, блокноты), фигурировали только логотипы RunetSoft, включая рекламу в приветственном слове о том, что они получили статус газели.

2. На хакатоне не было ни одного представителя госорганов (на сайте в жюри один представитель упоминался, но его заменили на журналиста телеканала 5). Кстати, Минэкономразвития тоже не было. О нем была сказано ровно одно предложение: "Хакатон проводится при поддержке Минэкономразвития" (а в слайде уточнялось, что это "информационная" поддержка). Кстати, информационную поддержку я тоже не нашла - сайт Минэкономразвития о хакатоне не знает.

3. Вообще предполагалось (и заявлено), что это Хакатон портала открытых данных, который вполне государственный. Но по факту никакие названия кроме RuNetSoft'а не фигурировали. Также есть вероятность (большая), что это выполняется в рамках контрактов по 44-ФЗ на поддержку портала открытых данных, включая "просвещение/популяризациию открытых данных", суммы которых исчисляются не одним десятком миллионов (сроки и графики платежей заинтересованные и без меня найдут и удивятся). Получается, что обычные хакатоны проводятся госорганами и спонсируются коммерческими компаниями, а данный хакатон, наоборот - спонсируется государством для продвижения коммерческой компании (чего только стоит почта Рунетсофта на сайте ФГИС Мониторинг госсайтов).

4. Все материалы о хакатоне появились менее чем за 3 дня до хакатона. Это:
- страница хакатона на портале открытых данных (в Карте сайта ее не было, в разделе События и Мероприятия также не встречалась);
- рассылка "по потенциальным участникам" (подозреваю, что это были те, кто несколько лет назад зарегистрировался на портале открытых данных. Я эту рассылку получила, но ни один из моих коллег - нет);
- в Вконтакте была создана группа хакатона с 3 постами, 32 участниками и 6 возможными участниками (9 из них - сотрудники компании RuNetSoft). Задала в ней один вопрос, мне ответила техподдержка - и так комментариев в группе стало целых два;
- в Facebook создали страницу, 1 подписчик, 1 пост, 0 лайков и комментариев;
- за день до мероприятия разместили информацию о хакатоне в сторонней группе про хакатоны Вконтакте (получили 2 негативных комментария и не ответили), потом пустили рекламу в Инстаграме.

5. На открытии мероприятия было озвучено количество участников - более 70 человек. По факту на площадке их было не более 30 (а если бы их было хотя бы 35-40, то они бы просто не влезли). Также говорили про удаленных участников, но про них поговорим, когда посмотрим завтрашние презентации. По данным из слайда участники привлекались с помощью тематических порталов и СМИ (мне не удалось найти ни одной публикации), комплексного SMM продвижения (3 одинаковых поста + реклама) и рассылки по потенциальной базе участников. В сообществе открытых данных в телеграмме, в котором 1500 участников, или в группах, посвященных открытым данным, никакой информации также не было.

6. Отдельно удивил подход к содержанию. На открытии ничего не было сказано об открытых данных, о портале открытых данных, об источниках данных или о идеях/задачах, которые можно реализовать на хакатоне. Из 4 менторов два были разработчиками организаторов и были добавлены вчера поздним вечером (ничего не имею против них, но обычно менторов пытаются позвать с разными специализациями, и не только про ИТ, но и про данные).

7. Проанализировав и увидев вживую все предыдущее, к своему удивлению нашла видение проделанной работы со стороны компании RunetSoft, опубликованное в ее группе Вконтакте:

"К организации мероприятия были привлечены более 20 штатных сотрудников компании RuNetSoft и 2 event-агенства, которые несколько недель совместно в непрерывном режиме готовили проект к старту для вас!".
Численность компании (по информации открытых источников) - 36 человек. Более 20 из них несколько недель были заняты подготовкой этого мероприятия (я даже не знаю, какое предположение хуже: то, что половина ИТ-компании - это ивент-менеджеры, готовившие это мероприятие, или то, что 20 разработчиков несколько недель верстали одну страницу хакатона, и даже не хочу гадать, как же в это время исполнялись остальные госконтракты, если вся компания занималась халатном). Чем занимались event-агентства тоже непонятно - дизайн под хакатон не разрабатывался, наклеек, раздаток не было. Отдельно удивляет, что вся компания и приглашенные агентства "трудились непрерывно несколько недель", а о мероприятии решили общественности (потенциальным участникам) только за три дня.

В общем, на это можно было бы не обращать внимания, если бы это не проводилось на наши с вами налоги, а сумма контракта (на 1 год и 2 месяца) не была бы семизначной, при этом семизначная сумма будет выплачена до конца года за "двухмесячную" работу.
И лично мне вдвойне обидно, что тема открытых данных, лишенная в последние полтора года финансирования и интереса со стороны госорганов, так сливается.

Чуть не забыла о плюсах: были печеньки.
Не могу не поделиться: ребята из ЦПУР сделали отличный проект, показывающий основные проблемы госзакупок https://game.cpur.ru
Forwarded from Ivan Begtin (Ivan Begtin)
В РБК вышла статья за авторством Ольги Пархимович с небольшой моей помощью, статья о том насколько всё плохо с качеством данных в государтсвенных информационных системах [1].

Тема заслуживает не то что статьи, по ней можно защищать диссертации и открывать исследовательские институты. С качеством данных всё плохо, с принятием решений на их основе тоже, так себе. Впрочем почитайте статью.

Ссылки:
[1] https://www.rbc.ru/opinions/society/20/12/2019/5dfb4e169a79470b46b4f98c

#opendata #dataquality
Мы давно работаем с открытыми данными и данными государственных информационных систем и регулярно сталкиваемся с недостаточно высоким качеством этих данных.

Из свежих примеров этого года - некорректные суммы расходов федерального бюджета на 2020 год, дубликаты бюджетных строк в расходах Министерства спорта, госконтракты с несуществующими КБК в данных портала госзакупок и многое другое. Об этих и других примерах, а также о том, как это может влиять на обычных граждан, мы с Иваном Бегтиным написали в колонке РБК.

https://www.rbc.ru/opinions/society/20/12/2019/5dfb4e169a79470b46b4f98c