Привет! Этот канал участников дата-отдела ОВД-Инфо. Здесь мы будем рассказывать про «внутреннюю кухню» наших исследований и делиться ссылками на работы коллег из других НКО и медиа.
Наша почта для связи: data@ovdinfo.org
Доклады: reports.ovdinfo.org/
Датасеты: data.ovdinfo.org/
Подписаться на дату-рассылку: airtable.com/shrPs52GsIKgoj2Yj
Поддержать ОВД-Инфо: donate.ovd.legal/
Если вас задержали, пишите https://xn--r1a.website/OvdInfoBot
Наша почта для связи: data@ovdinfo.org
Доклады: reports.ovdinfo.org/
Датасеты: data.ovdinfo.org/
Подписаться на дату-рассылку: airtable.com/shrPs52GsIKgoj2Yj
Поддержать ОВД-Инфо: donate.ovd.legal/
Если вас задержали, пишите https://xn--r1a.website/OvdInfoBot
❤8👏3👍1
По данным ОВД-Инфо pinned «Привет! Этот канал участников дата-отдела ОВД-Инфо. Здесь мы будем рассказывать про «внутреннюю кухню» наших исследований и делиться ссылками на работы коллег из других НКО и медиа. Наша почта для связи: data@ovdinfo.org Доклады: reports.ovdinfo.org/ Датасеты:…»
Дано:
1. Данные ОВД-Инфо (индивидуальные = по конкретному делу);
2. Карточки дел первой инстанции на сайтах судов (индивидуальные);
3. Информация о делах первой инстанции на инфомационном портале ГАС «Правосудие» (индивидуальные);
4. Пресс-релизы судов (агрегированные);
5. Пресс-релизы МВД (агрегированные).
Найти:
Количество административных дел по ст. 20.3.3 КоАП.
Решение:
В первых трех источниках — информация о делах конкретных людей. Ищем в них дубли: ориентируясь на фамилии, названия судов и номера дел, убираем эти дубли и объединяем в общий датасет.
С пунктами №4 и №5 сложнее. В сообщениях пресс-служб обычно говорится просто об определенном количестве заведенных протоколов или рассмотренных дел, и мы не знаем, как они соотносятся друг с другом и с «индивидуальным» датасетом — это одни и те же дела или они не пересекаются / пересекаются лишь частично. Именно поэтому мы не можем их просто просуммировать, но иногда в агрегированных данных содержится информация о большем числе дел, чем нам известно «индивидуально» или по именам.
Поэтому мы делаем так: смотрим, сколько дел в конкретном регионе в каждом из трех источников (4, 5 и в общем датасете), выбираем тот, где число дел наибольшее и это число выводим как финальное число для региона. Потом суммируем все регионы и получаем 1938.
Ответ:
В России возбудили не менее 1938 дел по статье 20.3.3 КоАП «О дискредитации Вооруженных сил РФ» с момента начала войны в Украине.
ЧТД
1. Данные ОВД-Инфо (индивидуальные = по конкретному делу);
2. Карточки дел первой инстанции на сайтах судов (индивидуальные);
3. Информация о делах первой инстанции на инфомационном портале ГАС «Правосудие» (индивидуальные);
4. Пресс-релизы судов (агрегированные);
5. Пресс-релизы МВД (агрегированные).
Найти:
Количество административных дел по ст. 20.3.3 КоАП.
Решение:
В первых трех источниках — информация о делах конкретных людей. Ищем в них дубли: ориентируясь на фамилии, названия судов и номера дел, убираем эти дубли и объединяем в общий датасет.
С пунктами №4 и №5 сложнее. В сообщениях пресс-служб обычно говорится просто об определенном количестве заведенных протоколов или рассмотренных дел, и мы не знаем, как они соотносятся друг с другом и с «индивидуальным» датасетом — это одни и те же дела или они не пересекаются / пересекаются лишь частично. Именно поэтому мы не можем их просто просуммировать, но иногда в агрегированных данных содержится информация о большем числе дел, чем нам известно «индивидуально» или по именам.
Поэтому мы делаем так: смотрим, сколько дел в конкретном регионе в каждом из трех источников (4, 5 и в общем датасете), выбираем тот, где число дел наибольшее и это число выводим как финальное число для региона. Потом суммируем все регионы и получаем 1938.
Ответ:
В России возбудили не менее 1938 дел по статье 20.3.3 КоАП «О дискредитации Вооруженных сил РФ» с момента начала войны в Украине.
ЧТД
🔥30❤4👍3😢3👎1
