Forwarded from Ivan Begtin (Ivan Begtin)
Можно ли предсказать голосование по фотографии? А если это панорамная фотография?
Исследователи из Стенфордского университета проанализировали 50 миллионов фотографий из Google Street View [1]
и научились определять типы автомобилей и, соответственно, предсказывать голосования в местах где они сделаны.
Всего система умеет предсказывать с высокой точностью уровень доходов, расовые признаки, образование и привычки в голосовании с детальностью до почтового индекса (ZIP кода).
Все это социологам и в России на заметку, кроме Google Street View в России ещё есть Яндекс Панорамы и алгоритмы позволили бы провести реальные исследования устройства российского общества.
Подробнее об исследовании [2]
Ссылки:
[1] https://www.nytimes.com/2017/12/31/technology/google-images-voters.html
[2] http://www.pnas.org/content/114/50/13108.full.pdf
#opendata #data #algorithms
Исследователи из Стенфордского университета проанализировали 50 миллионов фотографий из Google Street View [1]
и научились определять типы автомобилей и, соответственно, предсказывать голосования в местах где они сделаны.
Всего система умеет предсказывать с высокой точностью уровень доходов, расовые признаки, образование и привычки в голосовании с детальностью до почтового индекса (ZIP кода).
Все это социологам и в России на заметку, кроме Google Street View в России ещё есть Яндекс Панорамы и алгоритмы позволили бы провести реальные исследования устройства российского общества.
Подробнее об исследовании [2]
Ссылки:
[1] https://www.nytimes.com/2017/12/31/technology/google-images-voters.html
[2] http://www.pnas.org/content/114/50/13108.full.pdf
#opendata #data #algorithms
Nytimes
How Do You Vote? 50 Million Google Images Give a Clue
Artificial intelligence is making it possible for Street Views to be mined for insights about the economy, politics and human behavior — just as text mining has done for years.
Forwarded from Ivan Begtin (Ivan Begtin)
В последние месяцы у меня было много разговоров о том как государство использует или могло бы использовать данные, современные алгоритмы и, в будущем, искусственный интеллект.
Более всего, разумеется, упоминаются самые благие начинания - от повышения эффективности бюрократического аппарата, до повышения качества работы с госфинансами.
Но самые масштабные, самые серьёзные, самые масштабные области применения, конечно же совершенно в другом. Они в обработке бесконечного объёма данных с возможностью отслеживания любых действий каждого человека.
Правительство США в рамках программы IARPA финансирует две исследовательские программы Finder [1], Alldain Video [2] и Deep Intermodal Video Analytics (DIVA) [3].
Finder - это программа по извлечению геолокационных данных из фотографий без соответствующей информации в EXIF. Например, если пользователь запретил публиковать геоданные.
Alladin Video - это извлечение знаний/данных из видеозаписей на популярных видеохостингах. Это распознавание лиц, объектов, событий,
DIVA - это распознавание лиц и активности для потокового видео (в основном камер наблюдения) с автоматическим направлением уведомлений о событиях.
Отличие США от других стран лишь в лучшей организации научной составляющей этой работы, в остальном же важный интерес всех более менее крупных (богатых) государств не в оптимизации системы управления, а в тотальной слежке.
Ссылки:
[1] https://www.iarpa.gov/index.php/research-programs/finder
[2] https://www.iarpa.gov/index.php/research-programs/finder
[3] https://www.iarpa.gov/index.php/research-programs/diva
#data #algorithms
Более всего, разумеется, упоминаются самые благие начинания - от повышения эффективности бюрократического аппарата, до повышения качества работы с госфинансами.
Но самые масштабные, самые серьёзные, самые масштабные области применения, конечно же совершенно в другом. Они в обработке бесконечного объёма данных с возможностью отслеживания любых действий каждого человека.
Правительство США в рамках программы IARPA финансирует две исследовательские программы Finder [1], Alldain Video [2] и Deep Intermodal Video Analytics (DIVA) [3].
Finder - это программа по извлечению геолокационных данных из фотографий без соответствующей информации в EXIF. Например, если пользователь запретил публиковать геоданные.
Alladin Video - это извлечение знаний/данных из видеозаписей на популярных видеохостингах. Это распознавание лиц, объектов, событий,
DIVA - это распознавание лиц и активности для потокового видео (в основном камер наблюдения) с автоматическим направлением уведомлений о событиях.
Отличие США от других стран лишь в лучшей организации научной составляющей этой работы, в остальном же важный интерес всех более менее крупных (богатых) государств не в оптимизации системы управления, а в тотальной слежке.
Ссылки:
[1] https://www.iarpa.gov/index.php/research-programs/finder
[2] https://www.iarpa.gov/index.php/research-programs/finder
[3] https://www.iarpa.gov/index.php/research-programs/diva
#data #algorithms
www.iarpa.gov
Finder
The Intelligence Advanced Research Projects Activity (IARPA) invests in high-risk/high-payoff research programs that have the potential to provide our nation with an overwhelming intelligence advantage over future adversaries.
Forwarded from Ivan Begtin (Ivan Begtin)
Google, Facebook, Twitter и Microsoft совместно анонсировали Data Transfer Project [1], проект по стандартизации обмена данными между платформами. Это включает данные в виде контактов, фотографий, файлов на дисках и многое другое. Подробнее в white paper [2] с примерами и описанием реализации и акцентом на то что и другие сервисы могут подтягиваться поддерживая стандарт.
Кроме того весь проект сделан открытым, с открытым кодом выложенным онлайн [3].
Обратите внимание что:
- это совместная инициатива 4-х крупнейших облачных сервисов и соцсетей для физ. лиц, Фактически совместно они задают правила игры на этом рынке и не столько опасаются перетеканием пользователей между их платформами сколько заинтересованы во влиянии на другие сервисы
- для меньших сервисов, вроде того же Яндекса или Mail.ru это может быть вопрос или использования стандарта или самоизоляция от него. Неизвестно что будет хуже для их бизнеса.
- кстати, ни один из российских крупнейших сервисов сейчас не даёт возможности выгрузить все Ваши действия в нём при удалении аккаунта.
Ссылки:
[1] https://datatransferproject.dev
[2] https://datatransferproject.dev/dtp-overview.pdf
[3] https://github.com/google/data-transfer-project/blob/master/Documentation/Developer.md
#data #datatransfer
Кроме того весь проект сделан открытым, с открытым кодом выложенным онлайн [3].
Обратите внимание что:
- это совместная инициатива 4-х крупнейших облачных сервисов и соцсетей для физ. лиц, Фактически совместно они задают правила игры на этом рынке и не столько опасаются перетеканием пользователей между их платформами сколько заинтересованы во влиянии на другие сервисы
- для меньших сервисов, вроде того же Яндекса или Mail.ru это может быть вопрос или использования стандарта или самоизоляция от него. Неизвестно что будет хуже для их бизнеса.
- кстати, ни один из российских крупнейших сервисов сейчас не даёт возможности выгрузить все Ваши действия в нём при удалении аккаунта.
Ссылки:
[1] https://datatransferproject.dev
[2] https://datatransferproject.dev/dtp-overview.pdf
[3] https://github.com/google/data-transfer-project/blob/master/Documentation/Developer.md
#data #datatransfer
Forwarded from Ivan Begtin (Ivan Begtin)
Тема дня (вечера) - это свежевнесённый закон о больших данных [1]. В нём, например, прописано что если у тебя есть база на 1 тыс. абонентов то это большие пользовательские данные. Ещё там написано что спецслужбы имеют право нарушать тайну личности и много чего другого, включая то что реестр операторов больших пользовательских данных будет вести Роскомнадзор.
И тут возникает сразу несколько важнейших вопросов:
1. Оператором данных более 1000 абонентов являются большинство управляющих компаний и невероятное число мелкого и среднего бизнеса. Реестр будет тотальным
2. А зачем тогда нужно было придумывать АНО Цифровая экономика, большую госпрограмму, Сколково которое создало кучу тематических работчих групп по нормативке если потом пара депутатов может "вот так взять и внести закон". Иначе говоря, очень хочется большей предсказуемости.
3. С каких пор маркетинговый термин big data оказался частью законопроекта. Это тревожный сигнал.
Ссылки:
[1] http://asozd2c.duma.gov.ru/addwork/scans.nsf/ID/50B9D24C5F2541B84325832F00378819/$FILE/571124-7_23102018_571124-7.PDF?OpenElement
#data #bigdata
И тут возникает сразу несколько важнейших вопросов:
1. Оператором данных более 1000 абонентов являются большинство управляющих компаний и невероятное число мелкого и среднего бизнеса. Реестр будет тотальным
2. А зачем тогда нужно было придумывать АНО Цифровая экономика, большую госпрограмму, Сколково которое создало кучу тематических работчих групп по нормативке если потом пара депутатов может "вот так взять и внести закон". Иначе говоря, очень хочется большей предсказуемости.
3. С каких пор маркетинговый термин big data оказался частью законопроекта. Это тревожный сигнал.
Ссылки:
[1] http://asozd2c.duma.gov.ru/addwork/scans.nsf/ID/50B9D24C5F2541B84325832F00378819/$FILE/571124-7_23102018_571124-7.PDF?OpenElement
#data #bigdata
Forwarded from Ivan Begtin (Ivan Begtin)
Одна из наиболее сложных задач в понимании "кому-что-и-как положено" в доступе к данным - это декомпозиция прав доступа из федерального законодательства. Например, сегодня в 22:05 внесён законопроект № 655193-7 "О внесении изменений в отдельные законодательные акты Российской Федерации " [1] с изменениями в несколько законов, в том числе в Федеральный закон "Об актах гражданского состояния" N143-ФЗ [2] где прописаны условия доступа органов власти к Единому государственному реестру записей актов гражданского состояния (ЕГРЗ).
Законопроект расширяет перечень органов власти имеющих доступ к этим сведениям на избирательные комиссии, и комиссии референдумов. В перечень который и без того уже весьма немал. Я бы даже сказал что список имеющих доступ уже столь велик что скоро можно будет всерьёз задумываться не будет ли утечек из ЕГРЗ, не продаются ли уже эти сведения на чёрном рынке.
Напомню что сейчас статья 13.2 в 143-ФЗ выглядит следующим образом (форматирование моё)
--
Сведения о государственной регистрации смерти, содержащиеся в Едином государственном реестре записей актов гражданского состояния, и сведения о внесении исправлений или изменений в записи актов о смерти, содержащиеся в Едином государственном реестре записей актов гражданского состояния, предоставляются:
- федеральному органу исполнительной власти в сфере внутренних дел (его территориальным органам)
- федеральному органу исполнительной власти, осуществляющему функции по контролю и надзору за соблюдением законодательства о налогах и сборах (его территориальным органам)
- федеральному органу исполнительной власти, осуществляющему функции по формированию официальной статистической информации о социальных, экономических, демографических, экологических и других общественных процессах в Российской Федерации (его территориальным органам)
- федеральному органу исполнительной власти, осуществляющему функции по выработке и реализации государственной политики и нормативно-правовому регулированию в области обороны (его территориальным органам)
- федеральному органу исполнительной власти, осуществляющему функции по выработке и реализации государственной политики и нормативно-правовому регулированию в сфере деятельности войск национальной гвардии Российской Федерации, в сфере оборота оружия, в сфере частной охранной деятельности и в сфере вневедомственной охраны
- федеральному органу исполнительной власти, уполномоченному Правительством Российской Федерации на осуществление государственного кадастрового учета, государственной регистрации прав, ведение Единого государственного реестра недвижимости и предоставление сведений, содержащихся в Едином государственном реестре недвижимости (его территориальным органам)
- Пенсионному фонду Российской Федерации
- Фонду социального страхования Российской Федерации
- территориальным фондам обязательного медицинского страхования
- органам исполнительной власти субъектов Российской Федерации, осуществляющим полномочия в сфере информационно-коммуникационных технологий и организации информационного взаимодействия с федеральными органами исполнительной власти и (или) автоматизированными системами федеральных органов исполнительной власти
- главам местных администраций муниципальных районов, городских округов, внутригородских территорий городов федерального значения, а в случаях, предусмотренных законами субъектов Российской Федерации - городов федерального значения,
- территориальным органам исполнительной власти городов федерального значения.
--
Ссылки:
[1] http://sozd.duma.gov.ru/bill/655193-7
[2] http://www.consultant.ru/document/cons_doc_LAW_16758/
#data #duma #law
Законопроект расширяет перечень органов власти имеющих доступ к этим сведениям на избирательные комиссии, и комиссии референдумов. В перечень который и без того уже весьма немал. Я бы даже сказал что список имеющих доступ уже столь велик что скоро можно будет всерьёз задумываться не будет ли утечек из ЕГРЗ, не продаются ли уже эти сведения на чёрном рынке.
Напомню что сейчас статья 13.2 в 143-ФЗ выглядит следующим образом (форматирование моё)
--
Сведения о государственной регистрации смерти, содержащиеся в Едином государственном реестре записей актов гражданского состояния, и сведения о внесении исправлений или изменений в записи актов о смерти, содержащиеся в Едином государственном реестре записей актов гражданского состояния, предоставляются:
- федеральному органу исполнительной власти в сфере внутренних дел (его территориальным органам)
- федеральному органу исполнительной власти, осуществляющему функции по контролю и надзору за соблюдением законодательства о налогах и сборах (его территориальным органам)
- федеральному органу исполнительной власти, осуществляющему функции по формированию официальной статистической информации о социальных, экономических, демографических, экологических и других общественных процессах в Российской Федерации (его территориальным органам)
- федеральному органу исполнительной власти, осуществляющему функции по выработке и реализации государственной политики и нормативно-правовому регулированию в области обороны (его территориальным органам)
- федеральному органу исполнительной власти, осуществляющему функции по выработке и реализации государственной политики и нормативно-правовому регулированию в сфере деятельности войск национальной гвардии Российской Федерации, в сфере оборота оружия, в сфере частной охранной деятельности и в сфере вневедомственной охраны
- федеральному органу исполнительной власти, уполномоченному Правительством Российской Федерации на осуществление государственного кадастрового учета, государственной регистрации прав, ведение Единого государственного реестра недвижимости и предоставление сведений, содержащихся в Едином государственном реестре недвижимости (его территориальным органам)
- Пенсионному фонду Российской Федерации
- Фонду социального страхования Российской Федерации
- территориальным фондам обязательного медицинского страхования
- органам исполнительной власти субъектов Российской Федерации, осуществляющим полномочия в сфере информационно-коммуникационных технологий и организации информационного взаимодействия с федеральными органами исполнительной власти и (или) автоматизированными системами федеральных органов исполнительной власти
- главам местных администраций муниципальных районов, городских округов, внутригородских территорий городов федерального значения, а в случаях, предусмотренных законами субъектов Российской Федерации - городов федерального значения,
- территориальным органам исполнительной власти городов федерального значения.
--
Ссылки:
[1] http://sozd.duma.gov.ru/bill/655193-7
[2] http://www.consultant.ru/document/cons_doc_LAW_16758/
#data #duma #law
sozd.duma.gov.ru
№655193-7 Законопроект :: Система обеспечения законодательной деятельности
Информационный ресурс Государственной Думы. Здесь собрана информация о рассмотрении законопроектов и проектов постановлений Государственной Думы
Forwarded from Ivan Begtin (Ivan Begtin)
На сайте национального проекта "Цифровая экономика" вышла моя заметка о том как может быть устроено управление данными [1]. Формат её краток, реально же говорить можно долго.
Вот ключевое:
Каким может быть идеальное госрегулирование?
Основу госрегулирования должна составлять концепция или стратегия развития рынка данных со стороны государства, охватывающая принципы государственного регулирования указанного рынка и роль государства в этой сфере. Концепция должна определять такие направления, как:
1) этика сбора, обработки и использования данных, относящихся к наиболее чувствительным данным для общества (в первую очередь персональных данных);
2) принципы общественного блага и четкое определение случаев его приоритета над частными интересами;
3) принципы цифровых прав граждан: доступность им данных о них самих, управление доступом к их персональным данным для частных компаний и государства.
В ситуации нарастающего сбора данных общество и бизнес оказываются в неравных условиях с владельцами баз данных, которые знают о гражданине или компании значительно больше, чем они сами знают о себе. Цифровые права обеспечивают справедливость в доступе к данным без потери коммерческого преимущества у владельца данных;
4) государственная политика развития платформ сбора, обработки и обмена данными между участниками рынка данных: от поддержки стартапов, создающих подобные платформы, до разработки стандартов публикации и обмена данными;
5) четкая регламентация доступа к данным в государственных информационных системах, в том числе в части разрешения конфликтных и спорных ситуаций.
Ссылки:
[1] https://digital.ac.gov.ru/opinions/820
#data
Вот ключевое:
Каким может быть идеальное госрегулирование?
Основу госрегулирования должна составлять концепция или стратегия развития рынка данных со стороны государства, охватывающая принципы государственного регулирования указанного рынка и роль государства в этой сфере. Концепция должна определять такие направления, как:
1) этика сбора, обработки и использования данных, относящихся к наиболее чувствительным данным для общества (в первую очередь персональных данных);
2) принципы общественного блага и четкое определение случаев его приоритета над частными интересами;
3) принципы цифровых прав граждан: доступность им данных о них самих, управление доступом к их персональным данным для частных компаний и государства.
В ситуации нарастающего сбора данных общество и бизнес оказываются в неравных условиях с владельцами баз данных, которые знают о гражданине или компании значительно больше, чем они сами знают о себе. Цифровые права обеспечивают справедливость в доступе к данным без потери коммерческого преимущества у владельца данных;
4) государственная политика развития платформ сбора, обработки и обмена данными между участниками рынка данных: от поддержки стартапов, создающих подобные платформы, до разработки стандартов публикации и обмена данными;
5) четкая регламентация доступа к данным в государственных информационных системах, в том числе в части разрешения конфликтных и спорных ситуаций.
Ссылки:
[1] https://digital.ac.gov.ru/opinions/820
#data
Forwarded from Ivan Begtin (Ivan Begtin)
Тем временем утечки персональных данных на уровне стран перестают быть редкостью. В Эквадоре произошла утечка базы в 20.8 миллиона жителей (большинство жителей страны) [1] из-за некорректно настроенной базы Elastic Search. Можно сказать что это уже какое-то массовое бедствие в мире когда NoSQL базы данных MongoDB или ElasticSearch настраивают так что они оказываются общедоступными и утекают данные о миллионах людей.
И нельзя сказать что системно предпринимаются хоть какие-то шаги чтобы этого избежать.
Ссылки:
[1] https://www.zdnet.com/article/database-leaks-data-on-most-of-ecuadors-citizens-including-6-7-million-children/
#dataleaks #data #equador
И нельзя сказать что системно предпринимаются хоть какие-то шаги чтобы этого избежать.
Ссылки:
[1] https://www.zdnet.com/article/database-leaks-data-on-most-of-ecuadors-citizens-including-6-7-million-children/
#dataleaks #data #equador
ZDNet
Database leaks data on most of Ecuador's citizens, including 6.7 million children
Elasticsearch server leaks personal data on Ecuador's citizens, their family trees, and children, but also some users' financial records and car registration information.
Forwarded from Ivan Begtin (Ivan Begtin)
В NYT статья [1] о том как автор запросил свои данные у сервиса Syft и узнал что о нём знают и собирают. А знают практически всё - транзакции, оставленные комментарии в Yelp, каждое открытие приложения Coinbase и сообщения пересылаемые в Airbnb в переписке с владельцами квартир.
Всё это стало возможно благодаря калифорнийскому аналогу GDPR California Consumer Privacy Act [2] принятому в 2018 году и вступающему в силу с 2020 года, но некоторые компании подготовились к нему заранее.
Тем самым уже не только в Европе "право знать о себе" - становится неотъемлимым правом каждого потребителя/гражданина.
Ссылки:
[1] https://www.nytimes.com/2019/11/04/business/secret-consumer-score-access.html
[2] https://www.nytimes.com/2018/06/28/technology/california-online-privacy-law.html
#privacy #data
Всё это стало возможно благодаря калифорнийскому аналогу GDPR California Consumer Privacy Act [2] принятому в 2018 году и вступающему в силу с 2020 года, но некоторые компании подготовились к нему заранее.
Тем самым уже не только в Европе "право знать о себе" - становится неотъемлимым правом каждого потребителя/гражданина.
Ссылки:
[1] https://www.nytimes.com/2019/11/04/business/secret-consumer-score-access.html
[2] https://www.nytimes.com/2018/06/28/technology/california-online-privacy-law.html
#privacy #data
NY Times
I Got Access to My Secret Consumer Score. Now You Can Get Yours, Too. (Published 2019)
Little-known companies are amassing your data — like food orders and Airbnb messages — and selling the analysis to clients. Here’s how to get a copy of what they have on you.
Forwarded from Ivan Begtin (Ivan Begtin)
На проходящем в России RIW Аналитический центр при Пр-ве РФ, ИРИ и Ассоциация больших данных представили свой этический кодекс работы с данными [1]. Лично я как руководитель другой ассоциации - АУРД (Ассоциация участников рынка данных) не могу его не прокомментировать, сделаю это тезисами.
1. Этот кодекс разрабатывали именно АЦ при Правительстве, ИРИ и Ассоциация больших данных. Наша ассоциация к нему никакого отношения не имела, мы не видели его ни в черновом виде, ни в каком иначе и никто из известных мне экспертов до того как кодекс был опубликован его не видел. Это продукт исключительно в зоне ответственности этих 3-х участников.
2. Кодекс существует в форме благопожеланий, не в формате "мы обязуемся делать" и "мы обязуемся не делать" как это изложено, например, в похожем кодексе в Швейцарии [3], а в форме общего, на мой взгляд, необоснованно забюрократизированного изложения.
3. Часть документа про создание "совета по совершенствованию лучших практик работе с данными" - это довольно бессмысленная идея на том уровне котором предлагается его создание. Я давно ратую за создание совета по данным на уровне правительственной комиссии или совета при Президенте РФ, но совет при АЦ при ПР РФ - это несерьёзный уровень для документа. В этом смысле я лично его бы больше ожидал от Ассоциации больших данных
4. В документе ничего нет про приближение к практикам GDPR, защиту прав пользователей и доступа граждан к их данным. Это не этика для малого бизнеса и не этика для пользователя - это самое минимальное приближение к этике со стороны "больших котов"
5. При этом я, всё равно, приветствую появление одного из первых документов по дата-этике, даже если окажется в будущем окажется что его необходимо будет глубоко переписать или полностью переделать.
Ссылки:
[1] http://ac.gov.ru/files/content/25949/kodeks-etiki-pdf.pdf
[2] http://aurd.ru
[3] https://data-service-alliance.ch/_Resources/Persistent/d8023fbcbd6cfb86e5ed814faa050f6bfa6be284/Codex_V3_english_public.pdf
#data #dataethics
1. Этот кодекс разрабатывали именно АЦ при Правительстве, ИРИ и Ассоциация больших данных. Наша ассоциация к нему никакого отношения не имела, мы не видели его ни в черновом виде, ни в каком иначе и никто из известных мне экспертов до того как кодекс был опубликован его не видел. Это продукт исключительно в зоне ответственности этих 3-х участников.
2. Кодекс существует в форме благопожеланий, не в формате "мы обязуемся делать" и "мы обязуемся не делать" как это изложено, например, в похожем кодексе в Швейцарии [3], а в форме общего, на мой взгляд, необоснованно забюрократизированного изложения.
3. Часть документа про создание "совета по совершенствованию лучших практик работе с данными" - это довольно бессмысленная идея на том уровне котором предлагается его создание. Я давно ратую за создание совета по данным на уровне правительственной комиссии или совета при Президенте РФ, но совет при АЦ при ПР РФ - это несерьёзный уровень для документа. В этом смысле я лично его бы больше ожидал от Ассоциации больших данных
4. В документе ничего нет про приближение к практикам GDPR, защиту прав пользователей и доступа граждан к их данным. Это не этика для малого бизнеса и не этика для пользователя - это самое минимальное приближение к этике со стороны "больших котов"
5. При этом я, всё равно, приветствую появление одного из первых документов по дата-этике, даже если окажется в будущем окажется что его необходимо будет глубоко переписать или полностью переделать.
Ссылки:
[1] http://ac.gov.ru/files/content/25949/kodeks-etiki-pdf.pdf
[2] http://aurd.ru
[3] https://data-service-alliance.ch/_Resources/Persistent/d8023fbcbd6cfb86e5ed814faa050f6bfa6be284/Codex_V3_english_public.pdf
#data #dataethics
Forwarded from Ivan Begtin (Ivan Begtin)
Разработчики НСУДа выложили сразу множество документов по НСУДу непосредственно [1], документов много и мы только приступили к их прочтению. Что видно сразу - писались они не для людей, а для сдачи по госконтракту(-ам) сроки завершения которых у разработчиков как раз в декабре.
Хочется надеяться что про открытые данные они не забыли. Хочется надеяться что результат этой работы будет не бессмысленным. Впрочем - почитаем, посмотрим.
Ссылки:
[1] https://digital.ac.gov.ru/materials/?id=48
#data
Хочется надеяться что про открытые данные они не забыли. Хочется надеяться что результат этой работы будет не бессмысленным. Впрочем - почитаем, посмотрим.
Ссылки:
[1] https://digital.ac.gov.ru/materials/?id=48
#data
digital.ac.gov.ru
Материалы
Проект полного переформатирования привычных хозяйственных связей и существующих бизнес моделей, который изменит жизнь каждого россиянина
Forwarded from Ivan Begtin (Ivan Begtin)
The Costs of connection [1] свежая книга о колониализме данных (data colonialism) вышедшая в августе 2019 года [2] и пока не переведённая на русский язык. Книга посвящена простой и неприятной истине что цивилизация и развитие технологий привели к явлению самоколонизации, когда объектами колонизации оказываются не далёкие и менее развитые страны и народы, а народы собственные из которых извлекается прибыль через владение их данными. Авторы пишут об этом и в продолжении книги в статье Colonising ourselves? An introduction to data colonialism [3] и, в отличие от заядлых искателей теорий заговора, их аргументы более чем взвешены, разумны и обоснованы.
Ключевой аргумент в том что если исторический колониализм аннексировал территории, их ресурсы и тела тех кто на них работал, то дата колониализм захватывает проще и глубже: захват и контроль человеческой жизни через присвоение данных которые могут быть извлечены для получения прибыли.
На фоне пандемии коронавируса возникает и другой запрос. Запрос на социальную справедливость. В основе которого ситуация когда за деньги можно купить. И здоровье, и отсутствие цифровой слежки, всё это становится новыми атрибутами роскоши. И, если ранее различия между колонизаторами и колонизируемыми были в цвете кожи, языке, религии, уровне развития науки и инженерной мысли, то сейчас эта грань стирается.
Всё это не новое явление и "внутренний колониализм" [4] существовал и ранее, сейчас лишь меняется форма его существования.
У этих же авторов есть интересные публикации о взаимосвязи законов и практик сбора данных и регулирования [5] и о datafication [6], процессе превращения в данные разных объектов и сторон нашей жизни.
Тем кто интересуется этой темой я также рекомендую обратить внимание на книги Шошанны Зубоф "Surveillance capitalism" [7] и сборник статей "The Datafied Society" [8] от группы авторов из Utrecht Data School [9]
Ссылки:
[1] https://colonizedbydata.com/
[2] https://www.sup.org/books/title/?id=28816
[3] https://blogs.lse.ac.uk/medialse/2020/03/19/colonising-ourselves-an-introduction-to-data-colonialism/
[4] https://en.wikipedia.org/wiki/Internal_colonialism
[5] https://policyreview.info/articles/analysis/making-data-colonialism-liveable-how-might-datas-social-order-be-regulated
[6] https://policyreview.info/concepts/datafication
[7] https://en.wikipedia.org/wiki/Surveillance_capitalism
[8] https://datafiedsociety.nl/the-book/
[9] https://dataschool.nl/
#data #privacy #government #datacolonialism
Ключевой аргумент в том что если исторический колониализм аннексировал территории, их ресурсы и тела тех кто на них работал, то дата колониализм захватывает проще и глубже: захват и контроль человеческой жизни через присвоение данных которые могут быть извлечены для получения прибыли.
На фоне пандемии коронавируса возникает и другой запрос. Запрос на социальную справедливость. В основе которого ситуация когда за деньги можно купить. И здоровье, и отсутствие цифровой слежки, всё это становится новыми атрибутами роскоши. И, если ранее различия между колонизаторами и колонизируемыми были в цвете кожи, языке, религии, уровне развития науки и инженерной мысли, то сейчас эта грань стирается.
Всё это не новое явление и "внутренний колониализм" [4] существовал и ранее, сейчас лишь меняется форма его существования.
У этих же авторов есть интересные публикации о взаимосвязи законов и практик сбора данных и регулирования [5] и о datafication [6], процессе превращения в данные разных объектов и сторон нашей жизни.
Тем кто интересуется этой темой я также рекомендую обратить внимание на книги Шошанны Зубоф "Surveillance capitalism" [7] и сборник статей "The Datafied Society" [8] от группы авторов из Utrecht Data School [9]
Ссылки:
[1] https://colonizedbydata.com/
[2] https://www.sup.org/books/title/?id=28816
[3] https://blogs.lse.ac.uk/medialse/2020/03/19/colonising-ourselves-an-introduction-to-data-colonialism/
[4] https://en.wikipedia.org/wiki/Internal_colonialism
[5] https://policyreview.info/articles/analysis/making-data-colonialism-liveable-how-might-datas-social-order-be-regulated
[6] https://policyreview.info/concepts/datafication
[7] https://en.wikipedia.org/wiki/Surveillance_capitalism
[8] https://datafiedsociety.nl/the-book/
[9] https://dataschool.nl/
#data #privacy #government #datacolonialism
www.sup.org
The Costs of Connection: How Data Is Colonizing Human Life and Appropriating It for Capitalism - Nick Couldry and Ulises A. Mejias
Just about any social need is now met with an opportunity to connect through digital means. But this convenience is not free—it is purchased with vast amounts of personal data transferred through shadowy backchannels to corporations using it to generate profit.…
Forwarded from Ivan Begtin (Ivan Begtin)
В РБК вышла статья про правительственный законопроект по запрету перепродажи данных Росреестра [1] и отрицательной реакции бизнеса на него. В статье есть выдержки из письма и нашей Ассоциации участников рынка данных (АУРД) и моя позиция и всех кто хоть как-то работает с данными Росреестра на коммерческой основе, в том что положения в законе приведут лишь к ухудшению сервисов для граждан, а Росреестр и Правительство вместо того чтобы запрещать работу с данными, вполне могли бы выступить с инициативой "оцивилизовывания" рынка данных. Но вот это вот дихотомичное воспрятие мира: либо всем пофиг, либо всё запретить, уж очень часто всплывает в новых регуляторных инициативах.
Ссылки:
[1] https://www.rbc.ru/economics/04/09/2020/5f4fb1259a794707a992ca09
#data #aurd
Ссылки:
[1] https://www.rbc.ru/economics/04/09/2020/5f4fb1259a794707a992ca09
#data #aurd
РБК
Бизнес выступил против запрета на перепродажу данных из Росреестра
Бизнес раскритиковал инициативу правительства о запрете перепродавать сведения из госреестра недвижимости — это уничтожит целый сегмент услуг и нанесет ущерб потребителям. Росреестр считает такие перепродажи угрозой правам граждан
Forwarded from Ivan Begtin (Ivan Begtin)
Незаслуженно упущенный мной из внимания доклад Public Provider versus Big Brother [1] о госполитике на основе современных технологий сбора данных. Подготовлен OPSI (Observatory of Public Service Information), структурой при ОЭСР и MBRCGI (Mohammed Bin Rashid Centre for Government Innovation) центром инноваций в госуправлении Саудовской Аравии.
Доклад, как можно догадаться из его названия, посвящён теме того как государства используют биометрию и сбор данных, для создания новых сервисов или же для систем слежки нового поколения. При том что я лично не восторге текстов и докладов публикуемых ОЭСР, в данном случае, он весьма лаконично и хорошо оформлен, с чёткими, хотя и очевидными рекомендациями, которые, если их перевести, выглядят так:
1. Активно занимайтесь вопросами, поднятыми этими технологиями.
2. Уделяйте приоритетное внимание завоеванию доверия со стороны общественности, чтобы успешно внедрять услуги, использующие эти технологии.
3. Работайте совместно не взирая на национальные границы, чтобы понять ограничения, подводные камни и возможности этих технологий.
Впрочем, в подобных международных докладах всегда самое интересное - это собранные со всего мира кейсы.
Например, такие как:
- сбор данных мобильных операторов в Чили для повышения безопасности женщин в общественном транспорте (Чили)
- системы идентификации по лицу для госуслуг и банковских сервисов (Сингапур)
- выработка политики сбора биометрии для гуманитарной помощи (Международный Красный Крест)
- проект HOPE по сбору гиперлокальных данных по качеству воздуха (Финляндия, Хельсинки)
- отправка дронов для снятия видео с мест происшествий/инцидентов (США, полиция Сан-Диего)
Про многие применения я лично, честно говоря, не знал и тем больше люблю читать про те примеры о которых ничего не знаю.
Ссылки:
[1] https://trends.oecd-opsi.org/trend-reports/public-provider-versus-big-brother
#data #privacy #government #policy
Доклад, как можно догадаться из его названия, посвящён теме того как государства используют биометрию и сбор данных, для создания новых сервисов или же для систем слежки нового поколения. При том что я лично не восторге текстов и докладов публикуемых ОЭСР, в данном случае, он весьма лаконично и хорошо оформлен, с чёткими, хотя и очевидными рекомендациями, которые, если их перевести, выглядят так:
1. Активно занимайтесь вопросами, поднятыми этими технологиями.
2. Уделяйте приоритетное внимание завоеванию доверия со стороны общественности, чтобы успешно внедрять услуги, использующие эти технологии.
3. Работайте совместно не взирая на национальные границы, чтобы понять ограничения, подводные камни и возможности этих технологий.
Впрочем, в подобных международных докладах всегда самое интересное - это собранные со всего мира кейсы.
Например, такие как:
- сбор данных мобильных операторов в Чили для повышения безопасности женщин в общественном транспорте (Чили)
- системы идентификации по лицу для госуслуг и банковских сервисов (Сингапур)
- выработка политики сбора биометрии для гуманитарной помощи (Международный Красный Крест)
- проект HOPE по сбору гиперлокальных данных по качеству воздуха (Финляндия, Хельсинки)
- отправка дронов для снятия видео с мест происшествий/инцидентов (США, полиция Сан-Диего)
Про многие применения я лично, честно говоря, не знал и тем больше люблю читать про те примеры о которых ничего не знаю.
Ссылки:
[1] https://trends.oecd-opsi.org/trend-reports/public-provider-versus-big-brother
#data #privacy #government #policy
Embracing Innovation
in Government Global Trends 2020
in Government Global Trends 2020
Public Provider versus Big Brother | Embracing Innovation
in Government Global Trends 2020
in Government Global Trends 2020
Forwarded from Комиссия по Регуляторике
Монетизация обезличивания
Активное обсуждение проекта федерального закона, посвященного изменению регулирования обезличенных персональных данных идет последние две недели во многих каналах:
@rspectr @ict_moscow_ai @DataEconomyRU @GDPRru @privacyexperts @bureaucraticsecurity @Lgltech @Persdata @rks_legal_talk @roskomsvoboda @antidigital
Но пока аргументы всех сторон про обезличивание / анонимизацию носят исключительно качественный характер.
Ни пояснительная записка к законопроекту, ни традиционно пустое ФЭО, ни обсуждаемые поправки не содержат никаких расчетов:
- издержки операторов персональных данных на сбор / хранение согласий на обработку данных;
- издержки операторов на обезличивание;
- оценка ущерба субъектов персональных данных при использовании их данных без согласия или при де-обезличивании;
- объем рынка big data (ведь весь сыр-бор именно из-за него) и перспективы его роста в России.
При отсутствии этих данных любые правовые модели носят исключительно умозрительный характер, скрывая реальные цели лоббистов любой из продвигаемых моделей регулирования.
Короче, покажите вашимозоли расчёты!
#PersonalData #data #данные #BigData #EvidenceBased
Активное обсуждение проекта федерального закона, посвященного изменению регулирования обезличенных персональных данных идет последние две недели во многих каналах:
@rspectr @ict_moscow_ai @DataEconomyRU @GDPRru @privacyexperts @bureaucraticsecurity @Lgltech @Persdata @rks_legal_talk @roskomsvoboda @antidigital
Но пока аргументы всех сторон про обезличивание / анонимизацию носят исключительно качественный характер.
Ни пояснительная записка к законопроекту, ни традиционно пустое ФЭО, ни обсуждаемые поправки не содержат никаких расчетов:
- издержки операторов персональных данных на сбор / хранение согласий на обработку данных;
- издержки операторов на обезличивание;
- оценка ущерба субъектов персональных данных при использовании их данных без согласия или при де-обезличивании;
- объем рынка big data (ведь весь сыр-бор именно из-за него) и перспективы его роста в России.
При отсутствии этих данных любые правовые модели носят исключительно умозрительный характер, скрывая реальные цели лоббистов любой из продвигаемых моделей регулирования.
Короче, покажите ваши
#PersonalData #data #данные #BigData #EvidenceBased
sozd.duma.gov.ru
№992331-7 Законопроект :: Система обеспечения законодательной деятельности
Информационный ресурс Государственной Думы. Здесь собрана информация о рассмотрении законопроектов и проектов постановлений Государственной Думы
Forwarded from Ассоциация участников рынка данных
Стал доступен текст Постановления Правительства РФ от 14 мая 2021 года №733 [1]. В тексте даны определения ряда понятий используемых в НСУД, в законопроекте поправок в 149-ФЗ.
Получается что сейчас постановление правительства дублирует положения проекта законопроекта. Документ уже подвергался критике экспертов [2], в том числе и довольно "циничной".
Ссылки:
[1] http://static.government.ru/media/files/UN7KKWcK3TgpjAmRcaTzRWUZezbIQQWf.pdf
[2] https://tttttt.me/smart_regulation/3449
[3] https://tttttt.me/CynExp/3241
#nsud #government #data
Получается что сейчас постановление правительства дублирует положения проекта законопроекта. Документ уже подвергался критике экспертов [2], в том числе и довольно "циничной".
Ссылки:
[1] http://static.government.ru/media/files/UN7KKWcK3TgpjAmRcaTzRWUZezbIQQWf.pdf
[2] https://tttttt.me/smart_regulation/3449
[3] https://tttttt.me/CynExp/3241
#nsud #government #data
Forwarded from Ivan Begtin (Ivan Begtin)
28 мая в 19:00 пройдут публичные дебаты "Тотальные данные: контроль или удобство" организованные Политехом [1]. Дебатировать буду я и исполнительный директор по исследованию данных Sber AI Михаил Степнов.
Мою позицию про приватность большинство давно знают, я её в каком-то более концентрированном виде подготовлю к дебатам.
Дебаты будут, также, транслировать на канале Политеха [2]. Не проходите мимо, приходите и смотрите.
Ссылки:
[1] https://polymus.ru/ru/museum/news/total-data/
[2] https://www.youtube.com/user/polytechnicum
#data #privacy #debates
Мою позицию про приватность большинство давно знают, я её в каком-то более концентрированном виде подготовлю к дебатам.
Дебаты будут, также, транслировать на канале Политеха [2]. Не проходите мимо, приходите и смотрите.
Ссылки:
[1] https://polymus.ru/ru/museum/news/total-data/
[2] https://www.youtube.com/user/polytechnicum
#data #privacy #debates
Forwarded from Ivan Begtin (Ivan Begtin)
В Север.Реалии статья о реалиях прохождения переписи населения, "Цена таким данным нулевая". Фальсификации при переписи населения [1], на ту же темы в Deutsche Welle Всероссийская перепись населения: чем опасна фальсификация данных [2] и выступление Натальи Зубаревич на Эхо Москвы [3].
Перепись у нас в стране очень политизирована, в ней выражается многое, и замороженные национальные конфликты [4] и общей уровень недоверия государству граждан и ещё много чего.
Но в чем права Наталья Зубаревич и экономисты и демографы так в том что данные переписи необходимы, насколько возможно качественные, насколько возможно подробные, насколько возможно локализованные, но анонимизированные. Да, государство и так владеет базами данных о граждан в виде данных в ФНС, в Пенсионном фонде, в ФСС, в ФОМС, а также базы данных SIM карт и передвижения есть у сотовых операторов и ещё у ряда коммерческиз и государственных структур есть разной степени актуальности, полноты и достоверности базы данных.
Перепись - это один из немногих дата-продуктов государства который хотя бы частично предоставляется исследователям, бизнесу и самим гражданам в виде аналитики, официальной статистики и иных срезов данных.
Поэтому то что граждане не доверяют переписчикам, то перепись охватывает не всё, это, конечно, скорее трагедия для всех кто потом эти данные будет использовать при принятии решений и мне не хочется злорадствовать в стиле "опять ничего не получается". Да лучше бы получалось и лучше бы в российские данные были доступны с раскрытием до муниципалитета и переписного участка, например, как в Австралии [5] или США и в других странах доступны данных до уровне блока (block level).
Ссылки:
[1] https://www.severreal.org/a/tsena-takim-dannym-nulevaya-falsifikatsii-pri-perepisi-naseleniya/31557044.html
[2] https://www.dw.com/ru/perepis-naselenija-rossii-chem-opasna-falsifikacija-dannyh/a-59801766?maca=rus-yandex_new_politics_mm-9641-xml
[3] https://echo.msk.ru/programs/personalno/2926988-echo/
[4] https://kazan.mk.ru/social/2021/11/11/ilnar-garifullin-po-tatarskim-rayonam-bashkortostana-ezdyat-bashkirskie-agitbrigady.html
[5] https://www.abs.gov.au/census/find-census-data
#opendata #data #census
Перепись у нас в стране очень политизирована, в ней выражается многое, и замороженные национальные конфликты [4] и общей уровень недоверия государству граждан и ещё много чего.
Но в чем права Наталья Зубаревич и экономисты и демографы так в том что данные переписи необходимы, насколько возможно качественные, насколько возможно подробные, насколько возможно локализованные, но анонимизированные. Да, государство и так владеет базами данных о граждан в виде данных в ФНС, в Пенсионном фонде, в ФСС, в ФОМС, а также базы данных SIM карт и передвижения есть у сотовых операторов и ещё у ряда коммерческиз и государственных структур есть разной степени актуальности, полноты и достоверности базы данных.
Перепись - это один из немногих дата-продуктов государства который хотя бы частично предоставляется исследователям, бизнесу и самим гражданам в виде аналитики, официальной статистики и иных срезов данных.
Поэтому то что граждане не доверяют переписчикам, то перепись охватывает не всё, это, конечно, скорее трагедия для всех кто потом эти данные будет использовать при принятии решений и мне не хочется злорадствовать в стиле "опять ничего не получается". Да лучше бы получалось и лучше бы в российские данные были доступны с раскрытием до муниципалитета и переписного участка, например, как в Австралии [5] или США и в других странах доступны данных до уровне блока (block level).
Ссылки:
[1] https://www.severreal.org/a/tsena-takim-dannym-nulevaya-falsifikatsii-pri-perepisi-naseleniya/31557044.html
[2] https://www.dw.com/ru/perepis-naselenija-rossii-chem-opasna-falsifikacija-dannyh/a-59801766?maca=rus-yandex_new_politics_mm-9641-xml
[3] https://echo.msk.ru/programs/personalno/2926988-echo/
[4] https://kazan.mk.ru/social/2021/11/11/ilnar-garifullin-po-tatarskim-rayonam-bashkortostana-ezdyat-bashkirskie-agitbrigady.html
[5] https://www.abs.gov.au/census/find-census-data
#opendata #data #census
Север.Реалии
"Цена таким данным нулевая". Фальсификации при переписи населения
14 ноября в России завершается Всероссийская перепись населения. Замглавы Росстата Павел Смелов в пятницу заявил, что в ней приняло участие более 99% населения. Незадолго до конца кампании студенты, работавшие переписчиками, рассказали о фактах, которые,…
Forwarded from Ivan Begtin (Ivan Begtin)
Печальная новость в том что похоже что данным переписи 2021 года доверять нельзя [1]. По опросу Левада-центра только 46% опрошенных приняли участие в переписи и основная причина неучастия в том что не пришёл переписчик.
Хуже всех от этой ситуации будет всем тем кто анализирует данные по стране, оценивает качество жизни, изучает то как устроены наши территории и как они могут развиваться. И раньше то было ощущение что "линзы сбиты", но сейчас они просто неверны.
Ссылки:
[1] https://www.levada.ru/2021/12/21/uchastie-rossiyan-v-perepisi/
#data #statistics #failure
Хуже всех от этой ситуации будет всем тем кто анализирует данные по стране, оценивает качество жизни, изучает то как устроены наши территории и как они могут развиваться. И раньше то было ощущение что "линзы сбиты", но сейчас они просто неверны.
Ссылки:
[1] https://www.levada.ru/2021/12/21/uchastie-rossiyan-v-perepisi/
#data #statistics #failure
www.levada.ru
Участие россиян в переписи
Данные об участии россиян во Всероссийской переписи населения, проходившей с 15 октября до 14 ноября 2021 года, с комментарием Сергея Захарова (заместитель директора Института демографии им. А.Г. Вишневского, НИУ ВШЭ) и Елены Чуриловой (научный сотрудник…
Forwarded from Ivan Begtin (Ivan Begtin)
В The Markup очередная хорошая статья про приватность [1], на сей раз о компаниях которые собирают данные из автомобилей и о автомобилях.
В общей сложности это 37 компаний связанных с индустрией подключений к автомобилям, в оригинале - connected vehicle data industry. При том что этот рынок считают относительно молодым, его оценивают от 300 до 800 миллиардов долларов США к 2030 году [2].
Из автомобиля собирается самая разная информация: местонахождение, скорость, когда нажат тормоз, какая музыка играет, была ли открыта дверь, внутренняя температура и так далее. Всё это собирается, обрабатывается локально и передаётся, например, производителю автомобиля.
В статье немало примеров, особенно компаний создающих хабы данных перепродаваемых, например, страховым компаниям.
Выводы там оптимистичные, в том что производители автомобилей начинают идти по пути Apple и предлагать приватность как часть услуги, давая возможность ограничивать передачу данными другим компаниям. Например, так делает Porshe, в этой индустрии.
Лично я не столь оптимистичен, потому что целью Apple было перестроить рынок под себя и не только повысить приватность, но снизить возможности её нарушения для конкурентов и сохранить такую возможность для себя.
Тем не менее я бы зафиксировал следующее именно в отношении автомобилей:
1. Тренд на усиление сбора данных с автомобилей сохраняется и усиливается. Данных собирается всё больше и с большей частотой и гранулярностью.
2. Технологии позволяют собирать данные хоть со всех машин в мире, ограничения скорее в количестве машин выпускаемых основными вендорами и наличию чипов для них.
3. Учитывая значимость этих данных национальные регуляторы точно будут требовать их локализацию, а полиция захочет иметь к ним доступ.
Ссылки:
[1] https://themarkup.org/the-breakdown/2022/07/27/who-is-collecting-data-from-your-car
[2] https://www.documentcloud.org/documents/22120767-capgeminiinvent_vehicledatamonetization_pov_sep2020#document/p5/a2130948
#privacy #data
В общей сложности это 37 компаний связанных с индустрией подключений к автомобилям, в оригинале - connected vehicle data industry. При том что этот рынок считают относительно молодым, его оценивают от 300 до 800 миллиардов долларов США к 2030 году [2].
Из автомобиля собирается самая разная информация: местонахождение, скорость, когда нажат тормоз, какая музыка играет, была ли открыта дверь, внутренняя температура и так далее. Всё это собирается, обрабатывается локально и передаётся, например, производителю автомобиля.
В статье немало примеров, особенно компаний создающих хабы данных перепродаваемых, например, страховым компаниям.
Выводы там оптимистичные, в том что производители автомобилей начинают идти по пути Apple и предлагать приватность как часть услуги, давая возможность ограничивать передачу данными другим компаниям. Например, так делает Porshe, в этой индустрии.
Лично я не столь оптимистичен, потому что целью Apple было перестроить рынок под себя и не только повысить приватность, но снизить возможности её нарушения для конкурентов и сохранить такую возможность для себя.
Тем не менее я бы зафиксировал следующее именно в отношении автомобилей:
1. Тренд на усиление сбора данных с автомобилей сохраняется и усиливается. Данных собирается всё больше и с большей частотой и гранулярностью.
2. Технологии позволяют собирать данные хоть со всех машин в мире, ограничения скорее в количестве машин выпускаемых основными вендорами и наличию чипов для них.
3. Учитывая значимость этих данных национальные регуляторы точно будут требовать их локализацию, а полиция захочет иметь к ним доступ.
Ссылки:
[1] https://themarkup.org/the-breakdown/2022/07/27/who-is-collecting-data-from-your-car
[2] https://www.documentcloud.org/documents/22120767-capgeminiinvent_vehicledatamonetization_pov_sep2020#document/p5/a2130948
#privacy #data
themarkup.org
Who Is Collecting Data from Your Car? – The Markup
A firehose of sensitive data from your vehicle is flowing to a group of companies you’ve probably never heard of