Журналистика данных
4.35K subscribers
1K photos
32 videos
16 files
1.29K links
Инструменты современных медиа, массивы информации, наблюдения и тренды
Download Telegram
На портале открытых данных правительства Москвы появился Реестр мест (участков) захоронений на городских кладбищах города Москвы

В виде карты и файла содержатся данные о более 7 млн захоронений на кладбищах Москвы и Московской области

(тема от @soviet_moscow)
Из местных дореволюционных газет, хранящихся в Российской национальной библиотеке, следует выделить Собрание губернских ведомостей, которые издавались с 1838 года и, в большинстве случаев, по 1917 год.

Губернские ведомости зачастую были самой первой и на протяжении десятилетий единственным печатным изданием целых регионов. В 1838 году таких газет было 40, а всего в нашем фонде их насчитывается свыше 80, выходивших с периодичностью от 1 до 6 раз в неделю.

Губернские ведомости издавались в двух частях: официальной и неофициальной. Официальная часть выходила за подписью одного из высших губернских чиновников, редактором неофициальной части также назначался один из чиновников администрации. В официальной части публиковались постановления правительства и распоряжения губернского начальства, включая объявления о розыске беглых крестьян, объявления о продаже имений, о сборе казенных податей и недоимок, о вызове к торгам и т. д.

Неофициальная часть, в первые годы издания именовавшаяся «Прибавлениями…», наиболее интересна для нас, так как содержит драгоценные сведения по истории, экономике, географии и культуре края, ценнейшие статистические сведения, этнографические и фольклорные материалы

Среди редакторов и сотрудников неофициальной части губернских ведомостей было немало образованных, талантливых людей, которые определяли характер этой части и разработали ее программу.

Ценнейшее приложение к Губернским ведомостям начала XX столетия – это списки выборщиков в Государственную думу. Они содержали сведения об имуществе, национальности, местожительстве и возрасте

На сайте РНБ размещена виртуальная экскурсия, посвященная этим уникальным изданиям. Информация об оцифрованных губернских ведомостях доступна в Путеводителе РНБ «Газеты в сети и вне её».
#историяпрессы
👍7
Визуализация данных — важный инструмент для всех, кто имеет дело с данными. Хорошо сконструированные графики помогают принимать верные решения, замечать паттерны в данных и искать инсайты для развития продукта.

Вместе с Анастасией Кузнецовой, специалистом по визуализации данных и автором канала «настенька и графики», собрали 7 принципов визуализации данных, которые делают инфографику не только эстетичной, но и эффективной.

Полную версию материала читайте в Точке Зрения
👍3
Задачка на логику и поиск в интернете. В самом начале рассказа Чехова "Беседа пьяного с трезвым чертом" написано, что герой пьет уже 16-ю рюмку водки -- как вы считаете, какой емкости была рюмка? Самые убедительные ответы опубликуем
https://ilibrary.ru/text/1138/p.1/index.html
👍6
Forwarded from Channel No. 6
Почему раньше чтоб доказать что ты не робот вводили текст с картинки, а теперь ищут светофоры и причем тут нейросеть

Ка́пча (от CAPTCHA — англ. Completely Automated Public Turing test to tell Computers and Humans Apart — полностью автоматизированный публичный тест Тьюринга для различения компьютеров и людей) — компьютерный тест, используемый для того, чтобы определить, кем является пользователь - человек или компьютер.

Основная идея теста: предложить пользователю такую задачу, которая с лёгкостью решается человеком, но крайне сложна и трудоёмка для компьютера. Появилась капча в 2000 году. 10 лет назад в день в мире примерно 320 млн раз вводили капчу.

Изначально это была картинка с искаженным словом - нужно было ввести его текстом. В 2007 году в институте Карнеги придумали показывать пользователю 2 картинки, при этом текст или цифры с одной система знала, а второй фрагмент для нее был неизвестен (это были кусочки отсканированных книг и газет из библиотек, которые не удалось распознать в силу брака чернил или замятия при сканировании) и назвали это рекапча. Если 9 из 10 пользователей выдавали одинаковый текст для такого фрагмента, то система признавала его распознанным. В день оцифровывалось примерно 100 миллионов слов, что давало примерно 2,5 миллиона книг в год.

В 2007 году рекапчу купил Google. Но вот уже пару лет как для доказательства что ты не робот не нужно вводить текст, нужно выбрать среди картинок те, где есть велосипеды, автобусы или гидранты. А объясняется это вот как.

Распознавание миллионов слов в год было загружено в нейросеть и за несколько лет она научилась распознавать слова сама даже на фрагментах с замятыми буквами или плохо пропечатанные. С одной стороны значит нейросеть сможет обойти рекапчу, а с другой раз миллионы пользователей смогли научить сами того не зная ИИ как распознать любой текст то теперь нужно заставить их обучать новую нейросеть - которая будет автоматом различать важные дорожные объекты. А когда она обучится ее отправят управлять автопилотами в автомобилях
👍6