Spark in me
2.74K subscribers
1.27K photos
71 videos
118 files
2.9K links
Lost like tears in rain. DS, ML, a bit of philosophy and math. No bs or ads.
Download Telegram
Интересное в мире DS / ML
- Рассылка import AI - https://goo.gl/rPQuBn
- Kaggle достиг 1M пользователей - https://goo.gl/YUZtGZ после покупки Гуглом
- Генерация 4К лиц с помощью нейросетей - https://goo.gl/ORAIev
- Фейсбук тренирует ImageNet за 1 час на 256 видеокартах
-- Nuff said - https://goo.gl/wPlnw4
- https://research.fb.com/publications/ImageNet1kIn1h/
- Классная статья про оверинжиниринг - https://goo.gl/NbA7Tg
-- Особенно поржал над этим - https://goo.gl/ymvBqG
-- Решение должно соответствовать задаче!
-- "As of 2016, Stack Exchange served 200 million requests per day, backed by just four SQL servers: a primary for Stack Overflow, a primary for everything else, and two replicas." Кек!
- Рассуждения про преимущества и недостатки публикаций на arXiv - https://goo.gl/nEIvoa
- Попытки тренировать нейросети сразу на звуке и картинках - https://goo.gl/azWVSP
- Определение настроения текста на отзывах на Amazon - https://blog.openai.com/unsupervised-sentiment-neuron/

#data_science
Случайно натолкнулся на минималистичную тему для блога (третий или четверный раз кажется) в блоге ML специалиста
https://github.com/hemangsk/Gravity

#internet
Классная статья про отличия RNN и простых NN (рекуррентные нейросети).
- Статья - http://karpathy.github.io/2015/05/21/rnn-effectiveness/
- Картинка in a nutshell - https://goo.gl/2BZpjx
- Цитата "If training vanilla neural nets is optimization over functions, training recurrent nets is optimization over programs."

#data_science
Мысли вслух.

Принят законопроект о регулировании мессенджеров в России (http://ift.tt/2s0DyMk)

Там написано:
«Организатор распространения информации в сети Интернет, обеспечивающий предоставление информационно-коммуникационных сервисов обмена мгновенными сообщениями... обязан обеспечивать передачу электронных сообщений только тех пользователей сети Интернет, которые идентифицированы в порядке, устанавливаемом правительством Российской Федерации".

Левин акцентирует: мессенджеры находятся вне правового поля РФ.

Я понимаю всё, кроме того, как этот закон согласуется с Конституцией РФ, вторая часть статьи 23-ей которой гласит:

Каждый имеет право на тайну переписки, телефонных переговоров, почтовых, телеграфных и иных сообщений. Ограничение этого права допускается только на основании судебного решения (http://constrf.ru/razdel-1/glava-2/st-23-krf).


Статью я понимаю так: был суд, было решение, в котором говорится: "человек, большой брат теперь следит за тобой. Следит за тобой до даты, обозначенной в решении. Это произошло потому, что ты виноват вот в этом и потенциально опасен".

Возможно, я ошибаюсь и на самом деле нас хотят спасти от мошенников/террористов/ в сети, но очень уж не хочется, чтобы с 1 января 2018 года Россия превратилась в страну 145 миллионов условно осужденных людей.
Заметка про Гугл, Андроид и телефоны (и эппл).
Недавно появилась версия tensorflow для андроид (пример видео https://youtu.be/kFWKdLOxykE). Apple тоже выпустили что-то подобное. С ее помощью нельзя тренировать модели, но можно делать предсказания по готовым моделям.
Давайте вспомним как Гугл собирал обучающие выборки для гугл книг - через сервис recaptcha.
У Гугла также есть сервис Гугл фото с сотнями миллионов пользователей и Google Street view.
Последний кусок паззла - разметка датасетов вещь муторная, сложная и неблагодарная.
Естественно все фото на гугл фотках никто не размечает.
А теперь представьте что в следующей версии андроид после того как вы сделаете что-то с новым фото и гугл решит, что его классификаторам не хватает именно вашего фото (через грубое предсказание на вашем мобильнике), он спросит вас - а есть ли объект X на фото?
Внезапно немного админства - знакомый разработчик посоветовал 2 ресурса, если вы хотите поставить https вообще не парясь на свой мини-проект
- https://letsencrypt.org
- https://certbot.eff.org/#ubuntuxenial-nginx

Не могу гарантировать 100% уверенность, анализируйте на свой страх и риск.

#linux
Утром затестил, все работало, потом сайт лежал, подписчики написали в итоге.
Зато нашелся такой бесплатный сервис
- https://uptimerobot.com

#internet
Что сделать следующим?

▪️ 7% (9) 1 Обещали про сорс-код сайта
🔸

▫️ 32% (41) 2 Новый крутой проект типа курятника
🔸🔸🔸🔸🔸🔸🔸🔸

▪️ 4% (6) 3 Про сервис работы с ошибками
🔸

▫️ 6% (8) 4 про фронтенд
🔸

▪️ 14% (18) 5 Про маркетинговые фичи
🔸🔸🔸

▫️ 22% (29) 6 Про анализ семантического ядра
🔸🔸🔸🔸🔸

▪️ 10% (13) 7 Визулизировать внутрении слои курятника!
🔸🔸

▫️ 2% (3) 8 Свое (в личку)

🔠 Можно выбрать несколько вариантов
👥 127 (97) - всего голосов
👥 27(1133) - в этом чате
Экономика в картинках ЦР ВШЭ
- Россия
-- Динамика in a nutshell - https://goo.gl/ExzHEZ
-- Отчет https://goo.gl/dyZPcH

- Белоруссия, Украина и Казахстан
-- Отчет - https://goo.gl/w5cXok

Ничего не изменилось в лучшую сторону.

#statistics
Картинка для вашей интуиции - двумерная логистическая регрессия
https://goo.gl/zRbU8K
#data_science
Картинки, которые мне показались интересными для развития интуиции для понимания SVM
- https://goo.gl/nCyCMK
- https://goo.gl/5SoUiH
- https://goo.gl/nifEsN

#data_science
Отличные визуализации из второй недели курса https://www.coursera.org/learn/python-machine-learning/, которые отлично иллюстрируют суть разных методов классификации:
- Пример на примере случайных лесов - https://goo.gl/pkYfo9
- html - https://goo.gl/BZp4HE
- ipynb - https://goo.gl/ssjQyF

Очень красиво и разбирабельно на копипасту.
#data_science
Очень понравились статья и книга про самообучение в долгосрочной перспективе.
Так, что аж написал много слов про это.

http://spark-in.me/post/art-of-learning

#philosophy
Тут также можно найти ip-адреса по городам
https://dev.maxmind.com/geoip/geoip2/geolite2/

#internet