Spark in me
2.73K subscribers
1.29K photos
71 videos
118 files
2.91K links
Lost like tears in rain. DS, ML, a bit of philosophy and math. No bs or ads.
Download Telegram
Ставил на работе себе Sublime Text 3 - вот хороший список расширений для него
http://aslanbakan.com/en/blog/33-essential-sublime-text-plugins-for-all-developers/
Forwarded from Alexey Nikushin
Возможно нейрокурятник не такая уж и глупая идея

Я написал людям, которые вроде как опубликовали эту картинку...
Вот вроде находишь такое и радуешься, мол свет в массы несут
https://postgrespro.ru/products/postgrespro

А потом видишь первопричину - http://prntscr.com/f9spv5

И прекрасно и ужасно одновременно =)
Внезапно образовательные курсы про админство постгреса на русском
https://postgrespro.ru/education/courses

Мы всегда коптили из документации и stack-overflow

#sql
Интересная заметка про то, почему зачастую DS не приносит ценности на практике
https://goo.gl/G1Erh5

#data_science
Forwarded from Roem.ru
В мессенджере Telegram запустили сервис онлайн-платежей. В России система будет работать при поддержке Яндекс.Денег и Qiwi. Как отмечают представители приложения, к платформе они «присоединятся чуть позже». Подключиться к мессенджеру могут и другие системы. Платить можно также с помощью Apple Pay и Android Pay. Раньше сообщалось, что большая часть платежей будет проходить через американскую Stripe, который практически не работает с Россией и СНГ.

https://roem.ru/19-05-2017/250286/telegram-with-ya-money/
То, что показалось интересным / занятным / необычным их 5 видео в цикле www.fast.ai
- Само видео - https://goo.gl/W3yaRw
- Про сверточные нейросети
-- Используя Keras dropout и batch-normalization почти польностью заменяют регуляризацию и она по сути не нужна
-- При прочих равных batch-norm и выбор наиболее современного метода оптимизации (adam, например) позволяет не париться насчет выбора гипер-параметра learning rate
-- Использование functional API (к примеру) позволяет использовать как картинки как input, так и их мета-данные, например их размер, кто снял их, модель аппарата итд итп

- Про collaborative filtering и кино
-- На датасете отзывов imdb, если сначала применить collaborative filtering а потом PCA (по сути примерно то же самое, что в этом файле https://goo.gl/F2mQaS), то получаются интересные вещи
-- Так выглядят самые низкие bias значения вытекающие из алгоритма - или простыми словами - самые плохие фильмы после учета мнений публики по набору латентных переменных - https://goo.gl/lpHf93
-- Так - самые высокие - https://goo.gl/p1XxZn
-- Так высокие значение первой главной компоненты - https://goo.gl/uRQWQC
-- Так низкие - https://goo.gl/9rsVcZ
-- Вообще первые три главные компоненты имеют значения i) утонченный фильм <=> кассовый хит ii) классический фильм <=> новый фильм iii) жестокий / страшный <=> счастливый фильм

- Переход от CNN к NLP
-- Самый простой подход bag of words дает точность порядка 80-90% на простых задачах на относительно больших датасетах
-- При анализе текстов используются так называемые embeddings, которые аналогичны латентным переменным в коллаборативном фильтринге
-- Самые популярные пре-тренированные вектора из embeddings называются word2vec и glove
-- Подход к сбору данных - берется ОЧЕНЬ много данных, вычленяются строки из 11 слов, 6-е слово заменяется на случайное, модель тренируется отличать настоящие строки от "поддельных"


#data_science
Отличная статья про то, как правильно использовать matlplotlib
- Картинка - https://goo.gl/4D2Oag
- Сама статья - https://goo.gl/vUPEyt
- Лучшие советы
Learn the basic matplotlib terminology, specifically what is a Figure and an Axes .
Always use the object-oriented interface. Get in the habit of using it from the start of your analysis.
Start your visualizations with basic pandas plotting.
Use seaborn for the more complex statistical visualizations.
Use matplotlib to customize the pandas or seaborn visualization.
This graphic from the matplotlib faq is gold. Keep it handy to understand the different terminology of a plot.

#data_science
Блог fast.ai про то, как заинтересовать детей заниматься наукой и созданием чего-либо
http://www.fast.ai/2017/05/07/parent/
Можно прикинуться большими детьми.
Давно хотел поделиться мыслями про интуицию, нашу карту артистов, страх перед новым и "предчувствия" давно изобретенных математических методов
http://spark-in.me/post/data-intuition

#data_scieence
https://career.ru/vacancy/20456366

"
Сфера деятельности: предотвращение экологической катастрофы, производство натуральных продуктов питания, возрождение крестьянства России, летописная история, инициирование запрета абортов и пр.
"

Из похожего
- Фильтры петрика
- Когда я учился в институте моя девушка нашла вакансию с требованиями (так и было написано): i) идеальное знание трех иностранных языков ii) модельная внешность и рост 180см iii) черный цвет кожи - зарплата 150 тр

#sick_sad_world
Кто-то задонатил 1000 рублей. Значит кому-то наш канал помог.
=)
Полезная в хозяйстве фича Keras - callbacks
https://keras.io/callbacks/

Оставил и оно само тренируется и не будет оверфиттинга.
Альтернатива - сохранять веса на каждом шагу, но если файл с весами весит много, а места на диске мало - это не подойдет.
Ковыряю визуализацию фильтров нейросетей.
Вот рисунки, которые дают максимальную активацию первого слоя в VGG-16
- https://goo.gl/fPBY43
Финалисты AI-гранта.
Какие-то совсем классные, какие-то не очень.
https://aigrant.org