Spark in me
2.73K subscribers
1.29K photos
71 videos
118 files
2.91K links
Lost like tears in rain. DS, ML, a bit of philosophy and math. No bs or ads.
Download Telegram
Про визуализации есть отличный курс на Курсере (вторая часть курса про питон от University of Michigan -https://www.coursera.org/learn/python-plotting). Там тоже учат на примерах, но там много фокуса на "красивые сложные чартики, влезая в нутро либы".

Есть также cheat sheet про Matplotlib (и seaborn, поскольку тот просто оболочка) - тут все проще
- https://goo.gl/HOYHNH
- - Тут не пишут про такие вещи для jpn как %matplotlib inline и %matplotlib notebook
-- Для простых задач (которые не решает seaborn) - такой чит-шит заменяет документацию

#data_science
ЦР ВШЭ и экономика Украины, Казахстана и Белоруссии (мир сходит с ума)
- ЦР ВШЭ - https://goo.gl/3LCruR
- Последний отчет - https://goo.gl/aiEkon

- Беларусь
-- ВВП - https://goo.gl/nygcIC
-- Инвестиции - https://goo.gl/Z1WQDs
-- Газовый спор
https://goo.gl/1XoFHo
https://goo.gl/OPvXuF
https://goo.gl/a7MafQ
https://goo.gl/XKJ5AK
- Казахстан
-- Тут все просто - https://goo.gl/Mi3HBo
- Украина
-- Замещение своего бизнеса импортом, помощь МФВ, конфликт с Россией
https://goo.gl/JJgxHK
https://goo.gl/T76wHF
https://goo.gl/OKEwbk
https://goo.gl/JdMRt3

Реальное видео от человека с Украины (он сам уже удалил его, и залил на английском, алгоритмы мешают искать такие видео)
https://www.youtube.com/watch?v=8aFOZIyL9jQ

#sick_sad_world
Осилят ли они escrow
Ставил на работе себе Sublime Text 3 - вот хороший список расширений для него
http://aslanbakan.com/en/blog/33-essential-sublime-text-plugins-for-all-developers/
Forwarded from Alexey Nikushin
Возможно нейрокурятник не такая уж и глупая идея

Я написал людям, которые вроде как опубликовали эту картинку...
Вот вроде находишь такое и радуешься, мол свет в массы несут
https://postgrespro.ru/products/postgrespro

А потом видишь первопричину - http://prntscr.com/f9spv5

И прекрасно и ужасно одновременно =)
Внезапно образовательные курсы про админство постгреса на русском
https://postgrespro.ru/education/courses

Мы всегда коптили из документации и stack-overflow

#sql
Интересная заметка про то, почему зачастую DS не приносит ценности на практике
https://goo.gl/G1Erh5

#data_science
Forwarded from Roem.ru
В мессенджере Telegram запустили сервис онлайн-платежей. В России система будет работать при поддержке Яндекс.Денег и Qiwi. Как отмечают представители приложения, к платформе они «присоединятся чуть позже». Подключиться к мессенджеру могут и другие системы. Платить можно также с помощью Apple Pay и Android Pay. Раньше сообщалось, что большая часть платежей будет проходить через американскую Stripe, который практически не работает с Россией и СНГ.

https://roem.ru/19-05-2017/250286/telegram-with-ya-money/
То, что показалось интересным / занятным / необычным их 5 видео в цикле www.fast.ai
- Само видео - https://goo.gl/W3yaRw
- Про сверточные нейросети
-- Используя Keras dropout и batch-normalization почти польностью заменяют регуляризацию и она по сути не нужна
-- При прочих равных batch-norm и выбор наиболее современного метода оптимизации (adam, например) позволяет не париться насчет выбора гипер-параметра learning rate
-- Использование functional API (к примеру) позволяет использовать как картинки как input, так и их мета-данные, например их размер, кто снял их, модель аппарата итд итп

- Про collaborative filtering и кино
-- На датасете отзывов imdb, если сначала применить collaborative filtering а потом PCA (по сути примерно то же самое, что в этом файле https://goo.gl/F2mQaS), то получаются интересные вещи
-- Так выглядят самые низкие bias значения вытекающие из алгоритма - или простыми словами - самые плохие фильмы после учета мнений публики по набору латентных переменных - https://goo.gl/lpHf93
-- Так - самые высокие - https://goo.gl/p1XxZn
-- Так высокие значение первой главной компоненты - https://goo.gl/uRQWQC
-- Так низкие - https://goo.gl/9rsVcZ
-- Вообще первые три главные компоненты имеют значения i) утонченный фильм <=> кассовый хит ii) классический фильм <=> новый фильм iii) жестокий / страшный <=> счастливый фильм

- Переход от CNN к NLP
-- Самый простой подход bag of words дает точность порядка 80-90% на простых задачах на относительно больших датасетах
-- При анализе текстов используются так называемые embeddings, которые аналогичны латентным переменным в коллаборативном фильтринге
-- Самые популярные пре-тренированные вектора из embeddings называются word2vec и glove
-- Подход к сбору данных - берется ОЧЕНЬ много данных, вычленяются строки из 11 слов, 6-е слово заменяется на случайное, модель тренируется отличать настоящие строки от "поддельных"


#data_science
Отличная статья про то, как правильно использовать matlplotlib
- Картинка - https://goo.gl/4D2Oag
- Сама статья - https://goo.gl/vUPEyt
- Лучшие советы
Learn the basic matplotlib terminology, specifically what is a Figure and an Axes .
Always use the object-oriented interface. Get in the habit of using it from the start of your analysis.
Start your visualizations with basic pandas plotting.
Use seaborn for the more complex statistical visualizations.
Use matplotlib to customize the pandas or seaborn visualization.
This graphic from the matplotlib faq is gold. Keep it handy to understand the different terminology of a plot.

#data_science
Блог fast.ai про то, как заинтересовать детей заниматься наукой и созданием чего-либо
http://www.fast.ai/2017/05/07/parent/
Можно прикинуться большими детьми.
Давно хотел поделиться мыслями про интуицию, нашу карту артистов, страх перед новым и "предчувствия" давно изобретенных математических методов
http://spark-in.me/post/data-intuition

#data_scieence
https://career.ru/vacancy/20456366

"
Сфера деятельности: предотвращение экологической катастрофы, производство натуральных продуктов питания, возрождение крестьянства России, летописная история, инициирование запрета абортов и пр.
"

Из похожего
- Фильтры петрика
- Когда я учился в институте моя девушка нашла вакансию с требованиями (так и было написано): i) идеальное знание трех иностранных языков ii) модельная внешность и рост 180см iii) черный цвет кожи - зарплата 150 тр

#sick_sad_world