Spark in me
2.73K subscribers
1.28K photos
71 videos
118 files
2.91K links
Lost like tears in rain. DS, ML, a bit of philosophy and math. No bs or ads.
Download Telegram
Forwarded from Spark in me
Если вы знаете прикладные алгоритмы, но не понимаете как работает один из самых "популярных" и "современных" сегодня алгоритмов машинного обучения
Для всех тех, кто пришел недавно - это просто канал-сборник реально интересных курсов, статей, алгоритмов, статистики. Всего, что относится к статистике, интернету, data science. Ведем вдвоем с девушкой без рассуждений в стиле "журналисты придумали".
Вольная цитатка человека из отдела DS тинькофф - на практике деревья используем только чтобы быстро понять есть что-то или нет. На практике в бою их тяжело поддерживать.
Пара интересных фактов по итогу общения с людьми из медиалогии: i) в день собирается 500k строк новостей и 50m строк из соцсетей ii) новости работают на большом количестве машин которые соединены на MySQL в большую виртуальную iii) новые проекты - PostgreSQL + Elastic Search + Hadoop iv) для старых продуктов используются ОЛАП системы, для новых иногда питон и Hadoop
http://www.openhab.org/ - решение для интеграции разных источников данных + визуализация, если вы хотите отслеживать свой бойлер, к примеру...(сельский дом)
Отличный блог с описанием практического анализа данных, как по сути, так и с точки зрения задротства - https://habrahabr.ru/users/alexkuku/topics/
Простые слайды про распределение Пуассона (принцип 20-80)
Книжка про статистику для программеров (!)
Если вы используете питоновый jupiter notebook на одной машине с рядом людей, вот конфиг для запуска с доступом в локалке - sudo jupyter notebook --no-browser --port=8889 --ip=192.168.1.45
Machine Learning Cheat Sheet на 100 страниц...на всякий случай