Spark in me
2.69K subscribers
1.41K photos
74 videos
119 files
2.99K links
Lost like tears in rain. DS, ML, a bit of philosophy and math. No bs or ads.
Download Telegram
Как суды принимают решения по искам про товарные знаки
На полмиллиарда пользователей за 2 года выросли WhatsApp и Messenger, Instagram - на 300 млн. Огромные, огромные цифры...
лол
Forwarded from Spark in me
Если вы знаете прикладные алгоритмы, но не понимаете как работает один из самых "популярных" и "современных" сегодня алгоритмов машинного обучения
Для всех тех, кто пришел недавно - это просто канал-сборник реально интересных курсов, статей, алгоритмов, статистики. Всего, что относится к статистике, интернету, data science. Ведем вдвоем с девушкой без рассуждений в стиле "журналисты придумали".
Вольная цитатка человека из отдела DS тинькофф - на практике деревья используем только чтобы быстро понять есть что-то или нет. На практике в бою их тяжело поддерживать.
Пара интересных фактов по итогу общения с людьми из медиалогии: i) в день собирается 500k строк новостей и 50m строк из соцсетей ii) новости работают на большом количестве машин которые соединены на MySQL в большую виртуальную iii) новые проекты - PostgreSQL + Elastic Search + Hadoop iv) для старых продуктов используются ОЛАП системы, для новых иногда питон и Hadoop
Сайт с данными по Москве. https://data.mos.ru/ . Зашел в несколько - там вроде как все чисто и нормально, но на примере пары датасетов, которые в прошлом парсили, данных кажется на порядок меньше чем в гугл-картах или 2Gis.