Что делать с НЕнормальным распределением?
Как известно, моделям (особенно линейным) нравится, когда данные имеют нормальное распределение. Но что делать, если это не так? Рассказываем про два варианта: простой и посложнее.
😻 #train #analytics #python
Как известно, моделям (особенно линейным) нравится, когда данные имеют нормальное распределение. Но что делать, если это не так? Рассказываем про два варианта: простой и посложнее.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥45🌚8❤6
Кластеризуем алгоритмы кластеризации
Алгоритмов кластеризации на свете целая куча. Чтобы помочь вам лучше их запомнить и понять, мы разбили их на группы по принципу работы: групп получилось всего 6 – вот они слева направо.
😻 #train
Алгоритмов кластеризации на свете целая куча. Чтобы помочь вам лучше их запомнить и понять, мы разбили их на группы по принципу работы: групп получилось всего 6 – вот они слева направо.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍58❤🔥11❤5
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍40🤯8❤4🔥3
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32🔥7❤3
Как сделать линейную регрессию устойчивой к выбросам
Всем (ну почти ) хороша линейная регрессия, вот только к выбросам неустойчива. Хотя и это можно исправить: краткий гайд – в карточках.
😻 #train
Всем (
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍72🔥21❤8
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍40🔥9❤4
А мы написали нашу первую статью на Хабр!
Посвятили ее крутой библиотеке RecTools от коллег из МТС. Внутри:
▶️ за что мы так любим эту библиотеку;
▶️ ликбез по основным рексис-моделям (ItemKNN, ALS, SVD, Lightfm, DSSM);
▶️ как готовить данные и запускать модели в библиотеке;
▶️ как рассчитывать метрики;
▶️ оставили много полезных дополнительных материалов.
Очень старались, так что ждем ваших реакций!
😻 #NN #train
Посвятили ее крутой библиотеке RecTools от коллег из МТС. Внутри:
Очень старались, так что ждем ваших реакций!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍55🔥20👏4🌚3
Как менять код на Python после запуска
Представьте: поставили вы обучаться модельку, радуетесь, но внезапно после первой эпохи осознаете, что забыли запринтить лос… И перезапускать не хочется (время же!), и без логирования как-то грустно живется.
Оказывается, есть волшебная таблетка – утилита reloading. Она перезагружает тело цикла после каждой итерации без потери прогресса. То есть вы добавляете что-то в цикл, и на следующей итерации код работает уже по-другому.
Установить чудо можно через pip.
😻 #train #python
Представьте: поставили вы обучаться модельку, радуетесь, но внезапно после первой эпохи осознаете, что забыли запринтить лос… И перезапускать не хочется (время же!), и без логирования как-то грустно живется.
Оказывается, есть волшебная таблетка – утилита reloading. Она перезагружает тело цикла после каждой итерации без потери прогресса. То есть вы добавляете что-то в цикл, и на следующей итерации код работает уже по-другому.
Установить чудо можно через pip.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍98❤12🫡7🔥5😁4⚡1
Продолжаем исследовать линейную регрессию
Да-да, этот алгоритм не так прост, как кажется. Попробуем найти в нем еще некоторые загвоздки и понять, как их исправить.
😻 #train
Да-да, этот алгоритм не так прост, как кажется. Попробуем найти в нем еще некоторые загвоздки и понять, как их исправить.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤54👍17🔥11🤯2
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍82❤8⚡6
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤35👍13🔥12❤🔥5
Как понять бустинг за 30 секунд
Шаг 1. Посмотреть на картинку сверху, на которой просто и изящно показано, что:
– бустинг - итеративный процесс
– каждый следующий эстиматор уделяет большее внимание неправильно классифицированным образцам из предыдущего дерева
– окончательный прогноз представляет собой взвешенную комбинацию всех прогнозов
Шаг 2. Поздравляем! Вы великолепны.
Шаг 2'. Но если все-таки хотите подробнее – читайте этот пост.
😻 #train
Шаг 1. Посмотреть на картинку сверху, на которой просто и изящно показано, что:
– бустинг - итеративный процесс
– каждый следующий эстиматор уделяет большее внимание неправильно классифицированным образцам из предыдущего дерева
– окончательный прогноз представляет собой взвешенную комбинацию всех прогнозов
Шаг 2. Поздравляем! Вы великолепны.
Шаг 2'. Но если все-таки хотите подробнее – читайте этот пост.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥25👍13❤6
Знали ли вы, что случайные деревья можно тестить на трейне?
Такой метод называется out-of-bag validation (в комментах даем приз за самый смешной перевод названия на русский). Давайте разбираться, почему это работает.
😻 #train
Такой метод называется out-of-bag validation (в комментах даем приз за самый смешной перевод названия на русский). Давайте разбираться, почему это работает.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥45❤6👍4⚡3😁3🕊2