Зачем нам энтропия и как считать information gain
Сегодня речь пойдет о деревьях решений. Этот алгоритм строится на базе двух понятий – энтропии и прироста информации. Разберемся, что это такое, и на примере рассмотрим, как благодаря этим сущностям из данных строятся деревья решений.
😻 #train
Сегодня речь пойдет о деревьях решений. Этот алгоритм строится на базе двух понятий – энтропии и прироста информации. Разберемся, что это такое, и на примере рассмотрим, как благодаря этим сущностям из данных строятся деревья решений.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍39🔥7😐1
Что-то новенькое! MLOps at Gucci: From Zero to Hero
Доклад от представителей ML-направления Gucci про их процесс MLOps. Презентация, конечно, красивая (что ожидаемо). Рассказывают про внутренние процессы, платформы и задачи. Приятный рассказ на вечер. Советуем!
😻 #forfun
Доклад от представителей ML-направления Gucci про их процесс MLOps. Презентация, конечно, красивая (что ожидаемо). Рассказывают про внутренние процессы, платформы и задачи. Приятный рассказ на вечер. Советуем!
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
MLOps at Gucci: From Zero to Hero
Delta Lake is an open-source storage format that can be ideally used for storing large-scale datasets, which can be used for single-node and distributed training of deep learning models. Delta Lake storage format gives deep learning practitioners unique data…
🤩11👍8❤1
В каком порядке записываются и выполняются операторы в СУБД?
Так звучит один из самых популярных вопросов по SQL с собеседований на любую должность, хоть как-то связанную с обработкой данных. И это не просто способ закопать кандидата: ваш ответ покажет, насколько хорошо вы понимаете SQL и принципы его работы.
Итак, в карточках – все что нужно знать, чтобы ответить грамотно, и некоторые полезные детали.
😻 #SQL
Так звучит один из самых популярных вопросов по SQL с собеседований на любую должность, хоть как-то связанную с обработкой данных. И это не просто способ закопать кандидата: ваш ответ покажет, насколько хорошо вы понимаете SQL и принципы его работы.
Итак, в карточках – все что нужно знать, чтобы ответить грамотно, и некоторые полезные детали.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥49👍16❤5
9 примеров самых безумных корреляций
На связи теории заговора или почему не всегда стоит доверять корреляциям. В наборе, например:
– Затраты США на науку, космос и технологии / Суициды путём повешения и удушения. Корреляция 99,79%.
– Потребление сыра / Число до смерти запутавшихся в простынях. Корреляция 94,71%
– Общая выручка аркадных игр / Докторские степени по компьютерным наукам в США. Корреляция 98,51%
– Число людей, утонувших в бассейне / Количество фильмов с Николасом Кейджем. Корреляция 95,24%
– И еще пять подобных примеров
😻 #forfun
На связи теории заговора или почему не всегда стоит доверять корреляциям. В наборе, например:
– Затраты США на науку, космос и технологии / Суициды путём повешения и удушения. Корреляция 99,79%.
– Потребление сыра / Число до смерти запутавшихся в простынях. Корреляция 94,71%
– Общая выручка аркадных игр / Докторские степени по компьютерным наукам в США. Корреляция 98,51%
– Число людей, утонувших в бассейне / Количество фильмов с Николасом Кейджем. Корреляция 95,24%
– И еще пять подобных примеров
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁65👍18🔥13❤4
Partial Dependence Plots для интерпретации моделей
Чем больше машинного обучения в нашей жизни, тем острее встает вопрос повышения интерпретируемости моделей. В классическом примере с кредитом в случае отказа клиент всегда хочет знать, по какой именно причине ему не дали займ.
Поэтому появляется все больше и больше инструментов, которые приокрывают нам "черный ящик": feature importance, SHAP-значения или графики частичной зависимости. Вот о таких графиках сегодня и поговорим.
P.S. Мы вдохновились этим материалом с Kaggle, и здесь же у ребят есть ноутбук с отличными практическими упражнениями – можно перейти и проверить свои знания
😻 #train #analytics
Чем больше машинного обучения в нашей жизни, тем острее встает вопрос повышения интерпретируемости моделей. В классическом примере с кредитом в случае отказа клиент всегда хочет знать, по какой именно причине ему не дали займ.
Поэтому появляется все больше и больше инструментов, которые приокрывают нам "черный ящик": feature importance, SHAP-значения или графики частичной зависимости. Вот о таких графиках сегодня и поговорим.
P.S. Мы вдохновились этим материалом с Kaggle, и здесь же у ребят есть ноутбук с отличными практическими упражнениями – можно перейти и проверить свои знания
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22❤8🤔2