Data Secrets
77.3K subscribers
6.04K photos
592 videos
20 files
2.42K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
📌 Наивный Байесовский классификатор

Томас Байес - это был такой священник-математик в 18 веке. Человечеству он запомнился как один из главных ученых, развивавших теорию вероятностей.

Благодаря теореме Байеса об условных вероятностях появился наивный Байесовский алгоритм. Он особенно хорошо работает с задачами обработки естественного языка 📚

👇 Прочти об алгоритме еще и попробуй затестить его

#junior #классификация

Data Secrets
👍6🔥3
📌Ящики с усами

Как показать на одном графике центр и форму распределения, размах вариации и выбросы?

🥸 Боксплот (ящик с усами) — это способ визуализации, который позволяет в одной простой картинке передать всю необходимую информацию о распределении числовых переменных

Переходи по кнопке и построй такой ящик сам 👇

#junior #визуализация

Data Secrets
👍5🔥3
📌 Метод K-средних

Один из наиболее лаконичных и простых для понимания алгоритмов кластеризации

Задача: распределение произвольного количества n-мерных точек по k кластерам.

Решение:
🔻Случайным образом создаются k точек, в дальнейшем будем называть их центрами кластеров
🔻Для каждой точки ставится в соответствии ближайший к ней центр кластера
🔻Вычисляются средние арифметические точек, принадлежащих к определённому кластеру. Именно эти значения становятся новыми центрами кластеров
🔻 Шаги 2 и 3 повторяются до тех пор, пока пересчёт центров кластеров будет приносить плоды. Как только высчитанные центры кластеров совпадут с предыдущими, алгоритм будет окончен

#junior #классификация

Data Secrets
👍8
Data Secrets
📌 Наивный Байесовский классификатор Томас Байес - это был такой священник-математик в 18 веке. Человечеству он запомнился как один из главных ученых, развивавших теорию вероятностей. Благодаря теореме Байеса об условных вероятностях появился наивный Байесовский…
📌 Как работает теорема Байеса?

Какова вероятность того, что ты встретишь на улице кенгуру? А если ты в Австралии? Ох уж эти условные вероятности... Теорема Байеса поможет!

⚡️
В финансах теорема Байеса используется для оценки риска кредитования. В медицине для определения точности результатов медицинских тестов.

Разберемся на примере, как это работает 🤯

#junior #теорвер

Data Secrets
👍15❤‍🔥1
📌 Сортировка данных в pandas

Датафрейм – это что-то вроде таблицы, он тоже состоит из строк и столбцов. В pandas мы можем сортировать фрейм данных по одному столбцу, по нескольким столбцам или по индексу 📈

#pandas #junior

Data Secrets
11👍3
📌 Кросс - валидация

Кросс-валидация — это метод, предназначенный для оценки качества работы модели, широко применяемый в машинном обучении. Он помогает сравнить между собой различные модели и выбрать наилучшую для конкретной задачи

🧩 Суть метода заключается в том, что датасет разбивается на k одинаковых частей (фолдов), а потом проиисходит k итераций, во время каждой из которых один фолд выступает в роли тестового множества, а объединение остальных — в роли тренировочного. Финальный скор получается усреднением полученных оценок 📊

#метрики #junior

Data Secrets
6👍4
📌 Матричные операции в numpy

💊 Матрица - это двухмерная структура данных, в которой числа расположены в строках и столбцах. Для Data Science это незаменимая структура данных.

В numpy представлено множество функций, которые позволяют эффективно работать с матрицами. Наш интерактивный гайд поможет разобраться с основными.

Запусти все примеры сам и выполни задание, чтобы точно усвоить тему 💣

#junior #numpy

Data Secrets
👍11🤯4