Data Secrets

📌 Наивный Байесовский классификатор

⏳Томас Байес - это был такой священник-математик в 18 веке. Человечеству он запомнился как один из главных ученых, развивавших теорию вероятностей.

Благодаря теореме Байеса об условных вероятностях появился наивный Байесовский алгоритм. Он особенно хорошо работает с задачами обработки естественного языка 📚

👇 Прочти об алгоритме еще и попробуй затестить его

#junior #классификация

Data Secrets

👍6🔥3

1.8K views00:53

Data Secrets

📌Ящики с усами

Как показать на одном графике центр и форму распределения, размах вариации и выбросы?

🥸 Боксплот (ящик с усами) — это способ визуализации, который позволяет в одной простой картинке передать всю необходимую информацию о распределении числовых переменных

Переходи по кнопке и построй такой ящик сам 👇

#junior #визуализация

Data Secrets

👍5🔥3

1.6K views01:58

🎨 Рисовать

Data Secrets

📌 Метод K-средних

Один из наиболее лаконичных и простых для понимания алгоритмов кластеризации

Задача: распределение произвольного количества n-мерных точек по k кластерам.

Решение:
🔻Случайным образом создаются k точек, в дальнейшем будем называть их центрами кластеров
🔻Для каждой точки ставится в соответствии ближайший к ней центр кластера
🔻Вычисляются средние арифметические точек, принадлежащих к определённому кластеру. Именно эти значения становятся новыми центрами кластеров
🔻 Шаги 2 и 3 повторяются до тех пор, пока пересчёт центров кластеров будет приносить плоды. Как только высчитанные центры кластеров совпадут с предыдущими, алгоритм будет окончен

#junior #классификация

Data Secrets

👍8

1.86K views10:09

📄Подробнее

Data Secrets

📌 Как работает теорема Байеса?

Какова вероятность того, что ты встретишь на улице кенгуру? А если ты в Австралии? Ох уж эти условные вероятности... Теорема Байеса поможет!

⚡️В финансах теорема Байеса используется для оценки риска кредитования. В медицине для определения точности результатов медицинских тестов.

Разберемся на примере, как это работает 🤯

#junior #теорвер

Data Secrets

👍15❤‍🔥1

1.91K views10:27

Data Secrets

📌 Сортировка данных в pandas

Датафрейм – это что-то вроде таблицы, он тоже состоит из строк и столбцов. В pandas мы можем сортировать фрейм данных по одному столбцу, по нескольким столбцам или по индексу 📈

#pandas #junior

Data Secrets

❤11👍3

2.17K views10:51

Data Secrets

📌 Кросс - валидация

Кросс-валидация — это метод, предназначенный для оценки качества работы модели, широко применяемый в машинном обучении. Он помогает сравнить между собой различные модели и выбрать наилучшую для конкретной задачи

🧩 Суть метода заключается в том, что датасет разбивается на k одинаковых частей (фолдов), а потом проиисходит k итераций, во время каждой из которых один фолд выступает в роли тестового множества, а объединение остальных — в роли тренировочного. Финальный скор получается усреднением полученных оценок 📊

#метрики #junior

Data Secrets

❤6👍4

2.13K views16:48

Data Secrets

📌 Матричные операции в numpy

💊 Матрица - это двухмерная структура данных, в которой числа расположены в строках и столбцах. Для Data Science это незаменимая структура данных.

В numpy представлено множество функций, которые позволяют эффективно работать с матрицами. Наш интерактивный гайд поможет разобраться с основными.

Запусти все примеры сам и выполни задание, чтобы точно усвоить тему 💣

#junior #numpy

Data Secrets

👍11🤯4

1.87K views14:19

💊 Подключиться к матрице

About

Blog

Apps

Platform