📌 Наивный Байесовский классификатор
⏳Томас Байес - это был такой священник-математик в 18 веке. Человечеству он запомнился как один из главных ученых, развивавших теорию вероятностей.
Благодаря теореме Байеса об условных вероятностях появился наивный Байесовский алгоритм. Он особенно хорошо работает с задачами обработки естественного языка 📚
👇 Прочти об алгоритме еще и попробуй затестить его
#junior #классификация
Data Secrets
⏳Томас Байес - это был такой священник-математик в 18 веке. Человечеству он запомнился как один из главных ученых, развивавших теорию вероятностей.
Благодаря теореме Байеса об условных вероятностях появился наивный Байесовский алгоритм. Он особенно хорошо работает с задачами обработки естественного языка 📚
👇 Прочти об алгоритме еще и попробуй затестить его
#junior #классификация
Data Secrets
👍6🔥3
📌Ящики с усами
Как показать на одном графике центр и форму распределения, размах вариации и выбросы?
🥸 Боксплот (ящик с усами) — это способ визуализации, который позволяет в одной простой картинке передать всю необходимую информацию о распределении числовых переменных
Переходи по кнопке и построй такой ящик сам 👇
#junior #визуализация
Data Secrets
Как показать на одном графике центр и форму распределения, размах вариации и выбросы?
🥸 Боксплот (ящик с усами) — это способ визуализации, который позволяет в одной простой картинке передать всю необходимую информацию о распределении числовых переменных
Переходи по кнопке и построй такой ящик сам 👇
#junior #визуализация
Data Secrets
👍5🔥3
📌 Метод K-средних
Один из наиболее лаконичных и простых для понимания алгоритмов кластеризации
Задача: распределение произвольного количества n-мерных точек по k кластерам.
Решение:
🔻Случайным образом создаются k точек, в дальнейшем будем называть их центрами кластеров
🔻Для каждой точки ставится в соответствии ближайший к ней центр кластера
🔻Вычисляются средние арифметические точек, принадлежащих к определённому кластеру. Именно эти значения становятся новыми центрами кластеров
🔻 Шаги 2 и 3 повторяются до тех пор, пока пересчёт центров кластеров будет приносить плоды. Как только высчитанные центры кластеров совпадут с предыдущими, алгоритм будет окончен
#junior #классификация
Data Secrets
Один из наиболее лаконичных и простых для понимания алгоритмов кластеризации
Задача: распределение произвольного количества n-мерных точек по k кластерам.
Решение:
🔻Случайным образом создаются k точек, в дальнейшем будем называть их центрами кластеров
🔻Для каждой точки ставится в соответствии ближайший к ней центр кластера
🔻Вычисляются средние арифметические точек, принадлежащих к определённому кластеру. Именно эти значения становятся новыми центрами кластеров
🔻 Шаги 2 и 3 повторяются до тех пор, пока пересчёт центров кластеров будет приносить плоды. Как только высчитанные центры кластеров совпадут с предыдущими, алгоритм будет окончен
#junior #классификация
Data Secrets
👍8
Data Secrets
📌 Наивный Байесовский классификатор ⏳Томас Байес - это был такой священник-математик в 18 веке. Человечеству он запомнился как один из главных ученых, развивавших теорию вероятностей. Благодаря теореме Байеса об условных вероятностях появился наивный Байесовский…
📌 Как работает теорема Байеса?
Какова вероятность того, что ты встретишь на улице кенгуру? А если ты в Австралии? Ох уж эти условные вероятности... Теорема Байеса поможет!
⚡️В финансах теорема Байеса используется для оценки риска кредитования. В медицине для определения точности результатов медицинских тестов.
Разберемся на примере, как это работает 🤯
#junior #теорвер
Data Secrets
Какова вероятность того, что ты встретишь на улице кенгуру? А если ты в Австралии? Ох уж эти условные вероятности... Теорема Байеса поможет!
⚡️В финансах теорема Байеса используется для оценки риска кредитования. В медицине для определения точности результатов медицинских тестов.
Разберемся на примере, как это работает 🤯
#junior #теорвер
Data Secrets
👍15❤🔥1
📌 Сортировка данных в pandas
Датафрейм – это что-то вроде таблицы, он тоже состоит из строк и столбцов. В
#pandas #junior
Data Secrets
Датафрейм – это что-то вроде таблицы, он тоже состоит из строк и столбцов. В
pandas
мы можем сортировать фрейм данных по одному столбцу, по нескольким столбцам или по индексу 📈#pandas #junior
Data Secrets
❤11👍3
📌 Кросс - валидация
Кросс-валидация — это метод, предназначенный для оценки качества работы модели, широко применяемый в машинном обучении. Он помогает сравнить между собой различные модели и выбрать наилучшую для конкретной задачи
🧩 Суть метода заключается в том, что датасет разбивается на k одинаковых частей (фолдов), а потом проиисходит k итераций, во время каждой из которых один фолд выступает в роли тестового множества, а объединение остальных — в роли тренировочного. Финальный скор получается усреднением полученных оценок 📊
#метрики #junior
Data Secrets
Кросс-валидация — это метод, предназначенный для оценки качества работы модели, широко применяемый в машинном обучении. Он помогает сравнить между собой различные модели и выбрать наилучшую для конкретной задачи
🧩 Суть метода заключается в том, что датасет разбивается на k одинаковых частей (фолдов), а потом проиисходит k итераций, во время каждой из которых один фолд выступает в роли тестового множества, а объединение остальных — в роли тренировочного. Финальный скор получается усреднением полученных оценок 📊
#метрики #junior
Data Secrets
❤6👍4
📌 Матричные операции в numpy
💊 Матрица - это двухмерная структура данных, в которой числа расположены в строках и столбцах. Для
В
Запусти все примеры сам и выполни задание, чтобы точно усвоить тему 💣
#junior #numpy
Data Secrets
💊 Матрица - это двухмерная структура данных, в которой числа расположены в строках и столбцах. Для
Data Science
это незаменимая структура данных. В
numpy
представлено множество функций, которые позволяют эффективно работать с матрицами. Наш интерактивный гайд поможет разобраться с основными. Запусти все примеры сам и выполни задание, чтобы точно усвоить тему 💣
#junior #numpy
Data Secrets
👍11🤯4