Data Secrets
77.4K subscribers
6.05K photos
593 videos
20 files
2.43K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Ансамбль моделей 🌸

Метод машинного обучения, где несколько моделей обучаются для решения одной и той же проблемы и объединяются для получения лучших результатов называется ансамблевым методом.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17🔥5😁2
This media is not supported in your browser
VIEW IN TELEGRAM
Кто-то: Data Science это сложно
Data Science:
👍32😁23
Data Secrets
Сингулярное разложение Сингулярное разложение широко используется в рекомендательных системах. Оно позволяет найти базисы пространства строк и пространства столбцов, то есть элементарные признаки обоих пространств. Например, если строки матрицы соответствуют…
Сингулярное разложение 📉

Сингулярное разложение матриц (Singular Value Decomposition, SVD). Классический пример применения сингулярного разложения – шумоподавление, например, в изображениях.

#ЛинейнаяАлгебра
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15
Вопросы по статистике с собеседования на Data Scientist 📏

1. В одной колоде 12 красных и 12 черных карт. В второй коробке 24 красных и 24 черных карты. Необходимо взять две карты одного цвета с одной колоды по одной карте. При этом карты не кладутся обратно в стопку. С какой колоды больше шансов получить карты одного цвета и почему?

2. Как можно определить, не является ли монета смещенной?

3. Как сделать подбрасывание смещенной монеты справедливой игрой?

Ответы в комментариях 👇🏼

#вопросы_с_собеседования
Please open Telegram to view this post
VIEW IN TELEGRAM
👍30
Aesara: Часть 1 ⁉️

Aesara — это библиотека Python, которая позволяет определять, оптимизировать и эффективно оценивать математические выражения, включающие многомерные массивы.

#Aesara
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥32
Рекомендательные системы: фильтрация по содержимому 🔔

Рекомендательные системы — программы, которые пытаются предсказать, какие объекты будут интересны пользователю, имея определенную информацию о его профиле.

#РекомендательныеСистемы
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🐳2
Query, loc и filter в Pandas ⚙️

query используется для фильтрации строк на основе условий, loc используется для фильтрации строк и столбцов на основе меток и filter используется для фильтрации столбцов на основе шаблона в именах столбцов.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19
Метод парзеновского окна 🖥

Метод парзеновского окна — метод байесовской классификации, основанный на непараметрическом восстановлении плотности по имеющейся выборке.

После ввода метрики, метод парзеновского окна можно использовать, не опираясь на вероятностную природу данных.

#Методы #Алгоритмы
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10🥰31
LaMDA — это чат-бот, разработанный компанией Google, который может вести диалог на любую тему и отвечать на любые вопросы пользователя.
👍131
Data Secrets
Введение в NLTK: Часть 1 🐍 NLTK (Natural Language Toolkit) - это стандартный API для NLP (обработки естественного языка) с Python. Это действительно мощный инструмент для предварительной обработки текстовых данных для дальнейшего анализа, например, с моделями…
Введение в NLTK: Часть 2 🐍

Библиотека NLTK — пакет библиотек и программ для символьной и статистической обработки естественного языка, написанных на языке программирования Python.

#NLP
👍15🔥3