Data Secrets
77.4K subscribers
6.05K photos
593 videos
20 files
2.43K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
MLFlow ⚙️

MLflow — один из самых стабильных и легких инструментов, позволяющий специалистам по Data Science управлять жизненным циклом моделей машинного обучения.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15
Numpy/Pandas: вычисление стандартного отклонения ⁉️

По умолчанию Pandas использует значение ddof (степени свободы) 1 при вычислении стандартного отклонения. Это означает, что стандартное отклонение рассчитывается с использованием формулы выборочного стандартного отклонения, которая делит сумму квадратов отклонений на n-1, где n - количество наблюдений в наборе данных💡

NumPy использует ddof значение 0 при расчете стандартного отклонения, это означает, что сумма квадратов отклонений делится на n, а не на n-1 💡

#Numpy
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17
Scikit-learn - как инструмент решения задач ML 📏

Scikit-learn - один из наиболее широко используемых пакетов Python для Data Science и Machine Learning. Он позволяет выполнять множество операций и предоставляет множество алгоритмов. Scikit-learn также предлагает отличную документацию о своих классах, методах и функциях, а также описание используемых алгоритмов.

#Sklearn
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥111
Data Secrets
PySpark.MLib: Часть 1 🐍 Spark MLlib – это библиотека фреймворка Apache Spark, позволяющая реализовывать механизм машинного обучения и решать задачи, связанные с построением и обучением ML-моделей #PySpark
PySpark.MLib: Часть 2 ⁉️

Spark MLlib – это библиотека фреймворка Apache Spark, позволяющая реализовывать механизм машинного обучения и решать задачи, связанные с построением и обучением ML-моделей

#PySpark
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🤓2
6 интересных библиотек Python

Собрали список полезных библиотек, которые пригодятся в анализе данных: получение данных по почтовому индексу, обработка дат и времени, удаление фона у изображений и др.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥22👍7
Amazon Storage|Redshift и Python ⁉️

Amazon Storage и Redshift — популярные облачные решения для хранения и анализа данных, предоставляемые Amazon Web Services (AWS). В этой статье мы обсудим, как с помощью Python загрузить данные, извлеченные из реляционной базы данных, в Amazon Storage и Redshift.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8👍5🥰3😐1
Microsoft разработала нейросеть VALL-E, которая озвучивает текст, точно имитируя голос человека и его интонации.

Microsoft представила модель искусственного интеллекта VALL-E, которая преобразует текст в речь и точно имитирует голос человека, его интонации и эмоциональную окраску.
Чтобы повторить голос, программе достаточно послушать трехсекундную запись.
VALL-E предлагает несколько вариантов сгенерированной речи.
Нейросеть также имитирует акустическое окружение голосового образца. Например, если запись сделана возле моря или по телефону, то ИИ будет имитировать голос именно в этих условиях.
VALL-E может работать в сочетании с другими моделями ИИ, например с одной из самых сложных и объемных языковых моделей, существующих сегодня — GPT-3.
Компания не стала выкладывать код в открытый доступ, чтобы им не могли воспользоваться злоумышленники.
👍14🤨4
Гиперпараметры: методы их настройки и отличие от параметров

В машинном обучении гиперпараметрами называют параметры алгоритмов, значения которых устанавливаются перед запуском процесса обучения.
👍8