Data Secrets
77.4K subscribers
6.05K photos
593 videos
20 files
2.43K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Алгоритм Монте-Карло ⚙️

Главная проблема анализа методом Монте-Карло связана с получением данных о статистическом распределении параметров, использованных в анализе. Сложный и насыщенный данными метод моделирования создает у аналитика впечатление о точности и глубине исследования возможных результатов, но в действительности качество сделанных выводов полностью зависит от качества исходных данных.

#Методы #Алгоритмы
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13
OpenAi презентовала детектор, различающий текст написанный ИИ и человеком 👁

OpenAI, компания, стоящая за ChatGPT, запустила собственный классификатор, цель которого — различать текст, написанный искусственным интеллектом, и текст, написанный человеком. Это бесплатный инструмент, который имеет некоторые ограничения, но все же может помочь определить, было ли что-то написано ИИ 📝

Авторы признают, что детектор далек от идеала и не всегда можно полагаться на его результаты. Оставляем ссылку здесь ⚙️
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17😁4🤪4👨‍💻2
Рекомендательные системы 💡

Рекомендательные системы — программы, которые пытаются предсказать, какие объекты будут интересны пользователю, имея определенную информацию о его профиле. Две основные стратегии создания рекомендательных систем — фильтрация на основе содержания и коллаборативная фильтрация🔍

#РекомендательныеСистемы
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11
PyData - разного рода мероприятий, которые проходят по всему миру и посвящены анализу данных 🖥

В 2023 году PyData проходит в Лондоне — это трехдневное мероприятие, на котором международное сообщество пользователей и разработчиков инструментов анализа данных может поделиться идеями и поучиться друг у друга. Глобальная сеть PyData способствует обсуждению новых подходов и новых технологий для управления данными, их обработки, аналитики и визуализации. Сообщества PyData подходят к науке о данных, используя множество языков, включая (но не ограничиваясь ими) Python, Julia и R.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍24
MLFlow ⚙️

MLflow — один из самых стабильных и легких инструментов, позволяющий специалистам по Data Science управлять жизненным циклом моделей машинного обучения.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15
Numpy/Pandas: вычисление стандартного отклонения ⁉️

По умолчанию Pandas использует значение ddof (степени свободы) 1 при вычислении стандартного отклонения. Это означает, что стандартное отклонение рассчитывается с использованием формулы выборочного стандартного отклонения, которая делит сумму квадратов отклонений на n-1, где n - количество наблюдений в наборе данных💡

NumPy использует ddof значение 0 при расчете стандартного отклонения, это означает, что сумма квадратов отклонений делится на n, а не на n-1 💡

#Numpy
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17
Scikit-learn - как инструмент решения задач ML 📏

Scikit-learn - один из наиболее широко используемых пакетов Python для Data Science и Machine Learning. Он позволяет выполнять множество операций и предоставляет множество алгоритмов. Scikit-learn также предлагает отличную документацию о своих классах, методах и функциях, а также описание используемых алгоритмов.

#Sklearn
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥111
Data Secrets
PySpark.MLib: Часть 1 🐍 Spark MLlib – это библиотека фреймворка Apache Spark, позволяющая реализовывать механизм машинного обучения и решать задачи, связанные с построением и обучением ML-моделей #PySpark
PySpark.MLib: Часть 2 ⁉️

Spark MLlib – это библиотека фреймворка Apache Spark, позволяющая реализовывать механизм машинного обучения и решать задачи, связанные с построением и обучением ML-моделей

#PySpark
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🤓2
6 интересных библиотек Python

Собрали список полезных библиотек, которые пригодятся в анализе данных: получение данных по почтовому индексу, обработка дат и времени, удаление фона у изображений и др.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥22👍7