Data Secrets
77.4K subscribers
6.05K photos
593 videos
20 files
2.43K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Введение в Theano: Часть 2 ⁉️

Theano – это библиотека численных вычислений для Python. Это распространенный выбор для реализации моделей нейронных сетей, поскольку он позволяет эффективно определять, оптимизировать и оценивать математические выражения, включая многомерные массивы (numpy.ndaray).

#Theano
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9
Гетероскедастичность 📈

Если присутствует гетероскедастичность, то экземпляры с высокой дисперсией будут иметь большее влияние на прогноз.

Наличие гетероскедастичности делает коэффициенты менее точными, и, следовательно, правильные коэффициенты находятся дальше от значения генеральной совокупности.

#Регрессия #Статистика
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21
Алгоритм Монте-Карло ⚙️

Главная проблема анализа методом Монте-Карло связана с получением данных о статистическом распределении параметров, использованных в анализе. Сложный и насыщенный данными метод моделирования создает у аналитика впечатление о точности и глубине исследования возможных результатов, но в действительности качество сделанных выводов полностью зависит от качества исходных данных.

#Методы #Алгоритмы
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13
OpenAi презентовала детектор, различающий текст написанный ИИ и человеком 👁

OpenAI, компания, стоящая за ChatGPT, запустила собственный классификатор, цель которого — различать текст, написанный искусственным интеллектом, и текст, написанный человеком. Это бесплатный инструмент, который имеет некоторые ограничения, но все же может помочь определить, было ли что-то написано ИИ 📝

Авторы признают, что детектор далек от идеала и не всегда можно полагаться на его результаты. Оставляем ссылку здесь ⚙️
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17😁4🤪4👨‍💻2
Рекомендательные системы 💡

Рекомендательные системы — программы, которые пытаются предсказать, какие объекты будут интересны пользователю, имея определенную информацию о его профиле. Две основные стратегии создания рекомендательных систем — фильтрация на основе содержания и коллаборативная фильтрация🔍

#РекомендательныеСистемы
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11
PyData - разного рода мероприятий, которые проходят по всему миру и посвящены анализу данных 🖥

В 2023 году PyData проходит в Лондоне — это трехдневное мероприятие, на котором международное сообщество пользователей и разработчиков инструментов анализа данных может поделиться идеями и поучиться друг у друга. Глобальная сеть PyData способствует обсуждению новых подходов и новых технологий для управления данными, их обработки, аналитики и визуализации. Сообщества PyData подходят к науке о данных, используя множество языков, включая (но не ограничиваясь ими) Python, Julia и R.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍24
MLFlow ⚙️

MLflow — один из самых стабильных и легких инструментов, позволяющий специалистам по Data Science управлять жизненным циклом моделей машинного обучения.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15
Numpy/Pandas: вычисление стандартного отклонения ⁉️

По умолчанию Pandas использует значение ddof (степени свободы) 1 при вычислении стандартного отклонения. Это означает, что стандартное отклонение рассчитывается с использованием формулы выборочного стандартного отклонения, которая делит сумму квадратов отклонений на n-1, где n - количество наблюдений в наборе данных💡

NumPy использует ddof значение 0 при расчете стандартного отклонения, это означает, что сумма квадратов отклонений делится на n, а не на n-1 💡

#Numpy
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17
Scikit-learn - как инструмент решения задач ML 📏

Scikit-learn - один из наиболее широко используемых пакетов Python для Data Science и Machine Learning. Он позволяет выполнять множество операций и предоставляет множество алгоритмов. Scikit-learn также предлагает отличную документацию о своих классах, методах и функциях, а также описание используемых алгоритмов.

#Sklearn
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥111