Data Secrets
77.4K subscribers
6.05K photos
593 videos
20 files
2.43K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Seaborn 📈

Seaborn
— это библиотека для создания статистических графиков на Python. Она основывается на matplotlib и тесно взаимодействует со структурами данных pandas 🐍

Архитектура Seaborn позволяет быстро изучить и понять данные. Seaborn захватывает целые фреймы данных или массивы, в которых содержатся данные, и выполняет все внутренние функции, нужные для статистической агрегации для преобразования данных в информативные графики 📊

Она абстрагирует сложность, позволяя проектировать графики в соответствии с требованиями 📈

#Seaborn
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍255
Вопросы по SQL с собеседования

Типы джойнов в SQL?

INNER, JOIN LEFT, JOIN RIGHT, JOIN FULL, JOIN CROSS

Чем NULL отличается от 0?

NULL - это не число, а также NULL не является значением пустой строки. NULL используется для указания того, что данные отсутствуют, неизвестны, неприменимы. NULL не равен ничему, даже другому NULL.

Какие параметры используются в конструкции order by?

ASC и DESC

Какой оператор имеет больший приоритет AND или OR (если они используются совместно)?

AND имеет больший приоритет, нежели OR

Для чего нужен оператор UNION?

Для объединения двух таблиц, при условии что каждая имеет одинаковое количество столбцов, столбцы имеют схожие типы данных, столбцы располагаются в том же порядке.

#SQL #вопросы_с_собеседования
👍43😁5🤯1
Сингулярное разложение

Сингулярное разложение широко используется в рекомендательных системах. Оно позволяет найти базисы пространства строк и пространства столбцов, то есть элементарные признаки обоих пространств.

Например, если строки матрицы соответствуют читателям, столбцы – книгам, а сама матрица содержит оценки, которые пользователи поставили книгам, то сингулярное разложение матрицы выделит "типичных читателей" и "типичные книги". Каждого реального читателя и каждую реальную книгу можно представить линейной комбинацией "типичных", после чего будет достаточно легко рассчитать ожидаемую оценку любой книги любым читателем.

#ЛинейнаяАлгебра
👍18🔥7
Numpy: 3 полезных фишки 📈

Numeric Python - это несколько модулей для вычислений с многомерными массивами, необходимых для многих численных приложений.

#Numpy
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15
Введение в NLTK: Часть 1 🐍

NLTK (Natural Language Toolkit) - это стандартный API для NLP (обработки естественного языка) с Python. Это действительно мощный инструмент для предварительной обработки текстовых данных для дальнейшего анализа, например, с моделями машинного обучения. Это помогает преобразовать текст в числа, с которыми модель может легко работать 🔍

#NLP
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17🔥5
🎲Схема по построению систем распознавания
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13
Введение в Theano: Часть 2 ⁉️

Theano – это библиотека численных вычислений для Python. Это распространенный выбор для реализации моделей нейронных сетей, поскольку он позволяет эффективно определять, оптимизировать и оценивать математические выражения, включая многомерные массивы (numpy.ndaray).

#Theano
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9
Гетероскедастичность 📈

Если присутствует гетероскедастичность, то экземпляры с высокой дисперсией будут иметь большее влияние на прогноз.

Наличие гетероскедастичности делает коэффициенты менее точными, и, следовательно, правильные коэффициенты находятся дальше от значения генеральной совокупности.

#Регрессия #Статистика
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21
Алгоритм Монте-Карло ⚙️

Главная проблема анализа методом Монте-Карло связана с получением данных о статистическом распределении параметров, использованных в анализе. Сложный и насыщенный данными метод моделирования создает у аналитика впечатление о точности и глубине исследования возможных результатов, но в действительности качество сделанных выводов полностью зависит от качества исходных данных.

#Методы #Алгоритмы
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13
OpenAi презентовала детектор, различающий текст написанный ИИ и человеком 👁

OpenAI, компания, стоящая за ChatGPT, запустила собственный классификатор, цель которого — различать текст, написанный искусственным интеллектом, и текст, написанный человеком. Это бесплатный инструмент, который имеет некоторые ограничения, но все же может помочь определить, было ли что-то написано ИИ 📝

Авторы признают, что детектор далек от идеала и не всегда можно полагаться на его результаты. Оставляем ссылку здесь ⚙️
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17😁4🤪4👨‍💻2