Data Secrets
77.4K subscribers
6.04K photos
593 videos
20 files
2.43K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
📕 Deep Learning with Python

✍️ Francois Chollet
⌛️ 2021

Книга с широким спектром тем. Отличается подробными и ясными объяснениями работы алгоритмов.

Скачать

#литература

Data Secrets
👍7
📌 Data Scientist - какой он должен быть?

Data Science — дисциплина, которая лежит на стыке математики, статистики и компьютерных наук.

😎Специалист по данным с помощью математических алгоритмов и программных инструментов должен анализировать информацию, которую собрала компания, и использовать результаты для улучшения качества работы.

Поэтому хороший Data Scientist - это не только программист, но и математик, исследователь и просто заинтересованный человек с нестандартным мышлением 🤓

#info

Data Secrets
👍6
📌 Наивный Байесовский классификатор

Томас Байес - это был такой священник-математик в 18 веке. Человечеству он запомнился как один из главных ученых, развивавших теорию вероятностей.

Благодаря теореме Байеса об условных вероятностях появился наивный Байесовский алгоритм. Он особенно хорошо работает с задачами обработки естественного языка 📚

👇 Прочти об алгоритме еще и попробуй затестить его

#junior #классификация

Data Secrets
👍6🔥3
📽 Если ты только начинаешь знакомиться с компьютерным зрением в Python, то это видео для тебя. Здесь расскажут и покажут, как начать работу с OpenCV

#info

Data Secrets
👍3
Никто не устоит😅
👍7
Data Secrets
📌 Наивный Байесовский классификатор Томас Байес - это был такой священник-математик в 18 веке. Человечеству он запомнился как один из главных ученых, развивавших теорию вероятностей. Благодаря теореме Байеса об условных вероятностях появился наивный Байесовский…
📝 Тест по теореме Байеса

Недавно мы разобрались с теоремой Байеса и ее применением в классификации. Теперь попробуй пройти наш тест и ответить на все вопросы по этой теме правильно 🥸

Проверь себя 👇

#тесты

Data Secrets
👍6❤‍🔥3
📌Ящики с усами

Как показать на одном графике центр и форму распределения, размах вариации и выбросы?

🥸 Боксплот (ящик с усами) — это способ визуализации, который позволяет в одной простой картинке передать всю необходимую информацию о распределении числовых переменных

Переходи по кнопке и построй такой ящик сам 👇

#junior #визуализация

Data Secrets
👍5🔥3
📄Causal Inference for Recommender Systems
✍️Yixin Wang, Dawen Liang et. al.
⌛️2020

🌀Традиционная постановка задачи в рекомендациях – предсказать рейтинг данного айтема для данного пользователя. Пользуясь этим подходом, мы рискуем рекомендовать айтемы, которые не принесут реального прироста: например, можно рекомендовать любителю супергероев Marvel, но зачем? Пользователь и так их посмотрит. Идеально было бы порекомендовать фильм, который понравится пользователю, но при этом он вряд ли посмотрит этот фильм без рекомендера. Такое обещает causal recommender.

#разбор_статей

Data Secrets
🔥4👍1
📌U - критерий Манна - Уитни

Что делать, если нужно сравнить две выборки, о которых мало что известно или которые не соответствуют нормальному распределению? Применим тест Манна - Уитни!

U - критерий Манна - Уитни применяется для сравнения двух независимых выбор. Он считается непараметрическим тестом в отличие от своего сурового аналога теста Стьюдента.

Переходи по кнопке и узнай еще больше 👇

#middle #статистика

Data Secrets
👍6🔥2
📌 Метод K-средних

Один из наиболее лаконичных и простых для понимания алгоритмов кластеризации

Задача: распределение произвольного количества n-мерных точек по k кластерам.

Решение:
🔻Случайным образом создаются k точек, в дальнейшем будем называть их центрами кластеров
🔻Для каждой точки ставится в соответствии ближайший к ней центр кластера
🔻Вычисляются средние арифметические точек, принадлежащих к определённому кластеру. Именно эти значения становятся новыми центрами кластеров
🔻 Шаги 2 и 3 повторяются до тех пор, пока пересчёт центров кластеров будет приносить плоды. Как только высчитанные центры кластеров совпадут с предыдущими, алгоритм будет окончен

#junior #классификация

Data Secrets
👍8
📝 Natural Language YouTube Searcher

Генерация изображений по текстовоу описанию с использованием нейросети CLIP от компании OpenAI, основная задача которой наоборот придумывать описания картинкам. На этот раз из нее собрали поисковик по кадрам из ролика на Ютубе.

Все просто: даете ссылку на видео; пишите что нужно найти (как и раньше, на любом языке) и нейросеть не просто показывает кадр, который вы искали, но и говорит на какой он секунде. Если во время выполнения второго блока будет вылетать, то увеличьте показатель framestoskip. В остальном, я уверен, вы без труда разберетесь.

Колаб для тестов доступен по ссылке: https://colab.research.google.com/github/Veron28/bot_test/blob/master/Natural_Language_YouTube_Searcher.ipynb

#AI #CV

Data Secrets
👍3
Data Secrets
📌 Наивный Байесовский классификатор Томас Байес - это был такой священник-математик в 18 веке. Человечеству он запомнился как один из главных ученых, развивавших теорию вероятностей. Благодаря теореме Байеса об условных вероятностях появился наивный Байесовский…
📌 Как работает теорема Байеса?

Какова вероятность того, что ты встретишь на улице кенгуру? А если ты в Австралии? Ох уж эти условные вероятности... Теорема Байеса поможет!

⚡️
В финансах теорема Байеса используется для оценки риска кредитования. В медицине для определения точности результатов медицинских тестов.

Разберемся на примере, как это работает 🤯

#junior #теорвер

Data Secrets
👍15❤‍🔥1
📝 Тест по условным вероятностям и теореме Байеса

Недавно мы рассказали о наивном Байесовском классификаторе и о теореме, с помощью которой он работает. А теперь собрали тест, который покажет, насколько ты разобрался с этой темой 🤓

Проверь себя 👇

#тесты
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Делимся с вами колабом, который по текстовому описанию генерирует воксельный объект
Text2Voxel v.1.0 👽

P.S. На видео процесс генерации новогодней елки.

https://colab.research.google.com/github/Veron28/bot_test/blob/master/Text2Voxel.ipynb
👍6🔥3
📌 Обзор библиотеки Prophet

В этом колабе показываем несколько продвинутых фишек и способностей библиотеки Prophet (документация) на нескольких примерах

🔍 сезонность, праздники и тренд
🔍 включение знаний предметной области
🔍 доверительные интервалы для оценки рисков
🔍 дополнительные регрессоры
🔍 настраиваемые степени свободы

👉 https://colab.research.google.com/github/raffg/prophet_forecasting/blob/master/prophet.ipynb#scrollTo=mazcqW8tXxHb

#библиотеки #прогнозирование

Data Secrets
👍5
Data_Science_Наука_о_данных_с_нуля_2_е_издание_2021_Джоэл_Грас.pdf
24.8 MB
📗Data Science. Наука о данных с нуля

✍️
Джоэл Грас
⌛️2-е издание [2021]

Книга содержит краткий курс языка Python, элементы линейной алгебры, статистики, теории вероятностей, методов обработки данных. Приведены основы машинного обучения. Рассмотрены приемы обработки естественного языка, методы анализа социальных сетей, основы баз данных, SQL и MapReduce.

#литература

Data Secrets
👍14
📌 Добавление записей в SQL таблицу

Добавить данные в таблицу можно с помощью команды INSERT. Есть два разных способа использования этого оператора. В чем их отличие? Рассмотрим оба и разберемся⚡️

#SQL #БД

Data Secrets
👍7🔥4
🎯 Новое соревнование на Kaggle

🐎Задача посвящена скачкам. По данным о прошедших турнирах и состоянии лошадей нужно предсказывать наилучшую стратегию для следующих забегов.

Соревнование спонсируется Нью-Йоркской ассоциацией скачек. Главный приз - $20,000 💸

Ссылка на соревнование

#info

Data Secrets
6👍1