Data Secrets
77.4K subscribers
6.05K photos
593 videos
20 files
2.43K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Бесплатные курсы по нейронкам с Hugging Face

Для тех, кто грокает нейросети (особенно трансформеры), на платформе Hugging Face есть несколько классных бесплатных курсов.

Например, совсем недавно вышел курс по работе с аудио (задачи распознавания, генерации, классификации).

Кроме того, есть курс по диффузионным нейросеткам и курс по NLP. А самое интересное – это их Deep RL Course. Советуем!

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5010
Препарируем TF-IDF

TF-IDF – это статистическая мера, используемая для оценки важности слова в контексте одного документа из корпуса. TF-IDF часто используют для получения эмбеддингов в поисковиках и иногда даже полномасштабных NLP задачах.

С частью TF все понятно – это отношение числа вхождений некоторого слова к общему числу слов документа. Ничего не предвещает беды, но тут появляется IDF – инверсия частоты, с которой некоторое слово встречается в документах. Что за инверсия? Откуда там логарифм? Что происходит? Объясняем.

P.S. Кстати, вот статья, где впервые был предложен IDF: "A statistical interpretation of term specificity and its application in retrieval" (Spärck Jones, 1972).

😻 #train #NN
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍295🔥4🤯1
Разработчики компании Wayve выкатили интересную нейросеть для автопилота в машинах

Она генерирует реалистичные видео с дорог используя видео, промпт и ввод действий. Подход похож на тот, что используют LLM: последующие кадры генерируются авторегрессионно. Особенно они хвастаются своими генеративными правилами реального мира. То есть ребята зашили в модельку не просто стандартный генеративный подход, а еще и правила вождения, габариты разных машин и так далее, и это делает модель очень гибкой. Кроме того, модель генерирует не единственный возможный исход, а несколько.

Разработчики обещают больше новостей в ближайшие месяцы, так что следим внимательно.

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍207🔥4
Разбираем еще два антипаттерна pandas

Для этого решим одну и ту же задачу тремя разными способами. Они будут, как в сказке:

– старший умный был детина: использование np.where() и np.isin()
– средний сын и так и сяк: использование apply()
– младший вовсе был дурак: решение в цикле

😻 #python
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61🔥24
Чит-лист по теории вероятности и статистике

Им поделился с нами подписчик в предложке (@data_secrets_bot), и тут есть почти все, от определения вероятности до характеристических функций распределений и ЦПТ. Основные распределения, теоремы, определения, формулы – одним словом прелесть.

В общем, мы уже печатаем и вешаем на стенку, а вы?

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍45🔥14👏52