Data Secrets
77.4K subscribers
6.04K photos
593 videos
20 files
2.42K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Интересный кейс с INNER JOIN с собеседования

Довольно распространенные на собеседованиях SQL-задачки с подвохом обычно каким-то образом связаны с джойнами. Это именно на тема, которые очень многие понимают не совсем верно. В карточках – один из таких загадочных кейсов на INNER JOIN. Показываем, как ожидания разбиваются о реальность, и рассказываем, почему так происходит. Читайте, чтобы улучшить свое понимание SQL!

😻 #SQL
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯4624👍19🙈3🔥1😁1
Очередной материал от Bloomberg – сочное визуальное панк-хулиганство

На этот раз издание подготовило материал про изменение климата. И это – настоящее пособие по тому, как делать дашборды. Визуализация распределений, нестандарные граф-примеры для обрисовки последствий (например, через температуру, которая нужна для выживания кораллов или производства атомной энергии) и вкусное оформление.

Советуем посмотреть полностью здесь.

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
👍18🤯9🤩2
Untitled0 курит в сторонке

😻 #memes
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6614😁7😐6🙈2😎1
5 способов векторизации текста

Машина не понимают человеческого языка. В конечном итоге они работают только с числами. Чтобы заставить машину понять речь, ее тоже надо перевести в набор чисел – векторы. Это называется векторизация или получение эмбеддингов. Способов провести векторизацию много. Сегодня обзорно рассказывает про некоторые опорные в порядке их появления в науке.

😻 #NN #train
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍348🤯3
Пятница! Продолжите фразу:

"Лучший отдых для айтишника – это ....."
👍124
Meta наносит следующий удар по индустрии: скоро они релизнут свою модель для работы с кодом

Называется она Code Llama и должна выйти буквально на следующей неделе. И при этом, как мы все понимаем, модель обещает быть бесплатной и открытой (держись, Copilot и GPT4).

Ждем!

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍49🤪5😇4🔥2🤨1
Делаем тепловые карты круче и читабельнее

Тепловые карты часто значительно упрощают анализ данных, особенно когда нужно выявить связи между факторами. Тем не менее, они часто выглядит несимпатично и трудно читаются.

Но что, если кроме цветовой информации мы добавим размеры? Чем больше размер кружочка, тем выше абсолютное значение корреляции. На картинке можете заценить, как мгновенно заиграет и подсветит важную информацию ваш график. Вот, что нужно написать:

corr_mat = df.corr().stack().reset_index(name="correlation")

g = sns.relplot(data=corr_mat, x="level_0",
y="level_1", hue="correlation", size="correlation")

Подробности можно посмотреть в документации.

😻 #analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥52👍188
Ставший классикой бесплатный курс по ML System Design от ODS будет прочитан снова этой осенью, онлайн

В расписании лекции и семинары по таким темам (это только некоторые из них):
– Основы проектирования ML-систем
– Подготовка и отбор признаков
– Выбор и обучение ML-модели
– Оценка качества модели
– Развертывание
– Диагностика ошибок и отказов
– Языковые модели в продуктовом окружении
– Временные ряды и графы

Еще будут лабораторные, командный проект, чатик, лидерборд и в общем все, как полагается. 0 рублей. Регистрация тут. Советуем!

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
👍569🤩6🐳1
Мой первый проект по временным рядам be like

😻 #memes
Please open Telegram to view this post
VIEW IN TELEGRAM
😁957👍6
This media is not supported in your browser
VIEW IN TELEGRAM
CoDeF: Content Deformation Fields for Temporally Consistent Video Processing – новый фреймворк для переноса стиля на видео

Фишка в том, что авторы не применяют перенос стиля к каждому кадру видео, а обрабатывают с помощью ControlNet только так называемое каноническое изображение. С него затем стиль переносится на остальныe кадры с помощью сегментации и хэшей изображения.

Главное, чего добились исследователи: значительный прирост в скорости, возможность повышать качество изображения с помощью добавления annealed hash и возможность отслеживать на видео нетвердые объекты (например, воду или дым).

🖥 Github 🖥 Проект
📕 Статья ⭐️ Demo

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍26🤯41
Традиционная воскресная задачка (с опозданием)

Обратите на эту задачу особое внимание: именно такие типовые матричные головоломки часто встречаются в олимпиадах и всевозможный контестах при отборе на работу, стажировку, летнюю школу или еще что-нибудь. Решаются они совсем просто.

Попробуйте сами в комментариях, а уже завтра вечером мы выложим разбор.

😻 #задачи
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22🤯74
Мультколлинеарность: главная проблема One-Hot Encoding

Пишем про то, что такое One-Hot Encoding, какие проблемы кроются в этом алгоритме и как их решить. В конце показываем код.

Вопрос на подумать: какие еще проблемы OHE вы знаете?

😻 #train
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍36