Data Secrets
77.4K subscribers
6.06K photos
593 videos
20 files
2.44K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
8 способов проверить “Что там с данными?” от Andy Kriebel.

Нашли и перевели для вас отличный пост с Linkedin – сохраняйте!

😻 #analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍43🔥114
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI выкатили новую модель, генерирующую трехмерные объекты по текстовому описанию

Гифка “машинка, похожая на авокадо” пока выглядит слабовато, но это вполне сильная заявка. Модель называется Shap•E. Авторы опубликовали веса модели и код: https://github.com/openai/shap-e
Ссылка на статью: https://arxiv.org/pdf/2305.02463.pdf

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
16👍3
Статичные фичи и что с ними делать

😻 #train #analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍292
Привет! Мы запускаем ПРЕДЛОЖКУ

Мы всегда внимательно читаем ваши комментарии и пытаемся постоянно совершенствовать канал. А теперь у нас будет еще и специальный бот, куда вы можете присылать свои идеи, пожелания, интересные новости, полноценные посты или даже описание своих проектов: всё, чем вы хотите поделиться и что хотите видеть в канале. Все это будет автоматически попадать прямо в руки нашей редакции, которая будет отбирать все самое сочное 🙂

Чтобы предложить, просто пиши боту @data_secrets_bot (в этом же боте наши редакторы смогут тебе ответить).

С нетерпением ждём ваших писем ✉️

😻 // Data Secrets
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1510🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
Чтение мыслей с помощью языковых моделей и МРТ

Очередной шаг в направлении методов регистрации мыслей сделали учёные из Техасского университета, представив семантический декодер. Они использовали метод функциональной магнитно-резонансной томографии для регистрации активностей головного мозга, а затем с помощью больших языковых моделей транслировали это в образы с помощью текстовых сообщений.

Но есть одно но. Чтобы мысли читались правильно, система должна была подучиться на конкретном пациенте.

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯19👍83
Самая крупная подборка видео по рекомендательным системам на русском языке от нашей команды:

Рекомендательная система на коленке, Михаил Трофимов

Дзен-митап: рекомендательные системы

Обзор нейросетевых рекомендательных систем — Дмитрий Ушанов

Яндекс изнутри: рекомендательные системы Музыки и Дзена

Пишем графовую рекомендательную систему для музыки

Рекомендательные системы | Евгений Соколов | Лекториум

R&D рекомендательной системы — как обучить и выкатить алгоритм в продакшн - Виталий Давыдов

DLS. Семинар. Recommender System.

Архитектура рекомендательной системы Дзена / Дмитрий Кондрашкин

МТС. Построение sequential recommender systems

Архитектура Real Time рекомендательной системы на примере банка: с нуля до готового продукта

Рекомендательная система на базе DataSphere

Андрей Зимовнов. Архитектура рекомендаций Дзена

Дзен-митап: исследования и рекомендательные системы

Ладно, не только от нашей команды, еще спасибо рекомендательным системам YouTube :)

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
👍26🔥6
#ЧиталиТвиттер

И нашли простую схему, которая показывает полный путь модели от анализа и подготовки данных до деплоя. Единственное: в инференсе стоит добавить AB-тестирование (если это не включено в feedback).
👍141
This media is not supported in your browser
VIEW IN TELEGRAM
Вчера вечером Google провела масштабную презентацию своих нововведений

Вот что было интересного по поводу ИИ:

– В Gmail добавят фичу «Help me write», где ИИ будет теперь писать письма по вашему запросу

– В Google Фото добавят нейросеть «Magic Editor» для удаления лишних объектов с фото и редактирования

– Была представлена языковая модель PaLM 2.0 на базе которой работает чат-бот, а также мультимодальная Gemini

Bard теперь доступен в 180 странах, общается на 40 новых языках (и на русском), поддерживает tools (аналог плагинов), освоил 20 языков программирования и включает в себя нейросеть Adobe Firefly для создания изображений

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
😨148🔥5👍1🤔1🤓1
Batch normalization

Помните, мы рассказывали про DropOut? Так вот, есть еще одна такая серебряная пуля для нейронных сетей – батчнорм. Оригинальная статья (Batch Normalization) вышла в 2015 году и сейчас у нее около 39000 цитирований. Появление этой техники привело к значительному ускорению работы нейросетей. В карточках – подробнее о том, зачем нужна такая нормализация и как она работает.

P.S. Дискуссия о свойствах и причинах эффективности batch normalization всё ещё ведётся, рекомендуем обратить внимание на статью с NeurIPS 2018.

😻 #NN
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21👍5🤯51
Удобный способ посмотреть на пропуски в колонках и строках одновременно – использовать тепловую карту:

import seaborn as sns
import matplotlib.pyplot as plt

plt.figure(figsize=(25,10))
sns.heatmap(~df.isnull(), cbar=False, cmap=sns.cm.rocket_r) \
.set_title('Темные области - заполненные данные, светлые - пропуски');


Так можно оценить не только кол-во пропусков, но и их структуру.

😻 #analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥43👍10
Про Nested Cross-Validation

Это самая дорогая из "классических" схем валидации. Состоит из двух вложенных кросс-валидаций: внешней и внутренней. Внутренняя используется для подбора гипер-параметров/выбора модели, а внешняя - для оценки модели.

😻 #train
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
12👍5