Data Secrets
77.4K subscribers
6.05K photos
593 videos
20 files
2.43K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Конспекты YouTube

Eightify.app — расширение для Google Chrome, которое извлекает ключевую информацию из видео и отдает пользователю в текстовом виде. Построено, к слову, на основе GPT-4. Ничего полезнее сегодня вы не найдете

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
34
Как работают GANы

Это те самые состязательные модели, которые используются в GhatGPT, MidJourney, DALL-e и Kandinsky. Ян Лекун сказал про них так: "Генеративная Состязательная Сеть – самая интересная идея в машинном обучении за последние десять лет." Разбираемся, что делает ганы такими крутыми.

😻 #NN
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥93
Зарелизили DINOv2

Это трансформер для картинок, который натренирован абсолютно без лейблов. Что там происходит: в картинках закрашивают случайный патч черным и просят сеть предсказать, что там было. DINOv2 натренировали на огромном сбалансированном датасете и выложили код и веса в открытый доступ.

Теперь, когда решаете свою задачу, лучше начинать не с весов ImageNet, а с весов DINOv2: они более универсальные и лучше подходят под новые задачи. Так же авторы показали, что фичи DINOv2 лучше чем фичи OpenCLIP, который тренировался соотносить размеченные пары картинок и их текстовых описаний.

Блог | Код | Демо

😻 #news #NN
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11
Сегодня в программе прикольные гибриды животных

Ну или не всегда прикольные… Постаралась MidJourney

😻 #memes
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21
Когда не нужно заполнять пропуски в данных?

Есть много способов заполнять пропуски в данных: KNN, нули, медианы. Но не всегда это может быть нужно. Вот почему:

1. Современные градиентные бустинги (LightGBM, CatBoost, XGBoost) умеют работать с пропусками из коробки. Их просто не нужно заполнять - скармливаете модели данные как есть.

2. Очень популярная библиотека оценки моделей - SHAP - показывает пропуски отдельным цветом (серым), что позволяет более осмысленно их интерпретировать.

😻 #train
Please open Telegram to view this post
VIEW IN TELEGRAM
👍25
DeepFloyd IF - новая open-source модель text-2-image, использующая трехуровневую диффузионную архитектуру и T5 encode. Модель превосходит Imagen от Google в качестве генерации и имеет лучший FID. Доступна открытая имплементация, веса и детали архитектуры. DeepFloyd IF является лучшей Text-to-Image моделью на сегодняшний день.

👩‍💻 GitHub | 🤗 HuggingFace

😻 #NN #news
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍41
Hugging Face выпустила HuggingChat — конкурента ChatGPT с открытыми исходниками

Интерфейс HuggingChat похож на интерфейс ChatGPT. А сам чат-бот выполняет схожие задачи с теми, которые «умеет» ChatGPT.

Правда, в основе HuggingChat лежит модель OpenAssistant на 30 млрд параметров. В то время как размер ChatGPT оценивают в 175 млрд параметров. Пока алгоритм справляется чуть хуже ChatGPT и иногда лагает.

😻 #NN #news
Please open Telegram to view this post
VIEW IN TELEGRAM
10👍6
Про матрицу ошибок

😻 #math #train
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍20❤‍🔥3