Data Secrets

Конспекты YouTube

Eightify.app — расширение для Google Chrome, которое извлекает ключевую информацию из видео и отдает пользователю в текстовом виде. Построено, к слову, на основе GPT-4. Ничего полезнее сегодня вы не найдете

😻

#advice

Please open Telegram to view this post

VIEW IN TELEGRAM

❤34

3.57K viewsedited 08:24

Data Secrets

Как работают GANы

Это те самые состязательные модели, которые используются в GhatGPT, MidJourney, DALL-e и Kandinsky. Ян Лекун сказал про них так: "Генеративная Состязательная Сеть – самая интересная идея в машинном обучении за последние десять лет." Разбираемся, что делает ганы такими крутыми.

😻

#NN

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥9❤3

3.09K views11:13

Data Secrets

Зарелизили DINOv2

Это трансформер для картинок, который натренирован абсолютно без лейблов. Что там происходит: в картинках закрашивают случайный патч черным и просят сеть предсказать, что там было. DINOv2 натренировали на огромном сбалансированном датасете и выложили код и веса в открытый доступ.

Теперь, когда решаете свою задачу, лучше начинать не с весов ImageNet, а с весов DINOv2: они более универсальные и лучше подходят под новые задачи. Так же авторы показали, что фичи DINOv2 лучше чем фичи OpenCLIP, который тренировался соотносить размеченные пары картинок и их текстовых описаний.

Блог | Код | Демо

😻

#news #NN

Please open Telegram to view this post

VIEW IN TELEGRAM

👍11

3.03K viewsedited 15:24

Data Secrets

Сегодня в программе прикольные гибриды животных

Ну или не всегда прикольные… Постаралась MidJourney

😻

#memes

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍21

3K views08:39

Data Secrets

Когда не нужно заполнять пропуски в данных?

Есть много способов заполнять пропуски в данных: KNN, нули, медианы. Но не всегда это может быть нужно. Вот почему:

1. Современные градиентные бустинги (LightGBM, CatBoost, XGBoost) умеют работать с пропусками из коробки. Их просто не нужно заполнять - скармливаете модели данные как есть.

2. Очень популярная библиотека оценки моделей - SHAP - показывает пропуски отдельным цветом (серым), что позволяет более осмысленно их интерпретировать.

😻

#train

Please open Telegram to view this post

VIEW IN TELEGRAM

👍25

3.02K viewsedited 14:11

Data Secrets

DeepFloyd IF - новая open-source модель text-2-image, использующая трехуровневую диффузионную архитектуру и T5 encode. Модель превосходит Imagen от Google в качестве генерации и имеет лучший FID. Доступна открытая имплементация, веса и детали архитектуры. DeepFloyd IF является лучшей Text-to-Image моделью на сегодняшний день.

👩‍💻

GitHub | 🤗 HuggingFace

😻

#NN #news

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥9👍4❤1

3.07K viewsedited 17:12

Data Secrets

Hugging Face выпустила HuggingChat — конкурента ChatGPT с открытыми исходниками

Интерфейс HuggingChat похож на интерфейс ChatGPT. А сам чат-бот выполняет схожие задачи с теми, которые «умеет» ChatGPT.

Правда, в основе HuggingChat лежит модель OpenAssistant на 30 млрд параметров. В то время как размер ChatGPT оценивают в 175 млрд параметров. Пока алгоритм справляется чуть хуже ChatGPT и иногда лагает.

😻

#NN #news

Please open Telegram to view this post

VIEW IN TELEGRAM

❤10👍6

3K viewsedited 08:11

Data Secrets