AI для Всех

🦚 DreamFusion: Text-to-3D using 2D Diffusion от ?Google

Не успели мы насладиться Text2Video от MetaAI как выходит Text-To-3D диффузия.. Что за день..

Как работает? Это градиентный метод, основанный на Loss-функции, такой как DeepDream. По факту происходит оптимизация рандомно инициализированной 3D модельки (a Neural Radiance Field, or NeRF) через градиенты 2D диффузионных генераций.

То есть по факту, проворачивая такой трюк не нужно иметь 3D данных вообще!

Подробнее:
1) Рандомная фигура рендерится через NERF (плотность, освещение, цвет)

2) Этот изначальный бред (так как это начало) рендерится в 2D проекцию

3) Затем к картинке подмешивают шум, и все это подается на!!! внимание!! ИМАГЕН

4) После чего Имаген предсказывает необходимый денойз

5) Затем из пересказанного денойза вычитается подмешанный шум. и ВУАЛЯ! Дальше все дифференцируемо! Можно пускать градиенты обратно на 3D-модель

А то что у ребят был доступ к IMAGEN мне на 99.9999999% кажется, что это Google. Ну, а так, чем Тьюринг не шутит..

👉 https://dreamfusionpaper.github.io/

🤖 м и ш и н л е р н и н г

🔥11👍3❤1😢1

2.94K views17:04

AI для Всех

Смотрю трансляцию Tesla AI day 2022. Знакомьтесь - Оптимус, он даже умеет ручками двигать :)

Вы тоже можете посмотреть.

Из интересного, они использовали NeRF для оценки глубины/расстояния объектов

👍6🔥1

3.49K viewsedited 03:01

AI для Всех

Элегантный кивок в сторону Stable Diffusion

🔥12👍2

3.6K viewsedited 04:28

AI для Всех

Отличное подробное интро, которое объясняет, как случилась революция DL 10 лет назад, и почему она происходит до сих пор

Слайды

👍19❤5

3.82K viewsedited 18:33

AI для Всех

Forwarded from Earth&Climate Tech

Stanford Machine Learning Group

В Стэнфорде есть группа студентов-докторантов (в основном) и исследователей под предводительством великого и ужасного Эндрю Энга, которая занимаются решениями прикладных проблем с применением машинного обучения. Например, в области медицины (кто интересуется - посмотрите!) или образования. Все проекты - тут.

Я вот не знал, но оказывается они делают классные проекты в области энергии и климата.

🧑🏻‍💻 METER-ML (Methane Tracking Emissions Reference database) - база данных с лейблами присутствия/отсутствия шести источников метана: скотофермы, свалки, угольные шахты, нефтегазоперерабатывающие объекты, нефтяные терминалы и очистные сооружения. Статья -> тут, датасет с лейблами -> тут

🧑🏻‍💻 ForestNet - модель глубокого обучения для классификации причин уменьшения площади лесных массивов по спутниковым снимкам. Статья -> тут, модель и данные -> тут

🧑🏻‍💻 Solar Forecasting - вероятностные модели для прогноза солнечной радиоактивности. Статья -> тут

🧑🏻‍💻 OGNet - модель глубокого обучения для автоматического обнаружения нефтегазовых объектов по аэроснимкам. Статья -> тут, модель и данные -> тут

Интересно же! 😀

stanfordmlgroup.github.io

Stanford Machine Learning Group

Our mission is to significantly improve people's lives through our work in Artificial Intelligence

❤15👍7🔥3

2.95K views16:07

AI для Всех

AlphaZero научился перемножать матрицы

Алгоритмы помогали математикам выполнять фундаментальные операции на протяжении тысячелетий. Древние египтяне создали алгоритм умножения двух чисел, не требующий таблицы умножения, а греческий математик Евклид описал алгоритм вычисления наибольшего общего делителя, который используется и по сей день.

Сегодня в журнале Nature, DeepMind представляет AlphaTensor, первую систему искусственного интеллекта (ИИ) для обнаружения новых, эффективных и доказательно правильных алгоритмов для фундаментальных задач, таких как умножение матриц.

Подробнее читайте в блог-посте, а для самых смелых в статье в Nature

❤27🤩8👍6😁2🤯1

3.94K views16:21

AI для Всех

Forwarded from Мишин Лернинг 🇺🇦🇮🇱

This media is not supported in your browser

VIEW IN TELEGRAM

🚀 IMAGEN VIDEO — Диффузии уже не остановить!

tl;dr
Помните Make-A-Video от MetaAI? Так вот — забудьте! Команда Google Brain только что создало лучшее Text-to-Video решение!

Если вкратце, то это имагеновый гомолог далишного Make-A-Video 🤖

Ну, а если чуть подробнее:

— Text Prompt подается в T5 энкодер
— Затем Base Model (5.6B ❤️) диффузит 16 кадров 40x24 pix в скромных 3 fps
— Затем темпоральный апсемплер TSR (1.7B) делает 32 кадра 40x24pix уже в 6 fps
— И пространственный апскейлер SSR-1 (1.4B) готовит предыдущие 32 кадра в разрешении 80x48 pix, и сразу второй SSR-2 (1.2B) делает 320x192
— Затем следуют еще два стейджа временного и один каскад пространственного суперреза и в итоге мы получаем 128 кадров в разрешении 1280x768 в 24fps

Основной фишкой такого подхода является Video U-Net — архитектура видео-юнет, пространственные операции которого выполняются независимо по кадрам с общими параметрами (батч х время, высота, ширина, каналы), тогда как временные операции работают уже по всему 5-ти мерному тензору (батч, время, высота, ширина, каналы).

Сделаю потом более подробный пост, а пока рекомендую всем посмотреть результаты на сайте проекта!

🚀 Imagen Video
📄 paper

🤖 м и ш и н л е р н и н г

❤7👍4🔥1🎉1

2.8K views20:01

AI для Всех

Forwarded from эйай ньюз

Диффузия оптимизирует нейронки

А вот тут вышла статья, где с помощью диффузионной модели заменяют традиционные оптимизаторы типа SGD или ADAM.

На вход поступают текущие веса оптимизируемой нейронки, текущий лосс, желаемый лосс, и параметр шага диффузии. А диффузионная модель предсказывает новые веса нейросети. Ускорение по сравнению с традиционной оптимизацией в ≈1000 раз.

@ai_newz

DL in NLP

Learning to Learn with Generative Models of Neural Network Checkpoints
Peebles, Radosavovic, et al. [Berkeley]
Статья: arxiv.org/abs/2209.12892
Код: github.com/wpeebles/G.pt
Блог: тык

Помните про парадигму learning to learn и всякие оптимитзаторы на основе…

🔥27🤯20👍3😁1

3.51K views19:39

AI для Всех

Открыт набор PhD студентов в New York University

Это там где ЛеКун. Аспирантура в США бесплатная, более того, вам даже будут платить стипендию что-то типа 30к$ в год

Подаваться тут

😢22👍14❤3🔥2😱2

6.48K viewsedited 18:15

AI для Всех

ИИ-изображения - новый клип-арт.

Microsoft добавляет DALL-E в свой пакет Office, таким образом картинки сгенерированные ИИ скоро появятся в каждой PowerPoint презентации.

Заметка на The Verge

🤯34👍4🤩4

34.5K views20:06

AI для Всех

Поддержите канал

Привет! Мне приятно, что так много людей читает мой канал, и как вы могли заметить, я стараюсь обходится почти без рекламы.

С донатов и рекламы я оплачиваю своего психотерапевта, и сейчас у меня осталось ровно на одно занятие.

Если хотите поддержать канал - закиньте денег на Тиньков.

Или с иностранных счетов на Revolut.

Каждому поддержавшему отвечу на вопрос про Долину и жизнь в ней ;)

Т‑Банк

Сбор на другое

Артемий Н. собирает 20 000 ₽.

❤14👍3😁2🔥1🤯1

3.2K viewsedited 15:51

AI для Всех

А вы занимаетесь с психотерапевтом?

Anonymous Poll

👍9🔥3🤯2

982 voters3.11K views17:45

AI для Всех

https://datascience.columbia.edu/research/postdoctoral-researchers/

👍4❤1

3.24K viewsedited 04:18

AI для Всех

Forwarded from Data Science by ODS.ai 🦜

🔥Out of One, Many: Using Language Models to Simulate Human Samples

TLDR: GPT-3 has unexpected application — modelling of socialogical studies. Average responses of a certain groups can be to some algorithmical accuracy predicted by in silico modelling.

What this means: sociologists won’t have to conduct costly live researches and will be able to run experiments in simulations. Marketers and politicians are getting their hands on cheap solution for modelling their slogans and value propositions. This enables people to check more hypothesis faster and to manipulate society with more efficiency.

ArXiV: https://arxiv.org/abs/2209.06899

#gpt3 #psychohistory #nlu #sociology

Please open Telegram to view this post

VIEW IN TELEGRAM

😱9👍7

3.53K views05:07

AI для Всех

Кстати, если кто-то хочет помочь мне вести канал - буду очень рад и буду делиться

❤3👍1

3.86K views07:59

AI для Всех

Forwarded from DLStories

А тут, наконец, вышел новый выпуск подкаста Deep Learning Stories, который мы записывали в конце августа🙃
#podcast

S01E05: AI в сейсмологии с Артемием Новоселовым

Гость выпуска — Артемий Новоселов, постдок рисерчер в Stanford University и автор канала NN for Science. В Стенфорде Артемий занимается ML в сейсмологии.

Обсудили с Артемием:
- путь Артемия в рисерче: как добраться до Стенфорда;
- что такое землетрясения и какими методами их пытаются предсказывать;
- AI в сейсмологии: как применяется сейчас, какие есть проблемы и какое видится будущее;
- немного о жизненном: о выгорании, мотивации, психологической помощи.

Ссылки на выпуск:
Yandex Music
Apple Music
Google Music
Spotify
Anchor.fm
YouTube (скоро будет, но без видео в этот раз)

—————————————
Поддержать подкаст и канал можно тут

🔥16❤11👍6

4.55K views15:41

AI для Всех

Stanford-SASP.pdf

55.4 KB

Stanford CS проводит программу поддержки заявок для недопредставленных студентов. Если вы рассматриваете возможность поступления на программу PhD по компьютерным наукам в Стэнфорде, они обещают сделать все возможное, чтобы дать обратную связь по вашему заявлению.

Подайте заявку до 29 октября.

🔥17❤1

4.06K viewsedited 02:47

AI для Всех

Compressed Vision for Efficient Video Understanding

DeepMind опубликовал интересную статью, с далеко идущими последствиями. Идея довольно простая и элегантная:

У нас есть много длинных видео, работать с ними сложно по ряду причин (long sequences, размер и тп). Так почему бы нам сначала не сжать эти видосы (с помощью нейрокодека), а потом обучать нейросеть уже на сжатых видео?

Так они и поступили. Мне кажется этот подход будет хорошо работать и с другими долгими последовательностями, например со стримами с датчиков.

🌟 Блог-пост
📖 Статья

#CV #compression #pretraining

👍14

5.84K viewsedited 18:19

About

Blog

Apps

Platform