Смотрю трансляцию Tesla AI day 2022. Знакомьтесь - Оптимус, он даже умеет ручками двигать :)
Вы тоже можете посмотреть.
Из интересного, они использовали NeRF для оценки глубины/расстояния объектов
Вы тоже можете посмотреть.
Из интересного, они использовали NeRF для оценки глубины/расстояния объектов
👍6🔥1
Отличное подробное интро, которое объясняет, как случилась революция DL 10 лет назад, и почему она происходит до сих пор
Слайды
Слайды
👍19❤5
Forwarded from Earth&Climate Tech
Stanford Machine Learning Group
В Стэнфорде есть группа студентов-докторантов (в основном) и исследователей под предводительством великого и ужасного Эндрю Энга, которая занимаются решениями прикладных проблем с применением машинного обучения. Например, в области медицины (кто интересуется - посмотрите!) или образования. Все проекты - тут.
Я вот не знал, но оказывается они делают классные проекты в области энергии и климата.
🧑🏻💻 METER-ML (Methane Tracking Emissions Reference database) - база данных с лейблами присутствия/отсутствия шести источников метана: скотофермы, свалки, угольные шахты, нефтегазоперерабатывающие объекты, нефтяные терминалы и очистные сооружения. Статья -> тут, датасет с лейблами -> тут
🧑🏻💻 ForestNet - модель глубокого обучения для классификации причин уменьшения площади лесных массивов по спутниковым снимкам. Статья -> тут, модель и данные -> тут
🧑🏻💻 Solar Forecasting - вероятностные модели для прогноза солнечной радиоактивности. Статья -> тут
🧑🏻💻 OGNet - модель глубокого обучения для автоматического обнаружения нефтегазовых объектов по аэроснимкам. Статья -> тут, модель и данные -> тут
Интересно же! 😀
В Стэнфорде есть группа студентов-докторантов (в основном) и исследователей под предводительством великого и ужасного Эндрю Энга, которая занимаются решениями прикладных проблем с применением машинного обучения. Например, в области медицины (кто интересуется - посмотрите!) или образования. Все проекты - тут.
Я вот не знал, но оказывается они делают классные проекты в области энергии и климата.
🧑🏻💻 METER-ML (Methane Tracking Emissions Reference database) - база данных с лейблами присутствия/отсутствия шести источников метана: скотофермы, свалки, угольные шахты, нефтегазоперерабатывающие объекты, нефтяные терминалы и очистные сооружения. Статья -> тут, датасет с лейблами -> тут
🧑🏻💻 ForestNet - модель глубокого обучения для классификации причин уменьшения площади лесных массивов по спутниковым снимкам. Статья -> тут, модель и данные -> тут
🧑🏻💻 Solar Forecasting - вероятностные модели для прогноза солнечной радиоактивности. Статья -> тут
🧑🏻💻 OGNet - модель глубокого обучения для автоматического обнаружения нефтегазовых объектов по аэроснимкам. Статья -> тут, модель и данные -> тут
Интересно же! 😀
stanfordmlgroup.github.io
Stanford Machine Learning Group
Our mission is to significantly improve people's lives through our work in Artificial Intelligence
❤15👍7🔥3
AlphaZero научился перемножать матрицы
Алгоритмы помогали математикам выполнять фундаментальные операции на протяжении тысячелетий. Древние египтяне создали алгоритм умножения двух чисел, не требующий таблицы умножения, а греческий математик Евклид описал алгоритм вычисления наибольшего общего делителя, который используется и по сей день.
Сегодня в журнале Nature, DeepMind представляет AlphaTensor, первую систему искусственного интеллекта (ИИ) для обнаружения новых, эффективных и доказательно правильных алгоритмов для фундаментальных задач, таких как умножение матриц.
Подробнее читайте в блог-посте, а для самых смелых в статье в Nature
Алгоритмы помогали математикам выполнять фундаментальные операции на протяжении тысячелетий. Древние египтяне создали алгоритм умножения двух чисел, не требующий таблицы умножения, а греческий математик Евклид описал алгоритм вычисления наибольшего общего делителя, который используется и по сей день.
Сегодня в журнале Nature, DeepMind представляет AlphaTensor, первую систему искусственного интеллекта (ИИ) для обнаружения новых, эффективных и доказательно правильных алгоритмов для фундаментальных задач, таких как умножение матриц.
Подробнее читайте в блог-посте, а для самых смелых в статье в Nature
❤27🤩8👍6😁2🤯1
Forwarded from Мишин Лернинг 🇺🇦🇮🇱
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 IMAGEN VIDEO — Диффузии уже не остановить!
tl;dr
Помните Make-A-Video от MetaAI? Так вот — забудьте! Команда Google Brain только что создало лучшее Text-to-Video решение!
Если вкратце, то это имагеновый гомолог далишного Make-A-Video 🤖
Ну, а если чуть подробнее:
— Text Prompt подается в T5 энкодер
— Затем Base Model (5.6B ❤️) диффузит 16 кадров 40x24 pix в скромных 3 fps
— Затем темпоральный апсемплер TSR (1.7B) делает 32 кадра 40x24pix уже в 6 fps
— И пространственный апскейлер SSR-1 (1.4B) готовит предыдущие 32 кадра в разрешении 80x48 pix, и сразу второй SSR-2 (1.2B) делает 320x192
— Затем следуют еще два стейджа временного и один каскад пространственного суперреза и в итоге мы получаем 128 кадров в разрешении 1280x768 в 24fps
Основной фишкой такого подхода является Video U-Net — архитектура видео-юнет, пространственные операции которого выполняются независимо по кадрам с общими параметрами (батч х время, высота, ширина, каналы), тогда как временные операции работают уже по всему 5-ти мерному тензору (батч, время, высота, ширина, каналы).
Сделаю потом более подробный пост, а пока рекомендую всем посмотреть результаты на сайте проекта!
🚀 Imagen Video
📄 paper
🤖 м и ш и н л е р н и н г
tl;dr
Помните Make-A-Video от MetaAI? Так вот — забудьте! Команда Google Brain только что создало лучшее Text-to-Video решение!
Если вкратце, то это имагеновый гомолог далишного Make-A-Video 🤖
Ну, а если чуть подробнее:
— Text Prompt подается в T5 энкодер
— Затем Base Model (5.6B ❤️) диффузит 16 кадров 40x24 pix в скромных 3 fps
— Затем темпоральный апсемплер TSR (1.7B) делает 32 кадра 40x24pix уже в 6 fps
— И пространственный апскейлер SSR-1 (1.4B) готовит предыдущие 32 кадра в разрешении 80x48 pix, и сразу второй SSR-2 (1.2B) делает 320x192
— Затем следуют еще два стейджа временного и один каскад пространственного суперреза и в итоге мы получаем 128 кадров в разрешении 1280x768 в 24fps
Основной фишкой такого подхода является Video U-Net — архитектура видео-юнет, пространственные операции которого выполняются независимо по кадрам с общими параметрами (батч х время, высота, ширина, каналы), тогда как временные операции работают уже по всему 5-ти мерному тензору (батч, время, высота, ширина, каналы).
Сделаю потом более подробный пост, а пока рекомендую всем посмотреть результаты на сайте проекта!
🚀 Imagen Video
📄 paper
🤖 м и ш и н л е р н и н г
❤7👍4🔥1🎉1
Forwarded from эйай ньюз
Диффузия оптимизирует нейронки
А вот тут вышла статья, где с помощью диффузионной модели заменяют традиционные оптимизаторы типа SGD или ADAM.
На вход поступают текущие веса оптимизируемой нейронки, текущий лосс, желаемый лосс, и параметр шага диффузии. А диффузионная модель предсказывает новые веса нейросети. Ускорение по сравнению с традиционной оптимизацией в ≈1000 раз.
@ai_newz
А вот тут вышла статья, где с помощью диффузионной модели заменяют традиционные оптимизаторы типа SGD или ADAM.
На вход поступают текущие веса оптимизируемой нейронки, текущий лосс, желаемый лосс, и параметр шага диффузии. А диффузионная модель предсказывает новые веса нейросети. Ускорение по сравнению с традиционной оптимизацией в ≈1000 раз.
@ai_newz
Telegram
DL in NLP
Learning to Learn with Generative Models of Neural Network Checkpoints
Peebles, Radosavovic, et al. [Berkeley]
Статья: arxiv.org/abs/2209.12892
Код: github.com/wpeebles/G.pt
Блог: тык
Помните про парадигму learning to learn и всякие оптимитзаторы на основе…
Peebles, Radosavovic, et al. [Berkeley]
Статья: arxiv.org/abs/2209.12892
Код: github.com/wpeebles/G.pt
Блог: тык
Помните про парадигму learning to learn и всякие оптимитзаторы на основе…
🔥27🤯20👍3😁1
Открыт набор PhD студентов в New York University
Это там где ЛеКун. Аспирантура в США бесплатная, более того, вам даже будут платить стипендию что-то типа 30к$ в год
Подаваться тут
Это там где ЛеКун. Аспирантура в США бесплатная, более того, вам даже будут платить стипендию что-то типа 30к$ в год
Подаваться тут
😢22👍14❤3🔥2😱2
ИИ-изображения - новый клип-арт.
Microsoft добавляет DALL-E в свой пакет Office, таким образом картинки сгенерированные ИИ скоро появятся в каждой PowerPoint презентации.
Заметка на The Verge
Microsoft добавляет DALL-E в свой пакет Office, таким образом картинки сгенерированные ИИ скоро появятся в каждой PowerPoint презентации.
Заметка на The Verge
🤯34👍4🤩4
Поддержите канал
Привет! Мне приятно, что так много людей читает мой канал, и как вы могли заметить, я стараюсь обходится почти без рекламы.
С донатов и рекламы я оплачиваю своего психотерапевта, и сейчас у меня осталось ровно на одно занятие.
Если хотите поддержать канал - закиньте денег на Тиньков.
Или с иностранных счетов на Revolut.
Каждому поддержавшему отвечу на вопрос про Долину и жизнь в ней ;)
Привет! Мне приятно, что так много людей читает мой канал, и как вы могли заметить, я стараюсь обходится почти без рекламы.
С донатов и рекламы я оплачиваю своего психотерапевта, и сейчас у меня осталось ровно на одно занятие.
Если хотите поддержать канал - закиньте денег на Тиньков.
Или с иностранных счетов на Revolut.
Каждому поддержавшему отвечу на вопрос про Долину и жизнь в ней ;)
Т‑Банк
Сбор на другое
Артемий Н. собирает 20 000 ₽.
❤14👍3😁2🔥1🤯1
А вы занимаетесь с психотерапевтом?
Anonymous Poll
21%
Да
19%
Нет - чушь какая
31%
Нет - денег нет
29%
Тык с умным видом 🤨
👍9🔥3🤯2
Forwarded from Data Science by ODS.ai 🦜
TLDR: GPT-3 has unexpected application — modelling of socialogical studies. Average responses of a certain groups can be to some algorithmical accuracy predicted by in silico modelling.
What this means: sociologists won’t have to conduct costly live researches and will be able to run experiments in simulations. Marketers and politicians are getting their hands on cheap solution for modelling their slogans and value propositions. This enables people to check more hypothesis faster and to manipulate society with more efficiency.
ArXiV: https://arxiv.org/abs/2209.06899
#gpt3 #psychohistory #nlu #sociology
Please open Telegram to view this post
VIEW IN TELEGRAM
😱9👍7
Forwarded from DLStories
А тут, наконец, вышел новый выпуск подкаста Deep Learning Stories, который мы записывали в конце августа🙃
#podcast
S01E05: AI в сейсмологии с Артемием Новоселовым
Гость выпуска — Артемий Новоселов, постдок рисерчер в Stanford University и автор канала NN for Science. В Стенфорде Артемий занимается ML в сейсмологии.
Обсудили с Артемием:
- путь Артемия в рисерче: как добраться до Стенфорда;
- что такое землетрясения и какими методами их пытаются предсказывать;
- AI в сейсмологии: как применяется сейчас, какие есть проблемы и какое видится будущее;
- немного о жизненном: о выгорании, мотивации, психологической помощи.
Ссылки на выпуск:
Yandex Music
Apple Music
Google Music
Spotify
Anchor.fm
YouTube (скоро будет, но без видео в этот раз)
—————————————
Поддержать подкаст и канал можно тут
#podcast
S01E05: AI в сейсмологии с Артемием Новоселовым
Гость выпуска — Артемий Новоселов, постдок рисерчер в Stanford University и автор канала NN for Science. В Стенфорде Артемий занимается ML в сейсмологии.
Обсудили с Артемием:
- путь Артемия в рисерче: как добраться до Стенфорда;
- что такое землетрясения и какими методами их пытаются предсказывать;
- AI в сейсмологии: как применяется сейчас, какие есть проблемы и какое видится будущее;
- немного о жизненном: о выгорании, мотивации, психологической помощи.
Ссылки на выпуск:
Yandex Music
Apple Music
Google Music
Spotify
Anchor.fm
YouTube (скоро будет, но без видео в этот раз)
—————————————
Поддержать подкаст и канал можно тут
🔥16❤11👍6
Stanford-SASP.pdf
55.4 KB
Stanford CS проводит программу поддержки заявок для недопредставленных студентов. Если вы рассматриваете возможность поступления на программу PhD по компьютерным наукам в Стэнфорде, они обещают сделать все возможное, чтобы дать обратную связь по вашему заявлению.
Подайте заявку до 29 октября.
Подайте заявку до 29 октября.
🔥17❤1
Compressed Vision for Efficient Video Understanding
DeepMind опубликовал интересную статью, с далеко идущими последствиями. Идея довольно простая и элегантная:
У нас есть много длинных видео, работать с ними сложно по ряду причин (long sequences, размер и тп). Так почему бы нам сначала не сжать эти видосы (с помощью нейрокодека), а потом обучать нейросеть уже на сжатых видео?
Так они и поступили. Мне кажется этот подход будет хорошо работать и с другими долгими последовательностями, например со стримами с датчиков.
🌟 Блог-пост
📖 Статья
#CV #compression #pretraining
DeepMind опубликовал интересную статью, с далеко идущими последствиями. Идея довольно простая и элегантная:
У нас есть много длинных видео, работать с ними сложно по ряду причин (long sequences, размер и тп). Так почему бы нам сначала не сжать эти видосы (с помощью нейрокодека), а потом обучать нейросеть уже на сжатых видео?
Так они и поступили. Мне кажется этот подход будет хорошо работать и с другими долгими последовательностями, например со стримами с датчиков.
🌟 Блог-пост
📖 Статья
#CV #compression #pretraining
👍14
This media is not supported in your browser
VIEW IN TELEGRAM
StabeDiffusion AR
Тут подвезли версию реально крутого метаверса. Вот так точно будет веселее жить в панельных кварталах, главное не забывать носить очки 🤓.
Источник
Тут подвезли версию реально крутого метаверса. Вот так точно будет веселее жить в панельных кварталах, главное не забывать носить очки 🤓.
Источник
🔥32🤯10❤2
Adversarial Latent Autoencoders
Авторы статьи добавили к StyleGAN дополнительный лосс из Autoencoders, который минимизирует разницу латентных векторов (вместо минимизации разницы в пиксельном пространстве между восстановленным изображением и оригиналом; привет Stable Diffusion). Это решило проблему генерации “мыльных” изображений, которой страдают AE.
Для этого они разбили дискриминатор, сделав его CNN часть энкодером, а оставшаяся FCN часть теперь принимает на вход эмбеддинг и, как и раньше, классифицирует его как фейк/реальный. Таким образом, можно повторно использовать веса дискриминатора.
Такой нехитрый трюк позволяет:
1. изменять реальные изображения, извлекая и манипулируя их скрытыми признаками
2. искать похожие изображения, сравнивая эмбеддинги
3. кластеризовать и размечать датасеты небольшим количеством лейблов
👨💻 Код
📖 Статья
#GAN #AE #CV
@karray
Авторы статьи добавили к StyleGAN дополнительный лосс из Autoencoders, который минимизирует разницу латентных векторов (вместо минимизации разницы в пиксельном пространстве между восстановленным изображением и оригиналом; привет Stable Diffusion). Это решило проблему генерации “мыльных” изображений, которой страдают AE.
Для этого они разбили дискриминатор, сделав его CNN часть энкодером, а оставшаяся FCN часть теперь принимает на вход эмбеддинг и, как и раньше, классифицирует его как фейк/реальный. Таким образом, можно повторно использовать веса дискриминатора.
Такой нехитрый трюк позволяет:
1. изменять реальные изображения, извлекая и манипулируя их скрытыми признаками
2. искать похожие изображения, сравнивая эмбеддинги
3. кластеризовать и размечать датасеты небольшим количеством лейблов
👨💻 Код
📖 Статья
#GAN #AE #CV
@karray
👍26❤1
Postdocs in Santa Cruz, CA
Applications are invited for two postdoctoral scholars in Arctic
Amplification. This work is part of a collaborative project funded by the DOE on the role of warm moist air intrusions as a hypothesised driver of
Arctic amplification. The postdoctoral scholars will conduct novel numerical water tracer and/or radiative-locking experiments in the Energy
Exascale Earth System Model (E3SM) to investigate the provenance of moisture intrusions and how they promote water vapor and cloud feedback over the Arctic.
The selected candidates will ideally have training in atmospheric sciences;
knowledge of extratropical dynamics and/or polar climate; and demonstrated experience modeling and coding, as well as working with large, complex datasets. Applicants with expertise in running and configuring global climate models, such as CESM, E3SM, or another state-of-the-art Earth system model are strongly encouraged to apply.
Apply to work at UC Santa Cruz: recruit.ucsc.edu/JPF01403
Apply to work at University of Victoria: Email the application materials as
a single pdf to hansingh@uvic.ca
#job
Applications are invited for two postdoctoral scholars in Arctic
Amplification. This work is part of a collaborative project funded by the DOE on the role of warm moist air intrusions as a hypothesised driver of
Arctic amplification. The postdoctoral scholars will conduct novel numerical water tracer and/or radiative-locking experiments in the Energy
Exascale Earth System Model (E3SM) to investigate the provenance of moisture intrusions and how they promote water vapor and cloud feedback over the Arctic.
The selected candidates will ideally have training in atmospheric sciences;
knowledge of extratropical dynamics and/or polar climate; and demonstrated experience modeling and coding, as well as working with large, complex datasets. Applicants with expertise in running and configuring global climate models, such as CESM, E3SM, or another state-of-the-art Earth system model are strongly encouraged to apply.
Apply to work at UC Santa Cruz: recruit.ucsc.edu/JPF01403
Apply to work at University of Victoria: Email the application materials as
a single pdf to hansingh@uvic.ca
#job
👍2❤1