Нейронавт | Нейросети в творчестве

Motion 3-to-4: 3D Motion Reconstruction for 4D Synthesis

превращает обычное видео в 4D-объект. Модель берёт одно видео и, если нужно, 3D-модель, и делает из них динамичный 4D-объект

— разбивает задачу на две части: сначала создаёт статичную 3D-форму, потом восстанавливает движение

— использует специальную «базовую» 3D-сетку, чтобы лучше понимать движения

— предсказывает, как будут двигаться точки в каждом кадре, чтобы объект выглядел реалистично и не «разваливался»

Гитхаб

#videoto3d #videoto4d #3d #4d

👍5🤔1

2.24K views12:16

Нейронавт | Нейросети в творчестве

0:01

This media is not supported in your browser

VIEW IN TELEGRAM

0:01

This media is not supported in your browser

VIEW IN TELEGRAM

0:01

This media is not supported in your browser

VIEW IN TELEGRAM

ActionMesh: Animated 3D Mesh Generation with Temporal 3D Diffusion

Похожая, но полкруче модель от Meta (запрещено в РФ) создает анимированную 3D-модель по видео. Также может анимировать по текстовому промпту, или сделать модель из изображения и анимировать ее

Гитхаб
HF
Демо

#videoto3d #videoto4d #3d #4d

🔥8👍1

2.25K views13:46

Нейронавт | Нейросети в творчестве

3:33

Media is too big

VIEW IN TELEGRAM

D4RT

День 4D реконструкций на Нейронавте продолжает Гугл с работой без кода.

D4RT превращает видео в 4D-реконструкцию, отслеживая движение объектов

Чем D4RT отличается от других моделей:

— работает быстрее аналогов — в 18–300 раз

— обрабатывает видео в реальном времени

— может отслеживать точки и предсказывать их траекторию в 3D, даже если объект исчезает из кадра

— создаёт полную 3D-структуру сцены без дополнительных шагов

— определяет положение камеры и её траекторию

— хорошо справляется с динамичными сценами и сложными движениями

#videoto3d #videoto4d #3d #4d #video2scene #tracking #research

👍3🔥3

2.02K views16:12

Нейронавт | Нейросети в творчестве

0:19

This media is not supported in your browser

VIEW IN TELEGRAM

Rodin Gen-2 Edit

Deemos запустили контекстный 3d редактор, подобный нанобанану, только для 3d

— преобразование топологии

— локальные правки с помощью промпта (в бета-версии)

— разбивает модели на части

#3dediting

👍17

2.59K views08:11

Нейронавт | Нейросети в творчестве

0:38

This media is not supported in your browser

VIEW IN TELEGRAM

VideoMaMa: Mask-Guided Video Matting via Generative Prior

В Adobe и KAIST придумали инструмент для превращения грубых масок (например из SAM 2) в точную мягкую маску

Гитхаб
HF
Демо

#segmentation #mask2matte #video2matte

👍12🤔1🤯1

2.36K views09:12

Нейронавт | Нейросети в творчестве

#humor

😁34💯3

1.97K views12:15

Нейронавт | Нейросети в творчестве

ComfyUI-Qwen-TTS

Ноды клонирования голоса, генерации речи и дизайна голоса Qwen3-TTS

туториал (youtube)

#tts #text2speech #voicecloning #voicedesign #text2voice #comfyui #tutorial

👍19🤝1

2.39K views06:09

Нейронавт | Нейросети в творчестве

0:03

This media is not supported in your browser

VIEW IN TELEGRAM

VIDEO ARENA

На LMarena открыли бесплатную генерацию видео в режиме Battle - две анонимные модели выполняют задание

Доступны: Google's Veo 3, Sora 2, Seedance v1.5 Pro, Kling-2.6-pro, WAN-2.5, and Hailuo-2.3

#text2video #image2video

🔥12👍4❤2

1.79K views06:39

Нейронавт | Нейросети в творчестве

Stable-DiffCoder: Pushing the Frontier of Code Diffusion LLMs

Семейство лёгких открытых моделей для работы с кодом от ByteDance Seed

8B параметров
Есть Base и Instruct

Гитхаб
HF

#coding

👍10

1.94K views08:11

Нейронавт | Нейросети в творчестве

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:07

This media is not supported in your browser

VIEW IN TELEGRAM

360Anything: Geometry-Free Lifting of Images and Videos to 360°

Работа от Гугл без кода - преобразование обычных изображений и видео в 360-градусные панорамы без использования данных о камере или 3D-информации

А прогоняя материал через эту модель, они делают реконструкцию 3д сцены гауссианами и получают лучший результат

Спасибо @m_franz

#panorama #video2panorama #image2panorama #video2scene #research

🔥10👍2❤1

1.97K views08:41

Нейронавт | Нейросети в творчестве

Z-image завтра?

🔥16

3.02K views09:12

Нейронавт | Нейросети в творчестве

SAMTok: Representing Any Mask with Two Words

Токенизатор масок для мультимодалок от ByteDance

Кодирует любые сложные маски всего двумя словами (токенами), что сильно упрощает работу с ними

Гитхаб
HF
Демо

#segmentation #tokenizer #mllm

🔥6👍1

1.9K views09:42

Нейронавт | Нейросети в творчестве

1:11

Media is too big

VIEW IN TELEGRAM

HunyuanImage 3.0-Instruct

HY выпустили редактирующую версию картинкогенератора HunyuanImage 3.0 с мультиреференсом

80B параметров, из которых 13B активных

Попробовать

#CoT #imageediting #referencing

🔥8👍2

2.11K views10:06

Нейронавт | Нейросети в творчестве

LongCat-Flash-Thinking-2601

LongCat выпустил 560B рассуждалку, которая выбила #SOTA на рассуждении, поиске и использовании инструментов

LongCat Chat - попробовать
Гитхаб
HF

#reasoning #moe #agent

👍5🔥4

2.16K views12:06

About

Blog

Apps

Platform