Нейронавт | Нейросети в творчестве
11.1K subscribers
4.75K photos
4.11K videos
41 files
5.12K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6813108708
Download Telegram
Motion 3-to-4: 3D Motion Reconstruction for 4D Synthesis

превращает обычное видео в 4D-объект. Модель берёт одно видео и, если нужно, 3D-модель, и делает из них динамичный 4D-объект

— разбивает задачу на две части: сначала создаёт статичную 3D-форму, потом восстанавливает движение

— использует специальную «базовую» 3D-сетку, чтобы лучше понимать движения

— предсказывает, как будут двигаться точки в каждом кадре, чтобы объект выглядел реалистично и не «разваливался»

Гитхаб

#videoto3d #videoto4d #3d #4d
👍5🤔1
ActionMesh: Animated 3D Mesh Generation with Temporal 3D Diffusion

Похожая, но полкруче модель от Meta (запрещено в РФ) создает анимированную 3D-модель по видео. Также может анимировать по текстовому промпту, или сделать модель из изображения и анимировать ее

Гитхаб
HF
Демо

#videoto3d #videoto4d #3d #4d
🔥8👍1
Media is too big
VIEW IN TELEGRAM
D4RT

День 4D реконструкций на Нейронавте продолжает Гугл с работой без кода.

D4RT превращает видео в 4D-реконструкцию, отслеживая движение объектов

Чем D4RT отличается от других моделей:

— работает быстрее аналогов — в 18–300 раз

— обрабатывает видео в реальном времени

— может отслеживать точки и предсказывать их траекторию в 3D, даже если объект исчезает из кадра

— создаёт полную 3D-структуру сцены без дополнительных шагов

— определяет положение камеры и её траекторию

— хорошо справляется с динамичными сценами и сложными движениями

#videoto3d #videoto4d #3d #4d #video2scene #tracking #research
👍3🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
Rodin Gen-2 Edit

Deemos запустили контекстный 3d редактор, подобный нанобанану, только для 3d

— преобразование топологии

— локальные правки с помощью промпта (в бета-версии)

— разбивает модели на части

#3dediting
👍17
This media is not supported in your browser
VIEW IN TELEGRAM
VideoMaMa: Mask-Guided Video Matting via Generative Prior

В Adobe и KAIST придумали инструмент для превращения грубых масок (например из SAM 2) в точную мягкую маску

Гитхаб
HF
Демо

#segmentation #mask2matte #video2matte
👍12🤔1🤯1
ComfyUI-Qwen-TTS

Ноды клонирования голоса, генерации речи и дизайна голоса Qwen3-TTS

туториал (youtube)

#tts #text2speech #voicecloning #voicedesign #text2voice #comfyui #tutorial
👍19🤝1
This media is not supported in your browser
VIEW IN TELEGRAM
VIDEO ARENA

На LMarena открыли бесплатную генерацию видео в режиме Battle - две анонимные модели выполняют задание

Доступны: Google's Veo 3, Sora 2, Seedance v1.5 Pro, Kling-2.6-pro, WAN-2.5, and Hailuo-2.3

#text2video #image2video
🔥12👍42
Stable-DiffCoder: Pushing the Frontier of Code Diffusion LLMs

Семейство лёгких открытых моделей для работы с кодом от ByteDance Seed

8B параметров
Есть Base и Instruct

Гитхаб
HF

#coding
👍10
360Anything: Geometry-Free Lifting of Images and Videos to 360°

Работа от Гугл без кода - преобразование обычных изображений и видео в 360-градусные панорамы без использования данных о камере или 3D-информации

А прогоняя материал через эту модель, они делают реконструкцию 3д сцены гауссианами и получают лучший результат

Спасибо @m_franz

#panorama #video2panorama #image2panorama #video2scene #research
🔥10👍21
SAMTok: Representing Any Mask with Two Words

Токенизатор масок для мультимодалок от ByteDance

Кодирует любые сложные маски всего двумя словами (токенами), что сильно упрощает работу с ними

Гитхаб
HF
Демо

#segmentation #tokenizer #mllm
🔥6👍1
Media is too big
VIEW IN TELEGRAM
HunyuanImage 3.0-Instruct

HY выпустили редактирующую версию картинкогенератора HunyuanImage 3.0 с мультиреференсом

80B параметров, из которых 13B активных

Попробовать

#CoT #imageediting #referencing
🔥8👍2
LongCat-Flash-Thinking-2601

LongCat выпустил 560B рассуждалку, которая выбила #SOTA на рассуждении, поиске и использовании инструментов

LongCat Chat - попробовать
Гитхаб
HF

#reasoning #moe #agent
👍5🔥4