This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Motion 3-to-4: 3D Motion Reconstruction for 4D Synthesis
превращает обычное видео в 4D-объект. Модель берёт одно видео и, если нужно, 3D-модель, и делает из них динамичный 4D-объект
— разбивает задачу на две части: сначала создаёт статичную 3D-форму, потом восстанавливает движение
— использует специальную «базовую» 3D-сетку, чтобы лучше понимать движения
— предсказывает, как будут двигаться точки в каждом кадре, чтобы объект выглядел реалистично и не «разваливался»
Гитхаб
#videoto3d #videoto4d #3d #4d
превращает обычное видео в 4D-объект. Модель берёт одно видео и, если нужно, 3D-модель, и делает из них динамичный 4D-объект
— разбивает задачу на две части: сначала создаёт статичную 3D-форму, потом восстанавливает движение
— использует специальную «базовую» 3D-сетку, чтобы лучше понимать движения
— предсказывает, как будут двигаться точки в каждом кадре, чтобы объект выглядел реалистично и не «разваливался»
Гитхаб
#videoto3d #videoto4d #3d #4d
👍5🤔1
ActionMesh: Animated 3D Mesh Generation with Temporal 3D Diffusion
Похожая, но полкруче модель от Meta (запрещено в РФ) создает анимированную 3D-модель по видео. Также может анимировать по текстовому промпту, или сделать модель из изображения и анимировать ее
Гитхаб
HF
Демо
#videoto3d #videoto4d #3d #4d
Похожая, но полкруче модель от Meta (запрещено в РФ) создает анимированную 3D-модель по видео. Также может анимировать по текстовому промпту, или сделать модель из изображения и анимировать ее
Гитхаб
HF
Демо
#videoto3d #videoto4d #3d #4d
🔥8👍1
Media is too big
VIEW IN TELEGRAM
D4RT
День 4D реконструкций на Нейронавте продолжает Гугл с работой без кода.
D4RT превращает видео в 4D-реконструкцию, отслеживая движение объектов
Чем D4RT отличается от других моделей:
— работает быстрее аналогов — в 18–300 раз
— обрабатывает видео в реальном времени
— может отслеживать точки и предсказывать их траекторию в 3D, даже если объект исчезает из кадра
— создаёт полную 3D-структуру сцены без дополнительных шагов
— определяет положение камеры и её траекторию
— хорошо справляется с динамичными сценами и сложными движениями
#videoto3d #videoto4d #3d #4d #video2scene #tracking #research
День 4D реконструкций на Нейронавте продолжает Гугл с работой без кода.
D4RT превращает видео в 4D-реконструкцию, отслеживая движение объектов
Чем D4RT отличается от других моделей:
— работает быстрее аналогов — в 18–300 раз
— обрабатывает видео в реальном времени
— может отслеживать точки и предсказывать их траекторию в 3D, даже если объект исчезает из кадра
— создаёт полную 3D-структуру сцены без дополнительных шагов
— определяет положение камеры и её траекторию
— хорошо справляется с динамичными сценами и сложными движениями
#videoto3d #videoto4d #3d #4d #video2scene #tracking #research
👍3🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
Rodin Gen-2 Edit
Deemos запустили контекстный 3d редактор, подобный нанобанану, только для 3d
— преобразование топологии
— локальные правки с помощью промпта (в бета-версии)
— разбивает модели на части
#3dediting
Deemos запустили контекстный 3d редактор, подобный нанобанану, только для 3d
— преобразование топологии
— локальные правки с помощью промпта (в бета-версии)
— разбивает модели на части
#3dediting
👍17
This media is not supported in your browser
VIEW IN TELEGRAM
VideoMaMa: Mask-Guided Video Matting via Generative Prior
В Adobe и KAIST придумали инструмент для превращения грубых масок (например из SAM 2) в точную мягкую маску
Гитхаб
HF
Демо
#segmentation #mask2matte #video2matte
В Adobe и KAIST придумали инструмент для превращения грубых масок (например из SAM 2) в точную мягкую маску
Гитхаб
HF
Демо
#segmentation #mask2matte #video2matte
👍12🤔1🤯1
ComfyUI-Qwen-TTS
Ноды клонирования голоса, генерации речи и дизайна голоса Qwen3-TTS
туториал (youtube)
#tts #text2speech #voicecloning #voicedesign #text2voice #comfyui #tutorial
Ноды клонирования голоса, генерации речи и дизайна голоса Qwen3-TTS
туториал (youtube)
#tts #text2speech #voicecloning #voicedesign #text2voice #comfyui #tutorial
👍19🤝1
This media is not supported in your browser
VIEW IN TELEGRAM
VIDEO ARENA
На LMarena открыли бесплатную генерацию видео в режиме Battle - две анонимные модели выполняют задание
Доступны: Google's Veo 3, Sora 2, Seedance v1.5 Pro, Kling-2.6-pro, WAN-2.5, and Hailuo-2.3
#text2video #image2video
На LMarena открыли бесплатную генерацию видео в режиме Battle - две анонимные модели выполняют задание
Доступны: Google's Veo 3, Sora 2, Seedance v1.5 Pro, Kling-2.6-pro, WAN-2.5, and Hailuo-2.3
#text2video #image2video
🔥12👍4❤2
Stable-DiffCoder: Pushing the Frontier of Code Diffusion LLMs
Семейство лёгких открытых моделей для работы с кодом от ByteDance Seed
8B параметров
Есть Base и Instruct
Гитхаб
HF
#coding
Семейство лёгких открытых моделей для работы с кодом от ByteDance Seed
8B параметров
Есть Base и Instruct
Гитхаб
HF
#coding
👍10
360Anything: Geometry-Free Lifting of Images and Videos to 360°
Работа от Гугл без кода - преобразование обычных изображений и видео в 360-градусные панорамы без использования данных о камере или 3D-информации
А прогоняя материал через эту модель, они делают реконструкцию 3д сцены гауссианами и получают лучший результат
Спасибо @m_franz
#panorama #video2panorama #image2panorama #video2scene #research
Работа от Гугл без кода - преобразование обычных изображений и видео в 360-градусные панорамы без использования данных о камере или 3D-информации
А прогоняя материал через эту модель, они делают реконструкцию 3д сцены гауссианами и получают лучший результат
Спасибо @m_franz
#panorama #video2panorama #image2panorama #video2scene #research
🔥10👍2❤1
SAMTok: Representing Any Mask with Two Words
Токенизатор масок для мультимодалок от ByteDance
Кодирует любые сложные маски всего двумя словами (токенами), что сильно упрощает работу с ними
Гитхаб
HF
Демо
#segmentation #tokenizer #mllm
Токенизатор масок для мультимодалок от ByteDance
Кодирует любые сложные маски всего двумя словами (токенами), что сильно упрощает работу с ними
Гитхаб
HF
Демо
#segmentation #tokenizer #mllm
🔥6👍1
Media is too big
VIEW IN TELEGRAM
HunyuanImage 3.0-Instruct
HY выпустили редактирующую версию картинкогенератора HunyuanImage 3.0 с мультиреференсом
80B параметров, из которых 13B активных
Попробовать
#CoT #imageediting #referencing
HY выпустили редактирующую версию картинкогенератора HunyuanImage 3.0 с мультиреференсом
80B параметров, из которых 13B активных
Попробовать
#CoT #imageediting #referencing
🔥8👍2
LongCat-Flash-Thinking-2601
LongCat выпустил 560B рассуждалку, которая выбила #SOTA на рассуждении, поиске и использовании инструментов
LongCat Chat - попробовать
Гитхаб
HF
#reasoning #moe #agent
LongCat выпустил 560B рассуждалку, которая выбила #SOTA на рассуждении, поиске и использовании инструментов
LongCat Chat - попробовать
Гитхаб
HF
#reasoning #moe #agent
👍5🔥4