Google Disco
ИИ-браузер от гугла превращает информацию в веб-приложение
Записаться в вейтлист - там требуют подтвердить что вы находитесь в США, так что палевные русские аккаунты наверно там светить не стоит
#browser
ИИ-браузер от гугла превращает информацию в веб-приложение
Записаться в вейтлист - там требуют подтвердить что вы находитесь в США, так что палевные русские аккаунты наверно там светить не стоит
#browser
❤4👍3👎1😁1
Media is too big
VIEW IN TELEGRAM
Visionary: The World Model Carrier Built on WebGPU-Powered Gaussian Splatting Platform
Китайская среда для рендера и работы с всевозможными гауссианами и 3D-мешами в браузере. Построена на базе WebGPU и ONNX Runtime
Есть three.js с API на TypeScript для интеграции в веб-приложения
Гитхаб
Попробовать
#3d #gaussian #nerf #3d #3dediting #rendering #onlone #realtime
Китайская среда для рендера и работы с всевозможными гауссианами и 3D-мешами в браузере. Построена на базе WebGPU и ONNX Runtime
Есть three.js с API на TypeScript для интеграции в веб-приложения
Гитхаб
Попробовать
#3d #gaussian #nerf #3d #3dediting #rendering #onlone #realtime
👍5❤1
Media is too big
VIEW IN TELEGRAM
Сервис для стилизации видео Mago Studio вышел в открытую бету
Обещают что попробовать можно бесплатно
Скидка 40% на первую покупку по промокоду
Пробуем здесь. Если сможем достучаться до сайта
#video2video #styletransfer #stylization
Обещают что попробовать можно бесплатно
Скидка 40% на первую покупку по промокоду
LAUNCHПробуем здесь. Если сможем достучаться до сайта
#video2video #styletransfer #stylization
👀5👍3❤1
relsim: Relational Visual Similarity
Adobe и Co придумали новый метод измерения визуальной схожести изображений — через реляционную схожесть, а не только через атрибуты.
В отличие от существующих методов (например, LPIPS, CLIP, DINO), которые фокусируются на внешних атрибутах изображений, relsim улавливает скрытые взаимоотношения между визуальными элементами
Гитхаб
#research #vlm
Adobe и Co придумали новый метод измерения визуальной схожести изображений — через реляционную схожесть, а не только через атрибуты.
В отличие от существующих методов (например, LPIPS, CLIP, DINO), которые фокусируются на внешних атрибутах изображений, relsim улавливает скрытые взаимоотношения между визуальными элементами
Гитхаб
#research #vlm
👍13🔥3
WindowSeat: Reflection Removal through Efficient Adaptation of Diffusion Transformers
Удаление отражений со снимков сделанных через стекло
Лора для #QIE 2509
Гитхаб
Демо
HF
#lora #imageediting #reflectionremoval
Удаление отражений со снимков сделанных через стекло
Лора для #QIE 2509
Гитхаб
Демо
HF
#lora #imageediting #reflectionremoval
👍22
Media is too big
VIEW IN TELEGRAM
Efficiently Reconstructing Dynamic Scenes One D4RT at a Time
В DeepMind придумали как эффективно реконструировать динамическую 3D сцену из одного видео.
Гауссианы в препринте не упомянуты
Кода нет
#videoto4d #4d #video2scene
В DeepMind придумали как эффективно реконструировать динамическую 3D сцену из одного видео.
Гауссианы в препринте не упомянуты
Кода нет
#videoto4d #4d #video2scene
🔥9
LivingSwap. Preserving Source Video Realism: High-Fidelity Face Swapping for Cinematic Quality
"Качественная" замена лиц на видео с сохранением реалистичности исходного видеоматериала.
Фокус на качестве уровня кино.
Использует ключевые кадры как сигналы для внедрения целевой идентичности, что позволяет гибко и контролируемо редактировать видео
— в отличие от GAN-методов не страдает от мерцания и дрожания в длинных последовательностях
— в сравнении с диффузионными моделями лучше сохраняет мелкие детали и избегает несоответствий с претренированными данными
— эффективнее методов на основе инпейнтинга в сохранении мелких деталей и избежании визуальных артефактов
— лучше адаптируется к длинным видео благодаря стратегии временного сшивания и использованию ключевых кадров
Базовая модель — VACE 14B
Код ждем
#faceswap #videoediting
"Качественная" замена лиц на видео с сохранением реалистичности исходного видеоматериала.
Фокус на качестве уровня кино.
Первая модель для замены лиц, которая применяет подход с использованием видеоэталона
Использует ключевые кадры как сигналы для внедрения целевой идентичности, что позволяет гибко и контролируемо редактировать видео
— в отличие от GAN-методов не страдает от мерцания и дрожания в длинных последовательностях
— в сравнении с диффузионными моделями лучше сохраняет мелкие детали и избегает несоответствий с претренированными данными
— эффективнее методов на основе инпейнтинга в сохранении мелких деталей и избежании визуальных артефактов
— лучше адаптируется к длинным видео благодаря стратегии временного сшивания и использованию ключевых кадров
Базовая модель — VACE 14B
Код ждем
#faceswap #videoediting
🔥21👍2
StereoWorld: Geometry-Aware Monocular-to-Stereo Video Generation
#SOTA в создании стереоскопического видео из монокулярного видео с высокой визуальной точностью и геометрической корректностью
Базовая модель — Wan2.1-T2V-1.3B. За оценку глубины отвечает Video Depth Anything
Кто умеет косить глазами для просмотра стерео - ставьте 👀
Кода нет
#novelview #video2video #stereo #mono2stereo
#SOTA в создании стереоскопического видео из монокулярного видео с высокой визуальной точностью и геометрической корректностью
Базовая модель — Wan2.1-T2V-1.3B. За оценку глубины отвечает Video Depth Anything
Кто умеет косить глазами для просмотра стерео - ставьте 👀
Кода нет
#novelview #video2video #stereo #mono2stereo
👀26👍4😁4🔥3❤2