Saber: Scaling Zero-Shot Reference-to-Video Generation
Видеогенератор от Meta (запрещено в РФ) с персонализацией и референсами (R2V) на базе Wan2.1-14B.
Отличается от аналогов тем, что не требует специализированных наборов данных, содержащих тройки «изображение-видео-текст», а обучается на парах «видео-текст»
На черрипиках демонстрирует явное превосходство над Phantom и VACE
Помимо основной задачи имеет эмерджентные способности:
— работает с несколькими изображениями одного объекта с разных ракурсов
— связывает изображения и текстовые подсказки
— меняет визуальные детали в видео при изменении текста (например, цвет одежды)
Гитхаб
#referencing #reference2video #personalization #wan
Видеогенератор от Meta (запрещено в РФ) с персонализацией и референсами (R2V) на базе Wan2.1-14B.
Отличается от аналогов тем, что не требует специализированных наборов данных, содержащих тройки «изображение-видео-текст», а обучается на парах «видео-текст»
На черрипиках демонстрирует явное превосходство над Phantom и VACE
Помимо основной задачи имеет эмерджентные способности:
— работает с несколькими изображениями одного объекта с разных ракурсов
— связывает изображения и текстовые подсказки
— меняет визуальные детали в видео при изменении текста (например, цвет одежды)
Гитхаб
#referencing #reference2video #personalization #wan
👍12🤷♂3😁1
Generative Video Motion Editing with 3D Point Tracks
В Adobe придумали метод редактирования движения в видео с помощью 3D-треков точек на базе Wan2.1-T2V-1.3B. Модель отличается от аналогов возможностью совместного редактирования движений камеры и объектов, сохраняя при этом контекст сцены
Модель может деформировать, удалять и добавлять объекты, менять их траектории
Полное видео 8 минут
Кода нет
#videoediting #research #cameracontrol #motioncontrol
В Adobe придумали метод редактирования движения в видео с помощью 3D-треков точек на базе Wan2.1-T2V-1.3B. Модель отличается от аналогов возможностью совместного редактирования движений камеры и объектов, сохраняя при этом контекст сцены
Модель может деформировать, удалять и добавлять объекты, менять их траектории
Полное видео 8 минут
Кода нет
#videoediting #research #cameracontrol #motioncontrol
🔥15😁2🤷♂1
This media is not supported in your browser
VIEW IN TELEGRAM
Wan-Move: Motion-controllable Video Generation via Latent Trajectory Guidance
Контроль движения от Tongui Labs при генерации видео из картинки на базе Wan2.1
Движение задаем латентной траекторией
Сейчас есть модель 14B 480p и поддержка в враппере
Гитхаб
HF
fp8 scaled Kijai
#wan #motioncontrol
Контроль движения от Tongui Labs при генерации видео из картинки на базе Wan2.1
Движение задаем латентной траекторией
Сейчас есть модель 14B 480p и поддержка в враппере
Гитхаб
HF
fp8 scaled Kijai
#wan #motioncontrol
👍8🔥2
Disney инвестирует 1 миллиард долларов в OpenAI и заключает лицензионное соглашение, которое позволит юзерам Sora создавать клипы с персонажами из франшиз Marvel, Pixar и Star Wars
Пацаны, фальстарт, оказывается нужно было ждать разрешения🤩
Итак, пользователи Sora смогут создавать короткие видео с 200 персонажами из упомянутых франшиз
Disney+ разрешит размещать на своей платформе «видео, вдохновлённые фанатами, созданные с помощью Sora»
То есть, помимо того дерьма за которое подписчики Disney+ платят сейчас, они будут платить еще и за ИИ-дрисню
#humor #news
Пацаны, фальстарт, оказывается нужно было ждать разрешения
Итак, пользователи Sora смогут создавать короткие видео с 200 персонажами из упомянутых франшиз
Disney+ разрешит размещать на своей платформе «видео, вдохновлённые фанатами, созданные с помощью Sora»
То есть, помимо того дерьма за которое подписчики Disney+ платят сейчас, они будут платить еще и за ИИ-дрисню
#humor #news
Please open Telegram to view this post
VIEW IN TELEGRAM
😁17❤3🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
The Nuke 17.0 beta
The Foundry приподнял веки. В 17 нюк прикрутили гауссианы и BigCat - CopyCat на стероидах
Наверняка же там все плохо, да?
Кто уже пробовал?
#nuke #gaussian #compositing
The Foundry приподнял веки. В 17 нюк прикрутили гауссианы и BigCat - CopyCat на стероидах
Наверняка же там все плохо, да?
Кто уже пробовал?
#nuke #gaussian #compositing
👍5🤯1
GPT-5.2
OpenAI запустили GPT-5.2 — новый флагман для агентов и кода с актуальностью до 31 августа 2025.
В ChatGPT уже доступны режимы Instant, Thinking и Pro (для платных тарифов). Бесплатные пользователи получат доступ завтра. Модель доступна через API и Codex, дороже чем 5 и 5.1
GPT-5.1 останется в ChatGPT для платных пользователей ещё три месяца как legacy-версия.
#agent #coding
OpenAI запустили GPT-5.2 — новый флагман для агентов и кода с актуальностью до 31 августа 2025.
В ChatGPT уже доступны режимы Instant, Thinking и Pro (для платных тарифов). Бесплатные пользователи получат доступ завтра. Модель доступна через API и Codex, дороже чем 5 и 5.1
GPT-5.1 останется в ChatGPT для платных пользователей ещё три месяца как legacy-версия.
#agent #coding
👍7❤1🥴1🍌1
Qwen3-Omni-Flash-2025-12-01
Вслед за говорилкой обновили и омнимодальную модель
— лучше понимает видео и аудио в многоходовых диалогах, благодаря чему разговоры протекают естественно
— позволяет настраивать личность ИИ с помощью системных промтов, например для ролевых сценариев
— поддерживает 119 языков текста и 19 языков речи
— создаёт голоса, неотличимые от человеческих
Qwen Chat - нажмите VoiceChat and VideoChat
Демо
Демо MS
API рилтайм
API Offline
#assistant #tts #stt #multimodal #omnimodal #russian
Вслед за говорилкой обновили и омнимодальную модель
— лучше понимает видео и аудио в многоходовых диалогах, благодаря чему разговоры протекают естественно
— позволяет настраивать личность ИИ с помощью системных промтов, например для ролевых сценариев
— поддерживает 119 языков текста и 19 языков речи
— создаёт голоса, неотличимые от человеческих
Qwen Chat - нажмите VoiceChat and VideoChat
Демо
Демо MS
API рилтайм
API Offline
#assistant #tts #stt #multimodal #omnimodal #russian
👍10❤2
Нейронавт | Нейросети в творчестве
GPT-5.2 OpenAI запустили GPT-5.2 — новый флагман для агентов и кода с актуальностью до 31 августа 2025. В ChatGPT уже доступны режимы Instant, Thinking и Pro (для платных тарифов). Бесплатные пользователи получат доступ завтра. Модель доступна через API…
Gemini Deep Research API
Гугл наверняка держит за пазухой какой-нибудь релиз на случай релизов у конкурентов.
Вчера в пику GPT-5.2 выкатили в API прокачанный Gemini Deep Research
#agent #deepresearch
Гугл наверняка держит за пазухой какой-нибудь релиз на случай релизов у конкурентов.
Вчера в пику GPT-5.2 выкатили в API прокачанный Gemini Deep Research
#agent #deepresearch
👍5😱1
Z-Image-Turbo-Fun-Controlnet-Union-2.0
Обновился Контролнет 5-в-1 под #Zimage от alibaba-pai
Умеет делать инпейнтнг, аутпейнтинг
Рулька силы и количество шагов влияет на реалистичность и чёткость результатов
Спасибо @m_franz
#controlnet #conditioning #inpainting #outpainting
Обновился Контролнет 5-в-1 под #Zimage от alibaba-pai
Умеет делать инпейнтнг, аутпейнтинг
Рулька силы и количество шагов влияет на реалистичность и чёткость результатов
Спасибо @m_franz
#controlnet #conditioning #inpainting #outpainting
🔥19👍6😱1
Google Disco
ИИ-браузер от гугла превращает информацию в веб-приложение
Записаться в вейтлист - там требуют подтвердить что вы находитесь в США, так что палевные русские аккаунты наверно там светить не стоит
#browser
ИИ-браузер от гугла превращает информацию в веб-приложение
Записаться в вейтлист - там требуют подтвердить что вы находитесь в США, так что палевные русские аккаунты наверно там светить не стоит
#browser
❤4👍3👎1😁1