Psy Eyes

Ostris: автор AI-Toolkit в одиночку натренировал и выпустил генератор картинок Flex.1-alpha с 8B параметрами, а также Flex.2 с вшитым контролем.

Проект начался как файнтюн Flux Schnell, ибо он в отличие от Dev.1 позволяет использовать картинки в коммерческих целях. У полученной модели меньше трансформенных блоков (8 против 19) из-за чего она потребляет меньше VRAM (как Flux Lite) и быстрее. Также для неё был натренирован guidance embedder, так что для создания изображений не требуется CFG. Модель из коробки поддерживает тренировку и для запуска в Comfy работает также как обычный Flux.

Flex.2 пока доступен в превью версии. Здесь также 8B параметров, но встроена поддержка инпейтинга и контролнета (очертания, поза, шлубина). 16-канальный VAE и 512 токенов на вход для промта.

Демо Flex 1
Демо Flex 2
Хаггинг
Сайт
————————————————————
🔥 Создай своего цифрового двойника, оживи персонажа, или интегрируй бренд. Напиши — @AndreyBezryadin

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

1.95K views16:32

1:15

0:28

Runway: выпустили инструмент References для получения стабильных персонажей на видео в разных сеттингах. Хорошо работает даже с анимацией.

Помимо своих фото и реф картинок локаций / объектов для общей композиции можно закидывать 3D ассеты. Новые углы обзора можно получить промтом. Возможно в дальнейшем прикрутят виртуальную камеру как у LTXV.

Доступно платным подписчикам.

Сайт
Твит
————————————————————
🔥 Создай своего цифрового двойника, оживи персонажа, или интегрируй бренд. Напиши — @AndreyBezryadin

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

2.01K views17:29

0:04

1:08

0:04

0:04

И сразу опенсорсная ответочка от Вана на References.

Phantom: создание видео с референсным персонажем или объектом. Стабильно удерживает реф в кадре, работает с разными стилями, и позволяет комбинировать персонажей и объекты.

Недавно SkyReels тоже выпустили опенсорную модель A2 для генерации видео по рефам. Ждём заходов от Хуни, Stepfun, Flux Video, итд.

Помнится в прошлом году Movie Gen был первым, кто вышел с персонализацией видео. С тех пор о нём ни слуху ни духу, а опенсорс растёт и цветёт.

Пока есть веса только на мелкую 1.3B модель. На 14B должны пойти следом.

Kijai уже наваял веса, воркфлоу, и обновил Comfy ноды для Wan.

Сайт
Хаггинг (1.3B fp16)
Хаггинг (1.3B fp32)
Гитхаб
Comfy
————————————————————
🔥 Создай своего цифрового двойника, оживи персонажа, или интегрируй бренд. Напиши — @AndreyBezryadin

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

2.16K views18:12