Psy Eyes
6.8K subscribers
1.43K photos
1.57K videos
5 files
1.55K links
Креатив + AI + Web3... и мемы

Личная страница @AndreyBezryadin

Купить рекламу: https://telega.in/c/Psy_Eyes
Без наценки Telegain и индивидуальными датами — в личке.
Download Telegram
Media is too big
VIEW IN TELEGRAM
Вместе с обновлением V 4.5 проапгрейдилась и моя любимая страница на Suno — Explore, где крутя барабан можно открываться для себя новые жанры.

Теперь при таком звучании можно залипнуть ещё на дольше. А многие вещи так и хочется скачать.

Для сравнения версий Explore:
Suno V4.5
Suno V4
Suno V3.5
————————————————————
🔥 Создай своего цифрового двойника, оживи персонажа, или интегрируй бренд. Напиши — @AndreyBezryadin
Please open Telegram to view this post
VIEW IN TELEGRAM
Ostris: автор AI-Toolkit в одиночку натренировал и выпустил генератор картинок Flex.1-alpha с 8B параметрами, а также Flex.2 с вшитым контролем.

Проект начался как файнтюн Flux Schnell, ибо он в отличие от Dev.1 позволяет использовать картинки в коммерческих целях. У полученной модели меньше трансформенных блоков (8 против 19) из-за чего она потребляет меньше VRAM (как Flux Lite) и быстрее. Также для неё был натренирован guidance embedder, так что для создания изображений не требуется CFG. Модель из коробки поддерживает тренировку и для запуска в Comfy работает также как обычный Flux.

Flex.2 пока доступен в превью версии. Здесь также 8B параметров, но встроена поддержка инпейтинга и контролнета (очертания, поза, шлубина). 16-канальный VAE и 512 токенов на вход для промта.

Демо Flex 1
Демо Flex 2
Хаггинг
Сайт
————————————————————
🔥 Создай своего цифрового двойника, оживи персонажа, или интегрируй бренд. Напиши — @AndreyBezryadin
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Runway: выпустили инструмент References для получения стабильных персонажей на видео в разных сеттингах. Хорошо работает даже с анимацией.

Помимо своих фото и реф картинок локаций / объектов для общей композиции можно закидывать 3D ассеты. Новые углы обзора можно получить промтом. Возможно в дальнейшем прикрутят виртуальную камеру как у LTXV.

Доступно платным подписчикам.

Сайт
Твит
————————————————————
🔥 Создай своего цифрового двойника, оживи персонажа, или интегрируй бренд. Напиши — @AndreyBezryadin
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
И сразу опенсорсная ответочка от Вана на References.

Phantom: создание видео с референсным персонажем или объектом. Стабильно удерживает реф в кадре, работает с разными стилями, и позволяет комбинировать персонажей и объекты.

Недавно SkyReels тоже выпустили опенсорную модель A2 для генерации видео по рефам. Ждём заходов от Хуни, Stepfun, Flux Video, итд.

Помнится в прошлом году Movie Gen был первым, кто вышел с персонализацией видео. С тех пор о нём ни слуху ни духу, а опенсорс растёт и цветёт.

Пока есть веса только на мелкую 1.3B модель. На 14B должны пойти следом.

Kijai уже наваял веса, воркфлоу, и обновил Comfy ноды для Wan.

Сайт
Хаггинг (1.3B fp16)
Хаггинг (1.3B fp32)
Гитхаб
Comfy
————————————————————
🔥 Создай своего цифрового двойника, оживи персонажа, или интегрируй бренд. Напиши — @AndreyBezryadin
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
А это просто лора, которую я натренировал на основе Wan 2.1 14B.

Первое видео 24 fps второе 16 fps. Иногда физика отрабатывает лучше с меньшим фреймрейтом, ибо ближе к датасету базовой модели. Если что, фреймрейт можно поднять разными инструментами на посте.

Принимаю ваши заявки на тренировку лор по Wan, генерацию отдельных фото/видео с целевой персоной, или консультации.
Сравниваем реальность и генерацию.

Высота 4000 метров.