Жилзона
1.59K subscribers
1.31K photos
218 videos
159 links
Экзистенциальное нейро-путешествие в Россию, которую мы потеряли.

Концепция: https://tttttt.me/zhilzona/33

Кибераутизм @digitaloutrage
РассветAI @rassvet_ai

🔞+
Download Telegram
Конец сезона. Регион 66, 5 октября 2139 г. 😌 End of the season. Region 66, October 5, 2139.

HD wallpaper »

Жилзона: Концепция · Spotify · Кибераутизм
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Жилзона. Осень 2139. 😌 Zhilzona. Fall 2139.

Midjourney · Suno · Luma · CapCut Pro

Жилзона: Концепция · Spotify · Кибераутизм
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Некто запилил советскую панельку в медитативном симуляторе постройки замков Tiny Glade.
Тест img2video на новой модели Pyramid Flow от китайских нейроделов в коллаборации с Kling.

Не смотря на всю, казалось бы, неказистость анимации, важно то, что все эти генерации я сделал локально. В среднем, по 4 минуты ожидания за 5 сек видео на RTX4090 (100% загрузки 24Gb vram).

Прошу заметить, что год назад подобное качество было у коммерческих моделей, которые сами были в зачатке.
Media is too big
VIEW IN TELEGRAM
Знакомства на Жилзоне.
Пенсионер на Жилзоне.
Forwarded from Ëда-мастер (Ëда-мастер)
Media is too big
VIEW IN TELEGRAM
Flux так увидел🤔😁
Minimax, Runway +липсинк.
Рекламу сериала увидел на ТНТ " Гудбай ", этим навеяло)
Media is too big
VIEW IN TELEGRAM
Жилзона. Кода. 😌 Zhilzona. Coda.

Midjourney · PyramidFlow via ComfyUI · Suno · Topaz Video AI · CapCut Pro

Жилзона: Концепция · Spotify · Кибераутизм

Максимально экспериментальное произведение в концепции Жилзоны, на генерацию которого я не потратил ни копейки денег (речь про видео). Впервые я использовал (и тестировал одновременно) локальную модель img2video PyramidFlow в рабочем воркфлоу для ComfyUI. В качестве исходных артов генерации Midjourney без какой-либо пост-обработки и апскейла.

Генерации шли в размере 640x384px, при дальнейшем апскейле до 1200x720px и двойном улучшайзинге через две модели Topaz Video AI. Исходный 24fps я потом поднял до 30-ти, а в 50fps выглядело не очень естественно для такой динамики. 5-ти секундный ролик на RTX 4090/24Гб и 64Гб RAM генерился в районе 1 мин 15 сек (плюс секунд 30 на Топазе). Но это обманчивые цифры, так как брак модели составлял примерно 50%.

Основной задачей было протестировать PyramidFlow на динамических и статических вводных изображениях, управляя движением камеры и динамикой промптом, а так же через параметры ноды. На видео вы можете увидеть, как модель справляется со сценами в динамике, статике, с глубиной сцен, с управлением несколькими объектами в одной сцене, с второстепенными объектами, мелкими деталями, погодными эффектами и освещением, цензурированным контентом (с ним все хорошо). Это не шевеляж, а именно диффузионная генерация, то, что делают коммерческие модели. Я рандомно сравнивал генерации с Gen-3 и хочу сказать, что Gen-3 по полной соснул в некоторых сценах от слова полностью (я не про разрешение и качество).

Да, не хвататет динамики в ценах. Да, не хватает когерентности к концу видео. Да, не для всех объектов просчитывается динамика так, как бы хотелось ее видеть. Да, меняется цвет сцены под конец генерации. Да, шаг влево-шаг вправо и видео распадается. Но! Это огромный скачок по-сравнению с тем, что мы видели хотя бы 3 месяца назад. И дальше будет, я верю, я это предсказывал, только лучше.
Please open Telegram to view this post
VIEW IN TELEGRAM