Метаверсище и ИИще

Еще раз про ИИ-режиссуру, сториборды, восьмерки и мультиракурсы.

Тут Мигель прислал мне пару тестов Kling 3.0.
И снова Клинг отлично справляется с линией взгляда и диалогами, с нуля делает мультиплановые сцены, и я полностью согласен с Мигелем: чтобы делать короткий ролик вам больше не нужно знать ничего про ИИ. Если вы способны написать короткую историю со смыслом - остальное сделает 'умная' модель с режиссером на борту.

Доверну лишь следующую мысль, "написать короткую историю со смыслом" вам не обязательно самому, вы всегда можете призвать ИИ в соавторы.

Промпты к этим видосам можно забрать тут и тут.

И я предполагаю, что в 2026 году наши дискуссии тут трансформируются от "пальцы не те, губы шакалит, много мыла и пр" в "хороший\плохой монтаж, понимание сториборда, оценки режиссуры".

И круг замкнется (наконец) - снова придется вернуться к пониманию монтажа, искусству сторителлинга, сценарному навыку. Для многих это будет неприятным сюрпризом - мы то думали, что щас качество и длину подтянут в генераторах - и заживем.

Нюанс также в том, что сторителлинг тоже меняется, равно как и монтаж. Придется меняться и подстраиваться на ходу.

Но хорошая новость в том, что порог входа во все это безобразие стал крайне демократичным, так что все это доступно теперь для всех, было бы электричество под столом(в облаке).

@cgevent

👍36🔥17❤6😁4👎2😱2

6.46K viewsSergey Tsyptsyn ️️, 16:14

Нейропрожарка

"Последняя капля" - псевдосоциальный ролик про весь ужас старения и потери былого величия.

Над проектом работали:

Автор: Алексей Лотков

ИИ-артисты:
Елизавета Ершова
Алексей Оленченко
Кирилл Родионов
Демид Гурьянов

Хотелось не просто мемный ролик сделать, а заложить какой-то смысл и заставить чуствовать сострадание настоящему монстру.

Юмор здесь работает вместе с меланхолией и ближе к концу история становится все серьезнее, а сам персонаж - больше похожим на обычного пожилого мужчину, нежели какого-то монстра.
Финальным аккордом становится кадр, где дракула ложится в гроб - это эдакий параллелизм с концом жизни, но для дракулы это лишь очередной ежедневный ритуал.

Кажется, что с каждым очередным просмотром, юмор угасает, и история начинает приобретать все более мрачные оттенки.

Итак, перейдем к тех инсайтам, т.к. их тут набралось немало;

Голоса были сделаны достаточно нестандартным путем - мы делали кастинг персонажей в сора 2 и мне очень понравился голос мужчины на одной из генераций (англ с румынским акцентом). Мы сделали с ним камео и сгенерировали все реплики по скрипту. И тут встала сложность - мне не нравился сам каст, но понравился голос, а средства соры 2 подразумевают только комплект из того и другого:)

Была аудио-дорожка и нужный каст вместе со всеми стиллами. При этом еще и нужен был не топорный отыгрыш - Multitalk/infinitetalk тут не подошли именно из-за этого. Я записал себя в качестве мокап-актера, открывая рот под сгенерированные реплики и прогнал это все через клинг motion control - результат видно на видео, впринципе все удалось. Также был приятно удивлен тем, как он работает со взаимодействием объектов, которые персонаж держит в руках - например листок бумаги, или сигарета.

Все шоты со сносом и парламентом были сделаны в сора 2 - она вообще тащит, что касается реализма. Если б был еще хоть какой-то контроль, то была бы самая крутая модель на рынке. Но, как видите, применение ей все-таки можно найти.

По затратам:
Про Подписка на сору ($200) - можно было бы все на бесплатных акках сделать, это не обязательная трата
Хиггсфилд Ultimate ($89)
Elevenlabs ($10)
Reve ($20)

Итого: $319 по затратам на подписки

@cgevent

13👍134🔥40❤36😁11👎3

6.18K viewsSergey Tsyptsyn ️️, 17:02

Метаверсище и ИИще

Qwen Image 2.0

Спойлер: весов и код нет.

Взяли и слили две ветки разработки (generate и edit), а также многочисленные 2509, 2511, 2512, в одну монолитную модель.
См схему в шапке.

- дичайше крутое понимание промпт
- лютый рендеринг текста (целыми параграфами)
- нереальная способность генерить целые слайды с крутой типографикой
- 2К
- мощное редактирование.

Тестируем тут:
https://chat.qwen.ai/?inputFeature=t2i

А подробное описание процесса слияния моделей в одну и галерея картинок тут:
https://qwen.ai/blog?id=qwen-image-2.0

Что с весами пока непонятно...

@cgevent

🔥28❤7👎1

5.63K viewsSergey Tsyptsyn ️️, 09:56

Метаверсище и ИИще

Qwen Image 2.0

Лошадка знает толк в промптах.

@cgevent

1😁16👍8🔥6❤1👎1

5.32K viewsSergey Tsyptsyn ️️, 10:02

Метаверсище и ИИще

0:15

This media is not supported in your browser

VIEW IN TELEGRAM

Вы извините, но я снова за Сидэнского.

Если это реально генерация в Seedance 2.0 (источник китайский, проверить не смог, но поверил), то очень неспокойно за motion designer-ов и вот эти вот все продуктовые демо.

@cgevent

👍28🔥20❤5😱3

5.31K viewsSergey Tsyptsyn ️️, 11:58

Метаверсище и ИИще

У Хиггсфилда заблочили твиттор-аккаунт.

По одной из версий, они взяли чей-то фильм Jumper (без разрешения), заменили в нем текстуры (см скриншот), и использовали контент для рекламы конкурса с призами от 150 000 долларов.

Замечу, что это пост не про сервис Хиггсов, а про то, что есть пределы маркетинга, которые не стоит переступать. В общем пост про рекламу, чувство меры и последствия.

Даже у меня в коментах, есть люди, которые попали под раздачу с блокировкой аккаунтов, и есть люди, которых Хиггс очень устраивает по соотношению цена-лимиты.

Поэтому вопрос в том, как дальше будет себя вести Хиггс, чтобы не потерять вторых и вернуть первых.

@cgevent

🔥28😁11😱7❤3

5.37K viewsSergey Tsyptsyn ️️, 12:02

Метаверсище и ИИще

Forwarded from Ai molodca (Dobrokotov)

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

Новый видео-батя (по отзывам) Seedance 2.0 потихоньку начинает появляться в глобальной сети интернет. Бесплатно здесь.

Протестировал базовый text-to-video (больше пока не дают) на русский язык. Часть слов сжирает, но в целом —VEO может напрячься. Понравилось, что можно посекундно выбирать длительность (от 4 до 14 секунд), а еще функция Smart Lenght, которая сама подбирает длину в зависимости от промта.

Очень, конечно, хочется потестировать контекстные возможности, вот там должен быть жир. 😑

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥17😁8👎3❤2

4.15K viewsSergey Tsyptsyn ️️, 12:34

Немного подробностей про блокировку Хиггсфилда и использование чужого фильма в своей рекламе.

Мне только что написал автор фильма Jumper Михаил и подтвердил, что фильм покрали без разрешения и что да, его использовали в рекламе конкурса. Что сам пост уже потерли, но Михаил успел сделать копию (в шапке).

Я попросил Мишу рассказать немного о фильме (ибо фильм крутой):

"Так, если в двух словах, я придумал экшн историю и вместе с продакшеном Бюро Рабочее Название на собственные деньги мы решили снять экшн короткометражку. Я туда насовал кучу современных технологий и техник съемки — point cloud, 360 bullet time rig собственной разработки, роборука и т.д. Потом год шел постпродакшн, суммарно 1.5 года делали. Фильм неплохо так в зарубежном ютубе завирусился, больше ляма просмотров нативно собрал"

https://youtu.be/jWVoE09m3AU

Corridor Crew даже в выпуске у себя рассказали про прием bullet time, который Миша реализовал так, как еще никто не делал:
https://youtu.be/PhBNPWkylTs?t=509

P.S. Хиггсы написали Михаилу, извинились, назначили звонок. Посмотрим, что будет дальше.

@cgevent

👍51❤14🔥4👎3

5.1K viewsSergey Tsyptsyn ️️, edited 12:58

Метаверсище и ИИще

0:23

This media is not supported in your browser

VIEW IN TELEGRAM

Вы можете поверить, что это не реальное видео, а Гауссианы?

Выглядит очень круто, но теперь представьте, что это можно смотреть в VR. Из любой точки (ну почти).

Arcturus снимает и транслирует реальные спортивные события в формате объемного 3D-видео, обслуживая телекомпании, команды, лиги, спортивные объекты и агентства. И это очень богатая и емкая ниша.

Под капотом ИИ , computer vision и гауссианы (плотные облака цветных точек).

Их решения сделаны для 2D-трансляций и социальных сетей, интерактивных 3D-приложений на телефонах, планшетах и консолях, а также для полностью иммерсивных VR/AR-гарнитур.

Вот такой метаверс нам нужен!

Подробнее на:
https://arcturus-sports.com/

@cgevent

😱34🔥18❤14👍2😁1

5.25K viewsSergey Tsyptsyn ️️, 14:26

Нейропрожарка

Автор: Александр Удалов - режиссёр/креатор
tg: BLVCKNDWHITE
inst: snegovique

Моя первая работа с применением ИИ называется Electrum.

Срок создания примерно месяц с учётом других задач и периодической невозможностью получить нужный результат после множества попыток.

Бэкграунд таков - где-то в 2019-2020 году в голове возник образ людей в золотых блестящих одеждах в жаркой-прежаркой пустыне со слепящим солнцем. Там же была чёрная взлётно-посадочная полоса и образ турбин самолёта.
В то время речи о нейронках не было, поэтому идея лежала в столе с пометкой "сделаю, когда стану ну очень востребованным режиссёром с доступом к бюджетам, лучшим командам или, на худой конец, сделаю в 3D, когда освою его на должном уровне". И даже тогда я понимал, что эта идея в первую очередь про исследование визуальной эстетики. Мне нужно было поиграться в эту эстетику.
Теперь же, с выходом нейронок на должный уровень, реализовать такой эксперимент стало очень и очень доступно. Однако, долгое время я сознательно избегал нейронки – мне дико не нравилась эстетика и пластика генеративного изображения (до сих пор не всё нравится), и качество результата оставляло желать лучшего. Поскольку созданием видео занимаюсь давно, понимал, что при необходимости смогу быстро освоить новый инструмент. Теперь, когда нейронки доросли, а весь продакшн переезжает на ИИ-рельсы – пора. В итоге, моя задача свелась к тому, чтобы опробовать инструмент, понять, через какие боли придётся проходить в процессе будущих генераций, и, наконец, вытащить из пыльного ящика ту идею про ослепительную пустыню и блеск металла.

Что же такое Electrum? Электрум - это природный сплав золота и серебра. Когда думал над костюмами, одним из референсов был Robot Couture от Thierry Mugler. А тот, в свою очередь, был вдохновлён образом персонажа из Метрополиса (1927). Парный монолог/диалог персонажей в финале – это напоминание себе про необходимость вырывать себя из рутины, не костенеть в одной картине мира, искать и искать.
На старте была идея сделать рекламный спек, но я отбросил её, т.к. уже снимал такие спеки в «реальном мире», и хотел сделать своё, экспериментировать. Спеки никуда не денутся. Миру, в общем-то, не нужно больше рекламы.

Инструменты
В качестве «песочницы» для первого проекта выбрал Higgsfield в виду наличия у них выгодного на момент начала работы тарифа.
Создание ключевых кадров:
• Nano Banana Pro (unlimited)
• Flux 2 Pro (unlimited)
• Kling (unlimited)
Анимация – в семействе Kling – 2.6 и O1.
Липсинк – Kling 2.6.
Музыка – Suno.
SFX – из бесплатных библиотек.
Другие нейронки в Higgsfield пробовал, но они давали совсем пластмассовое изображение. Midjourney не трогал.
Было много ручной доработки и компоуза в Ае (можно и в Ps, но мне привычнее Ае). Veo не трогал из-за дороговизны.
Многие топят за Nano Banana, но на своей практике вижу, что Flux 2 Pro чаще попадает в фотореализм, однако может рождать уродцев или давать артефакты на небе или одежде в виде повторяющегося крупного шумового паттерна. Эти артефакты можно убрать Бананом, почти не потеряв в фотореализме. Т.о. создание ряда ключевых кадров – это итеративное допиливание одного и того же изображения Флаксом и Бананом.
К вопросу о доступности – создание этого ролика обошлось примерно в 4 830 руб. с учётом того, что Nano Banana Pro и Flux 2 у меня безлимитные. Если бы этой опции не было, думаю, стоимость была бы в 1,5-2,5 раза больше.

@cgevent

👎33👍31🔥11❤5

3.52K viewsSergey Tsyptsyn ️️, 16:03

Метаверсище и ИИще

Большая часть полезного контента сейчас - это аудио и видео.

Подкасты, вебинары, записи созвонов, интервью на YouTube.

Проблема в том что работать с этим неудобно. Найти нужный момент, вытащить главное, задать вопросы по содержанию, сначала надо это всё расшифровать в текст.

ChatGPT и Claude расшифровывать не умеют. Gemini может, но на длинных записях контекста не хватает и качество так себе.

Можно использовать Whisper AI - прямо в тг, и всегда под рукой.

Видео, аудио, голосовые, ссылки из соцсетей - обработает всё.

Что по возможностям:
⁃ Получаешь текст с таймкодами, со спикерами и саммари
⁃ Принимает большие видео до 6+ часов за файл
⁃ Работает cсылками: YouTube, VK, Instagram, Google drive, RuTube и др.
⁃ Отдаёт расшифровку в: Google Docs, Word, PDF, TXT, Markdown

Дальше с текстом уже можно нормально работать - закинуть в NotebookLM, прогнать через GPT для фактчекинга и тд.

Попробуйте, экономит кучу времени: WhisperAI

#промо

👎5👍2

889 viewsSergey Tsyptsyn ️️, 07:02

About

Blog

Apps

Platform