Метаверсище и ИИще
48.5K subscribers
6.08K photos
4.58K videos
47 files
7K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Media is too big
VIEW IN TELEGRAM
Олимпийские ИИгры.

Тут в твитторе разгорается скандал из-за клипа с открытия Олимпийских игр.

Одни говорят, как круто, что ИИ зашел в постпродакшен.
Вторые проклинают и клип, и ИИ, ругают анимацию, неконсистентность персонажа, ну и вообще все у них плохо.

А вам как?

Если найдете полную версию, заменю экранку на HDRip (Спасибо Брайану, заменил).

@cgevent
👎97👍13🔥6😁32😱1
Промонтаж и немного Сидэнского 2.0

Обещают, что выйдет завтра.
Караулим тут:
https://dreamina.capcut.com/

А я пока принес вам пример со сторибордом.

Поглядите видео, где Сидэнсу кормится полный сториборд в виде файла-таблички с типами ракурсов, описанием кадра, звуковыми эффектами, а потом просто "посмотри в сториборд и сделай 12 секунд видео".

Клинг заморачивается с интерфейсом на сайте для мультиракурсных сцен, а тут просто табличка. Интересно будет ли гайд по сторибордингу от Сидэнса

И обратите внимание, как помимо качества, длительности и нативного звука, видеогенераторы стали уделять внимание, скажем так, монтажу внутри клипа и подтянули понятие "сториборд".

Нюанс в том, что на посте монтаж идет после съемки. Так что монтировать видео после генерации все же придется. Ручками. Пока.

Иначе, как в большинстве нейропрожарок, затянуто и медленно.

@cgevent
🔥382👍2😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Немного Сидэнского 2.0 2

Ну и обратите внимание на использование референсов, как видео референса, так и картиночных..

Выглядит хорошо.

Похоже вся неделя будет наполнена сравнениями Клингонского и Сидэнского

@cgevent
🔥57👍17😁42
Неожиданное применение для искусственного интеллекта.

На Яндекс Маркете появилась новая функция: отдельная рекомендательная лента, которая собирается с помощью ИИ под конкретный запрос.

Работает просто: я описываю запрос так же, как обычно описываю промпт нейронке - контекст, детали, ограничения. На выходе получается отдельный фид товаров, не связанный с моей обычной рекомендательной лентой.

За саму выдачу товаров отвечает Маркет AI. Это ИИшка, встроенная в Яндекс Маркет, которая помогает искать, подбирать, сравнивать товары. ИИ-агент встроен в приложении вообще везде, где только можно, в том числе в формате чата. Ранее в таком чате он выдавал несколько товаров по запросу. Теперь же его возможности расширили, превратив несколько товаров в целую рекомендательную ленту.

И вот это, пожалуй, главное: основная лента не засоряется рандомными вещами, потому что новая подборка живёт своей отдельной жизнью. В случае ненадобности я просто удаляю эту подборку. При желании я могу сузить поиск до отдельной категории/тематики, или наоборот расширить. Одновременно таких лент я могу создать до 10 штук.

Потестил разные запросы, в целом выдаёт релевантные товары в ленте. Свой запрос могу поправить, добавить уточнения, чтобы скорректировать подборку. Если закрыть ленту и открыть снова - то она обновится и будут отображаться новые товары, прямо как в обычной рекомендательной ленте.

Такой механики я раньше нигде не встречал.
Получилась маленькая, но прикольная фича, которая решает конкретную боль и не перегружает интерфейс. Работает пока в бета-режиме, находится на главном экране приложения

@cgevent
👎52👍24🔥86
Еще раз про ИИ-режиссуру, сториборды, восьмерки и мультиракурсы.

Тут Мигель прислал мне пару тестов Kling 3.0.
И снова Клинг отлично справляется с линией взгляда и диалогами, с нуля делает мультиплановые сцены, и я полностью согласен с Мигелем: чтобы делать короткий ролик вам больше не нужно знать ничего про ИИ. Если вы способны написать короткую историю со смыслом - остальное сделает 'умная' модель с режиссером на борту.

Доверну лишь следующую мысль, "написать короткую историю со смыслом" вам не обязательно самому, вы всегда можете призвать ИИ в соавторы.

Промпты к этим видосам можно забрать тут и тут.

И я предполагаю, что в 2026 году наши дискуссии тут трансформируются от "пальцы не те, губы шакалит, много мыла и пр" в "хороший\плохой монтаж, понимание сториборда, оценки режиссуры".

И круг замкнется (наконец) - снова придется вернуться к пониманию монтажа, искусству сторителлинга, сценарному навыку. Для многих это будет неприятным сюрпризом - мы то думали, что щас качество и длину подтянут в генераторах - и заживем.

Нюанс также в том, что сторителлинг тоже меняется, равно как и монтаж. Придется меняться и подстраиваться на ходу.

Но хорошая новость в том, что порог входа во все это безобразие стал крайне демократичным, так что все это доступно теперь для всех, было бы электричество под столом(в облаке).

@cgevent
👍43🔥217😁4👎2😱2
Media is too big
VIEW IN TELEGRAM
Нейропрожарка

"Последняя капля" - псевдосоциальный ролик про весь ужас старения и потери былого величия.

Над проектом работали:

Автор: Алексей Лотков

ИИ-артисты:
Елизавета Ершова
Алексей Оленченко
Кирилл Родионов
Демид Гурьянов

Хотелось не просто мемный ролик сделать, а заложить какой-то смысл и заставить чуствовать сострадание настоящему монстру.

Юмор здесь работает вместе с меланхолией и ближе к концу история становится все серьезнее, а сам персонаж - больше похожим на обычного пожилого мужчину, нежели какого-то монстра.
Финальным аккордом становится кадр, где дракула ложится в гроб - это эдакий параллелизм с концом жизни, но для дракулы это лишь очередной ежедневный ритуал.

Кажется, что с каждым очередным просмотром, юмор угасает, и история начинает приобретать все более мрачные оттенки.

Итак, перейдем к тех инсайтам, т.к. их тут набралось немало;

Голоса были сделаны достаточно нестандартным путем - мы делали кастинг персонажей в сора 2 и мне очень понравился голос мужчины на одной из генераций (англ с румынским акцентом). Мы сделали с ним камео и сгенерировали все реплики по скрипту. И тут встала сложность - мне не нравился сам каст, но понравился голос, а средства соры 2 подразумевают только комплект из того и другого:)

Была аудио-дорожка и нужный каст вместе со всеми стиллами. При этом еще и нужен был не топорный отыгрыш - Multitalk/infinitetalk тут не подошли именно из-за этого. Я записал себя в качестве мокап-актера, открывая рот под сгенерированные реплики и прогнал это все через клинг motion control - результат видно на видео, впринципе все удалось. Также был приятно удивлен тем, как он работает со взаимодействием объектов, которые персонаж держит в руках - например листок бумаги, или сигарета.

Все шоты со сносом и парламентом были сделаны в сора 2 - она вообще тащит, что касается реализма. Если б был еще хоть какой-то контроль, то была бы самая крутая модель на рынке. Но, как видите, применение ей все-таки можно найти.

По затратам:
Про Подписка на сору ($200) - можно было бы все на бесплатных акках сделать, это не обязательная трата
Хиггсфилд Ultimate ($89)
Elevenlabs ($10)
Reve ($20)

Итого: $319 по затратам на подписки

@cgevent
13👍149🔥4140😁11👎5
Qwen Image 2.0

Спойлер: весов и код нет.

Взяли и слили две ветки разработки (generate и edit), а также многочисленные 2509, 2511, 2512, в одну монолитную модель.
См схему в шапке.

- дичайше крутое понимание промпт
- лютый рендеринг текста (целыми параграфами)
- нереальная способность генерить целые слайды с крутой типографикой
- 2К
- мощное редактирование.

Тестируем тут:
https://chat.qwen.ai/?inputFeature=t2i

А подробное описание процесса слияния моделей в одну и галерея картинок тут:
https://qwen.ai/blog?id=qwen-image-2.0

Что с весами пока непонятно...

@cgevent
🔥358👎1😁1
Qwen Image 2.0

Лошадка знает толк в промптах.

@cgevent
1😁21👍10🔥71👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Вы извините, но я снова за Сидэнского.

Если это реально генерация в Seedance 2.0 (источник китайский, проверить не смог, но поверил), то очень неспокойно за motion designer-ов и вот эти вот все продуктовые демо.

@cgevent
👍40🔥296😱4