Метаверсище и ИИще
47K subscribers
5.97K photos
4.41K videos
45 files
6.86K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Media is too big
VIEW IN TELEGRAM
Нейророжарка

У дядюшки Томпсона. Неофициально видео. Аквариум.

Автор: Сергей Макаров

Этот клип делался примерно год. Началось всё с того, что я экспериментировал с моделью Flux в Forge локально у себя на компе с картой 3090. Пробовал интересные промпты, подсмотренные на Civitai, изменял их, накручивал, и нагенерил за осень огромное количество разных картинок.

Потом весной, когда появилась первая модель Minimax, я стал экспериментировать с анимацией картинок из своего архива, выполнил несколько коммерческих заказов, и по ходу мне пришла в голову идея сделать таким способом клип на одну из старых песен Аквариума. Дело в том, что на песни Pink Floyd в мире наперегонки делают AI видео все, кому не лень, а Аквариум у меня на втором месте).
      И вот одна серия картинок у меня в голове сложилась с песней «У дядюшки Томпсона». В песне мало слов и поэтому сначала я подумал, что достаточно будет нагенерить видео смешных персонажей, танцующих и играющих на музыкальных инструментах. За май и июнь я нагенерил довольно много таких шотов, но руки никак не доходили до монтажа.

Летом несколько раз приступал к отсмотру и обдумыванию материала. Переслушал песню и понял, что после второго куплета там полторы минуты идёт разный кавардак со всякими наложенными звуками, на который танцы уже не ложатся. Есть такой сайт Михаила Кожаева, на котором автор сайта разбирает разные песни Аквариума на предмет осмысления, что же БГ имел в виду. По «Дядюшке» оказалось целых два поста, которые натолкнули меня на новые идеи.

       Следующий скачок был с появлением сначала Flux.Kontext, а потом QwenEdit, из-за чего стало возможным попробовать догенерить консистентных персонажей, с которыми можно уже попробовать создать историю. Пения в кадре я сначала не планировал, потому что LivePortrait уже стал смотреться устаревшим из-за нехватки динамики.

Но вот в августе появились одна за другой модели для липсинка на базе Wan. И я стал генерить ещё и пение. Я далеко не каждую неделю даже вспоминал про этот проект, есть много других дел. В ноябре наконец решил, что пора заканчивать, и стал помаленьку монтировать, придумывая на ходу новых персонажей, потому что история начала вытягивать сама себя. И вот когда я половину уже смонтировал, в конце декабря на меня свалился нежданный подарок – на сайте Hailuo у меня годовая подписка standart, и я обнаружил, что могу бесплатно безлимитно пользоваться Нанабананой до 31 декабря. И в тот же день обнаружил что на сайте Wan можно генерить новыми моделями 2.5 и 2.6 за кредиты, которые подкидывают каждый день. Нанобанана взорвала мой мозг, а новые модели wan показали такой прирост качества по сравнению c wan2.2 и Hailluo, что я неожиданно для себя взял и перегенерил заново примерно три четверти пошедшего в монтаж материала, причем за какие-то 2-3 дня.


    Таким образом оценить, сколько времени у меня ушло в итоге на всю работу, невозможно.


    По технологии получается так:
генерация исходных картинок – Flux 1 в Forge, QwenEdit, Nanobanana.    
Генерация видео – Hailuo 2.0 (мало что осталось), wan2.2 (мало что осталось), wan2.5. Самое сложное оказалось - заставить мышь вращать рукоятку шарманки. Это очень хотелось поставить в начале, под соответствующие звуки, шарманку или musicbox. Что только я не пробовал, не получалось.  Единственная модель справилась более-менее - Veo3, который доступен на сайте Hailuo. И это единственный шот от Veo3, потому что для хобби-клипмейкерства он дороговат, на мой взгляд.)
Пение – HuMo, InfiniteTalk (локально), wan2.5
Монтаж - Adobe Premiere.  Затраты на этот клип – свободное время, электричество потраченное компьютером. Но их можно считать потраченными и на освоение разных инструментов генерации, поэтому скорее не затраты, а сплошная польза).

@cgevent
👎52👍218🔥4😱2
This media is not supported in your browser
VIEW IN TELEGRAM
Это вам за то, что не молитесь.

Кстати, этот таракан - не рендер, а вполне себе видео нового робата Miro U, которого планируют поставить на заводы, заменять жалких двуруких кожаных.

Ног у него нет, есть платформа на колесах, так что убежать от него можно по лестнице или сугробам.

@cgevent
😁84😱10🙏84👍4🔥3👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Что-то я проспал, но в Grok Imagine теперь можно редактировать картинки...

@cgevent
👍48🔥12👎42
This media is not supported in your browser
VIEW IN TELEGRAM
Слоператорам нейропрожарок есть на что равняться.

В штатах рождество, второй день без убойных новостей, можно передохнуть и запостить пару AI кроссоверов.

@cgevent
57👍28🔥24😁22👎3
Media is too big
VIEW IN TELEGRAM
В новый Qwen-Image-2511 встроили все самые популярные Лоры от 2509.
Нет нужды искать и ставить Multiple Angles или Relighting.

И, кстати, поддержку 2511 завезли в Комфи.

@cgevent
🔥40👍6👎21😁1
Media is too big
VIEW IN TELEGRAM
Нейропрожарка

Неожиданная концовка....

Автор: Игорь Фридман (@igrikum)

Behance (портфолио)
Linkedin (CV и отзывы)

🛠 Задача: Тестовое для американской AI-студии.
Вводные: Сценарий «Три поросенка», 4 персонажа, 3-4 локации (получилось больше).
Суть: Стиль предложили выбрать самостоятельно, главное — consistency. Персонажи и локации должны читаться с разных ракурсов. Задача не просто «нагенерить красиво», а сделать монтажную историю и продемонстрировать навыки на всех этапах полного производства: от генерации стилов до финального монтажа, включая цветкор и саунд-дизайн.

⏱️ Срок: 5 дней по 8-10 часов.
💸 Бюджет: ~$110.

$30 — Higgsfield Ultimate (кредиты улетели сразу).

$80 — Higgsfield Creator (максимальная подписка, купил, когда кончились лимиты на первом акке).

💡 Пайплайн и боль:

1. Генерация (Nano Banana Pro):
Для консистентности стилизованных персов Banana — топ. Сделал Character sheets (Front/Side/Rear) для каждого поросенка и волка.

2. Видео (Kling 2.6/o1):
Основная работа тут.
Главный затык: Физика разрушений. Заставить волка реалистично дуть, чтобы дом разлетался по физике, а не превращался в кашу. Kling упорно не хотел выдавать нужную динамику разрушения, убил на это кучу попыток. Но как же здорово, что на Higgsfield на нее безлимит :)

3. Пост и фиксы (Photoshop + Premiere Pro Beta):
В Banana каждый лишний прогон убивает качество картинки (картинка теряет сочность и становится мыльной). Поэтому не перегенерировал, а правил руками в Photoshop — быстрее собрать кадр по слоям, чем ждать чуда от банана.
Монтаж: Premiere Pro Beta. Функция Generative Fill (Autofill) на статике — спасение. Если надо добавить что-то или убрать косяк на статичном шоте, делает это идеально, сильно упрощает жизнь.

4. Звук:

Voice Over + SFX: ElevenLabs

Музыка: Suno и стоки.

📝 Итог:
В коммерции одной кнопкой "Шедевр" не отделаешься. Приходится собирать франкенштейна из 3-4 нейронок и допиливать руками в Фотошопе, чтобы не поплыло качество. Но в целом, по-моему, очень даже смотрибельно.
Спасибо, если дочитали до конца.

@cgevent
🔥122👍7817👎12😁4
Google запускает новую функцию, позволяющую изменить имя пользователя на Gmail.com без потери учетной записи. Грубо говоря поменять свою почту в домене gmail.com

Переходите в «Аккаунт Google» > «Личная информация» > «Электронная почта». Если функция доступна, выберите новое имя почты.

Старый адрес станет псевдонимом/alias: письма будут по-прежнему поступать в тот же почтовый ящик, и вы сможете входить в аккаунт с помощью любого из них в сервисах Google.

Все данные (письма, файлы, фотографии) останутся неизменными.

Ограничения: можно сделать всего 3 изменения, интервал между изменениями — 12 месяцев. Внедрение функции происходит постепенно, поэтому она может быть еще недоступна.

@cgevent
140👍19🔥6😱3
Квази 3д генерация

Тут конечно нет никакого 3д, просто хороший промпт для 3д стилизации. Начинающие моделлеры могут использовать его как подсказку по топологии лица в лоу поли.

Поскольку над Европой пронеслось рождество, а генерить Илона Маска Банана отказалась, пришлось сгенерить Иисуса Христа.
В Банане и в chatGPT.

Держите промпт:

A hyper-detailed geometric papercraft sculpture of [NAME], created using layered colored cardstock with precise angular folds and clean cut edges. Facial features are stylized using polygonal planes, with subtle shading formed naturally by paper layering. Hair, beard, and clothing are constructed from stacked strips and folded shapes for depth and realism. The figure is displayed against a clean neutral background with soft diffused lighting, highlighting the craftsmanship and texture. Sharp macro focus, studio photography aesthetic, 1024×1024

@cgevent
23👍9🔥3
Нанабанана жжот.

Сгенерила мне, значит, Иисуса Христа (см предыдущий пост).
Я такой умный и говорю: a удали вотермарку справа внизу.

-Апажалста!

И выдает вот такое...

Тут пришло время сильно подумать над истинным значением фразы "удалить вотермарку"

P. S. Да, конечно, где-то вначале чата я просил ея сгенерить Маска, но она люто отказала. Но осадочек, видать, остался.. под вотермаркой.
Борода зачётная....

@cgevent
5😁978🔥4👍1👎1😱1
Не знаю, насколько это вам пригодится, но это идеальный способ подглядывать что творится в соседней комнате. Буквально глядя сквозь стены.

Первые работы в этом направлении появились ещё пару лет назад: по искажению вайфай сигнала можно оценивать позы людей в соседней комнате.

А летом эти работы довели до:
Реалтайма
Продакшн ready

Вот держите репозиторий:
https://github.com/ruvnet/wifi-densepose/

Никакого доп оборудования не требуется, только пара вайфай роутеров.

Ну и это как бы вайфай мокап, который дополнительно видит сквозь стены.

@cgevent
🔥48😱4511👍5👎5
Media is too big
VIEW IN TELEGRAM
Пока нет убойных новостей буду постить образцы для подражания для нейропрожарщиков.

Тут соль не только в дипфейках. Тут всё: музыка, монтаж, липсинк, склейки, эмоции.

Зловещая долина, говорили они...

Шо? Это что-то из 3д?

Нейрорендер как-то проскочил незаметно эту долину. Поглядите на улыбку Уолтера Вайта в конце.

А я вот все жду, когда кто-то возьмёт песню Майка Науменко и Зоопарка "уездный город N" и сделает клип. Там текст песни - готовый сценарий.

@cgevent
🔥64👍97👎2
3D-генератор Hitem3D обновился до второй версии.

1536³ Pro-resolution
PBR texture generation
Есть портретный режим(для лиц)
Генерит очень мелкие детали, уже не только для 3д-печати, но и для лазерной резки.

Я помню, в канале были хорошие отзывы про него.

https://www.hitem3d.ai/3dmodeling/home

@cgevent
🔥257👍4👎1😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Три новые видео-модели, «Sisyphus», «Ember-Bloom» и «Capra», засветились на Artificial Analysis Video Arena.

Capra, по-видимому, ограничена 5 секундами, в то время как две другие модели генерят 8 секунд.

Звука на Арене никогда нет, не удивляйтесь

Ходят слухи, что Капра - это Veo4. Но это неточно.

@cgevent
🔥114
Media is too big
VIEW IN TELEGRAM
Нейропрожарка

Автор: Антон Зимин

Трейлер короткометражного фильма «Not A Toy» — «Не игрушка», полностью созданного в нейронке.
Совместное производство моего AI-бутика AiZ и продакшна Lion Films. Автор сценария и режиссёр — Антон Зимин.

Делали вчетвером. До этого я всегда все генерил сам, но тут получил интересный опыт и нашел крутую команду. Мы сделали его за шесть недель. Изначально фильм создавался для участия в фестивале 1 Billion Summit AI Awards, в рамках которого предъявлялись строгие требования к использованию AI-инструментов экосистемы Google. В шорт мы не вошли. Ну что ж, бывает.
Мне не понравилось только то, что за всё время судейства фильм, судя по статистике YouTube, ни разу не был просмотрен до конца. Да и ладно. Главное — мы получили удовольствие от процесса, и результат мне нравится. Конечно, если бы не фестивальные ограничения Google, можно было бы сделать и качественнее. Но самое классное ощущение, когда из нечего вдруг сотворилась реальная история с сюжетом, драмой и аркой героя.
Заменит ли нейросеть на 100% реальное видеопроизводство - не знаю. Но уже сейчас она даёт возможность творческим людям реализовывать свои идеи и не зависеть от бюджетов и игнора крупных студий.

Премьера полной версии будет на канале уже в новом году. Просто хочу, чтобы у вас было время спокойно посмотреть наш 10 минут нашего фильма.

А пока мне очень интересно, что вы думаете: заменит ли нейронка съёмки или нет?

@cgevent
🔥55👎26👍136😁2🙏1
Надо сказать, что Нанабанана сильно поумнее, чем GPT-Image-1.5

Попросил обеих сгенерить ленту Мёбиуса, бутылку Клейна, сапог Шварца.

chatGPT тупо попытался сделать красиво, типа "я что-то видел такое, но ничего более сказать не могу", особенно про сапог. Синий фон.

Умная Банана вспомнила про неориентируемые поверхности с одной стороной, а сапог ещё и подписала. Бутылку Клейна сделала вообще в стекле, где отлично видна ее топология.

В общем язабанану!

@cgevent
1👍111🔥3322👎5😁2😱1