Сергей Булаев AI 🤖

Google анонсировал Veo 2 - новую модель генерации видео. Хвалятся улучшенным пониманием законов физики и естественного движения. Модель особенно хорошо справляется с текстурами материалов, отражениями света и плавностью движений.

Veo 2 поддерживает разрешение 4K и продолжительность видео до нескольких минут (но базовый размер ролика 8 секунд). Красивая работа со светом - от жёсткого флуоресцентного освещения лаборатории до мягкого утреннего света на пасеке. Можно точно настраивать параметры съёмки: указывать фокусное расстояние объектива, глубину резкости, стиль движения камеры.

В X большинство тестируюших считают, что по качеству она превосходит Sora (но есть и противоположные мнения), особvенно отмечают меньшее количество артефактов и более реалистичную физику движений.

Пока доступ только через вейтлист VideoFX в Google Labs (только США). В следующем году обещают интеграцию с YouTube Shorts. Все видео автоматически помечаются невидимым водяным знаком SynthID.

Набрал интересных примеров из твиттера. Мне очень нравится. Записался в вейтлист через VPN.

Сергей Булаев AI 🤖 - об AI и не только

14102

2.17K views02:10

Сергей Булаев AI 🤖

Так же жителям Штатов (или тем у кого есть возможность использовать штатовский IP адрес) бесплатно доступна Imagen 3 - новая версия модели Google для генерации изображений. Опробовал сам, модель отлично справляется с разными задачами: от фотореалистичных пейзажей до богато текстурированных масляных картин и сцен в стиле пластилиновой анимации.

Впечатляет работа с деталями - модель точно передаёт мелкие морщинки на руках, сложные текстуры вроде вязаного игрушечного слона, тонкие особенности освещения и композиции. Она лучше понимает естественный язык и специфические термины - например, можно указать конкретный тип объектива или особенности композиции.

Заявлена улучшенная работа с текстами (но с кириллицей ничего хорошего не выходит, см. мой пример)

По человеческим субъективным бенчмаркам Imagen 3 получила самые высокие оценки среди всех существующих моделей как за визуальное качество, так и за точность следования промптам.

Модель прошла обширное тестирование на предвзятость и потенциально вредный контент. Все изображения автоматически помечаются водяным знаком SynthID.

Сергей Булаев AI 🤖 - об AI и не только

1852

2.21K views04:50

Сергей Булаев AI 🤖

0:51

This media is not supported in your browser

VIEW IN TELEGRAM

Но больше всего понравился Whisk. Это новый инструмент от Google Labs для генерации изображений, где вместо длинных текстовых промптов можно просто использовать три картинки: одну для субъекта, вторую для сцены, третью для стиля.

А Gemini автоматически создаёт описания загруженных изображений и передаёт их в Imagen 3. Модель извлекает только ключевые характеристики, что позволяет создавать креативные и неожиданные комбинации. Также в любой момент можно подправить автоматически сгенерированные промпты. Получается некий визуальный brainstorming с мгновенной обратной связью.

Сергей Булаев AI 🤖 - об AI и не только

2282

2.05K views05:20

Сергей Булаев AI 🤖

В Midjourney появились Moodboards, и это выглядит как подарок для тех, кто любит мыслить визуально. Если раньше вы собирали рефы в Pinterest, теперь это можно сделать напрямую в Midjourney. Загружаете до 100 изображений, создаёте свой "профиль стиля" и получаете на выходе генерации, передающие атмосферу борда. Типа фиксируем творческий якорь и реализуем идеи вокруг него.

Moodboards — это не просто про стабильность стиля, они решают кучу других задач. Помогают визуализировать абстрактные идеи: все те размытые "что-то между винтажем и минимализмом" превращаются в конкретные цвета, формы и текстуры. Наглядно показывают направление работы — особенно полезно в команде, когда нужно, чтобы все смотрели в одну сторону. Ну и избегать креативного выгорания с ними попроще — референсы всегда под рукой, а Midjourney вдохновляется тем, что вы сами считаете важным.

Немного напоминает родительские времена, когда маркетологи собирали огромные коллажи с отрывками фотографий, фрагментами текста и ключевыми цветами для брендинга или дизайна. Разница в том, что теперь всё происходит онллайн и быстрее в разы.

Результатов в твиттере - масса. Одни создают стабильные стили для иллюстраций или аниме, другие жалуются, что "comic book" пока сыроват и требует доработки. Самое интересное — можно поддерживать несколько профилей для разных проектов и переключаться между ними. Чтобы "настроить" модель, нужно всего 40 оценок вместо тысяч. Быстро и удобно.

Moodboards и style references (--sref) — это не одно и то же. Если sref даёт больше свободы и вариативности, то тут всё про стабильность и простоту. Работает даже на Niji, что особенно полезно для тех, кто рисует мангу или аниме-стилистику. В итоге это больше похоже на тюнинг модели под себя лично, а не классический, универсальный промпт.

Делиться Moodboard-профилями в Midjourney нельзя. Профиль создаётся под ваш аккаунт и сохраняется только для личного использования. Возможно, в будущем добавят возможность обмениваться профилями или даже публиковать их, как это было со стилевыми настройками и "style references".

Сам ещё не дошёл до тестов, но вижу здесь крутые возможности. Это явно инструмент, который ускоряет и упрощает творческий процесс. Можно буквально показывать Midjourney, что у вас в голове, — и, судя по отзывам, он слушает внимательнее, чем когда-либо.

Сергей Булаев AI 🤖 - об AI и не только

2152

2.29K views05:57

About

Blog

Apps

Platform