VAI – Telegram

Решил немного подвести итоги года.

🧐

Пост разделил на две части.

Я считаю,что это был переломный год, в котором даже самые закостенелые скептики убедились:ИИ- не пустышка, а реально работающий инструмент, который может очень сильно ускорять процессы и помогать в работе.Кто-то полюбил его сразу, у кого-то до сих пор отторжение, но и тем, и другим теперь придется идти с ним бок о бок,так как это новые реалии.

Человеческий мозг быстро привыкает ко всему, особенно если это что-то хорошее.Поэтому вкратце пробежимся по тому,что именно поменялось за год.

🟥

ГЕНЕРАТОРЫ ИЗОБРАЖЕНИЙ

Еще год назад для создания изображения приходилось сильно заморачиваться с промтом: писать кучу технических терминов, выстраивать сложную структуру, обучать LoRA. Работа с текстом была просто никакой - надеюсь, многие еще помнят те «эльфийские кракозябры».Руки плыли, детали скакали, нормальных редакторов внутри моделей не было (только inpaint и outpaint).В общем, чтобы получить достойную картинку, нужно было очень и очень постараться.

К концу года практически всё перечисленное перестало быть проблемой.Теперь мы можем редактировать изображения любой сложности по одной строчке текста, генерировать конкретного человека или объект, имея всего один референс.Стало возможным создавать дизайн с текстом, карточками, обложками, копировать любой стиль и делать бесконечные вариации.Перечислять можно долго.Это действительно огромный и крутой скачок. 💪

🟥

ГЕНЕРАТОРЫ 3D

Это направление по-настоящему стартовало именно в этом году.Еще в начале у нас были лишь пара-тройку сервисов, которые при генерации слишком упрощали детали и заметно искажали формы.Вообще, 3D - сфера во многом техническая: помимо генерации самой модели здесь куча нюансов вроде сетки, развертки, запекания текстур и т.д.В начале года всего этого просто не было, мы могли получить разве что несложную модель, годную максимум как «болванка» для доработки.

Но за год произошел серьезный сдвиг, и некоторые сервисы уже выдают модели очень приемлемого для работы качества.Также появились ИИ-инструменты,которые делают и развертку,и ретопологию.Единственный минус сейчас - это всё пока отдельные и разрозненные решения, но они реально работают.Я уже писал, что в следующем году мы 100% получим работающие сервисы с полным пайплайном.
Даже в текущих условиях мы в студии практически полностью собрали прототип игры, сократив время разработки в разы.Это уже огромный прорыв и показатель. 🔥

🟥

ГЕНЕРАТОРЫ ВИДЕО

Если в картинках мы еще год назад чувствовали хоть какую-то твердую почву, то видео в начале года напоминало лотерею.Мы получали короткие ролики по 3-4 секунды, где всё плыло, объекты превращались друг в друга (тот самый бесконечный морфинг),а сохранить лицо персонажа было вообще чем-то из области фантастики.Это годилось максимум для мемов, использовать это в реальном продакшене было практически невозможно.

Сейчас же мы видим, пожалуй, самый стремительный рост именно здесь.Появилась та самая стабильность: персонаж теперь узнаваем в разных кадрах, физика стала адекватной, а длительность генерации выросла в разы без потери качества.Теперь мы не просто пишем промт и надеемся на чудо,а реально управляем камерой, движением и сценой.Из забавной игрушки генераторы видео превратились в мощный инструмент для моушн-дизайна, рекламы и создания полноценных видео роликов. 😎

🟥

ГЕНЕРАТОРЫ МУЗЫКИ И ЗВУКОВ

Еще год назад это направление воспринималось скорее как забавный аттракцион.Сгенерированные треки звучали плоско, с характерным «металлическим» скрежетом, а вокал отдавал явной синтетикой.Структура песен разваливалась на ходу.О том, чтобы использовать такой материал в реальном проекте или игре, даже речи не шло.

Теперь отличить генерацию от реального студийного трека стало сложно даже на слух.Мы получили полноценную музыку с внятной структурой, чистым вокалом и любым настроением.Нужен уникальный эмбиент, звуки интерфейса или фоновый трек? Не нужно часами рыться на стоках - пара кликов, и у тебя есть готовый ассет,который идеально ложится в атмосферу. 🙌

P.S.Аудио версия в комментариях. 🎧

@VAI_ART
#VAI_Notes

Please open Telegram to view this post