VAI
2.57K subscribers
424 photos
67 videos
4 files
119 links
15 лет в компьютерной графике, 6 лет — арт-директор.
Работал над десятками проектов.
Изучаю ИИ для развития и собираю здесь свой опыт, находки и эксперименты.
Присоединяйтесь!
Личный контакт - @AlexBakakin

AI l ИИ
Download Telegram
Начну серию практических постов.

Пока неясна периодичность, потому что пишу это не быстро, а свободное время постоянно стремится к нулю. Но точно до конца года выйдет что‑то ещё из этой серии.

Начну с концептов персонажей.

Есть много способов создать персонажа - как с нуля, так и на основе уже имеющихся референсов. Здесь, как и в обычном концепт‑арте, всё зависит от навыков.

Рассмотрим одни из самых простых способов.

Пока что, по моим наблюдениям, есть три способа получить результат:

1️⃣ Отталкиваться от промта. Самый абстрактный вариант, но даже так можно получить варианты, способные натолкнуть на интересные идеи. У меня много раз было так: просто описываешь, что хочешь получить, не имея чёткого видения, и итоговые генерации дают решения, которые помогают сформировать финальную концепцию.
2️⃣ Использование референсных изображений. ИИ без проблем подбирает нужный стиль. Можно добавить промт, чтобы подчеркнуть желаемую стилистику. Промт также создаётся через ИИ(можно закинуть референсное изображение и попросить вычленить стилистические особенности) и дорабатывается вручную.
3️⃣ Работа с наработками (например, скетчем). Можно отрисовать определённый дизайн или детали и дорабатывать их, двигаясь в нужную сторону.

⚡️В моём случае для прототипа я использовал два последних способа: брал свои наработки и референсные изображения, а затем на их основе делал концепт персонажа. Делал это через Sora - по‑моему, до сих пор это один из самых простых способов доработать нужную стилистику. Закинул референсы и примерно описал, что хочу получить.

Получив первый концепт, который уже более менее подходил я отправил его в языковую модель (у меня это был GPT). Затем забрал промт с характерным стилем, доработал его и закинув вместе с концептом получил серию изображений одного персонажа.

Доработал их вручную - это занимает не так много времени. Где-то немного поправил глаза, где-то уменьшил или увеличил объём персонажа. Иногда совмещал части одного персонажа с другим, иногда дорисовывал необходимые детали. Поскольку это этап концепта, делать всё вручную не сложно.

Всё довольно просто: понятно, что и концепты выходят достаточно простые, но суть та же и в более сложных задачах - просто появляется больше работы/итераций.

🍌 Дальше я использовал второй инструмент - Nano Banana. С его помощью я дорабатывал детали и доводил рендер до нужного качества.

У Nano Banana есть свои плюсы и минусы. После нескольких месяцев работы нашёл и сильные, и слабые стороны. Если интересно, могу написать отдельный пост, но вот-вот должна выйти вторая версия этого сервиса, поэтому накопленный опыт уже устареет. 🙂

В целом, все эти манипуляции заменяют огромный пласт ручной работы.

В данном случае важно было получить интересный образ персонажа с долей сумасшествия и щепоткой милоты, ведь для тела была заранее создана болванка, а его форма не играет принципиальной роли.

Кстати, и сам сумасшедший/милый образ, и болванка тела были продуманы по‑особому, но это уже нюансы нашей ниши - оффлайн VR со свободным перемещением. Если интересно, почему и для чего такое делается, могу рассказать об этом отдельно.

Обвесы, как пример, на последнем изображении, их планируется много.

Пишите, что интересно, а что нет - буду смотреть по вашим откликам.

Дальше пойдём по плану: поговорим о создании 3D по получившимся концептам. И дальше, уже разберём концепты и модели локаций.

Все концепты суммарно были сделаны за пару дней(это с ручными доработками, обвесами и тд.). В примерах процентов 40 из того, что было сделано.

Давайте обсудим! Что думаете? Может, у вас есть свои методы и пайплайны - будет интересно узнать что‑то новое.💪

P.S. Набросок черепахи с первого изображения был нарисован крутым художником и арт директором Олегом Юрковым.

ТГ
Арстанция

P.P.S. Аудиоверсия в комментариях.

@VAI_ART
#VAI_Practice
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍195🔥2🦄2
Ну что, Gemini 3 от Google вышла - по бенчмаркам новый король! В ближайшее время ждём Nano Banana 2, её тоже должны подвезти, ведь она на базе Gemini 3. Бесплатно, но с дневными ограничениями. Нужен VPN.

@VAI_ART
#VAI_News
👍41
Data Secrets
HuggingFace релизнули замечательную свежую книгу про обучение LLM 200+ страниц, 7 больших глав. Содержание примерно следующее: – Архитектуры, их особенности и оптимизация гиперпараметров – Работа с данными – Предобучение и какие в нем есть подводные камни…
SMOL_секреты_создания_LLM_мирового_класса_Перевод_t_me_aivkube.pdf
14.6 MB
Недавно делился книгой по обучению LLM от HuggingFace - теперь появился её перевод. Я по образованию программист, всегда интересно не только пользоваться, но и разбираться, как устроено всё “под капотом”. Времени хватает не всегда, но пусть будет под рукой - надеюсь доберусь почитать, ну а если кому-то тоже пригодится, отлично!

Перевел ее Сергей Долгов.

@VAI_ART
#VAI_News
5👍2🔥1
Media is too big
VIEW IN TELEGRAM
🟥🟥🟥 Все уже в курсе, но если кто‑то ещё не знает - вышла Nano Banana Pro.

🔹 объединяет до 14 референсов в одно изображение
🔹 поддерживает разрешение до 4K
🔹 ещё лучше переносит стили, контроль над результатом стал круче
🔹 улучшена работа с текстом, поддержка русского тоже есть


И это только малая часть возможностей Nano Banana Pro.

Во многих сервисах она уже доступна, в том числе здесь и здесь.

Пока сам не тестировал, но по доступным примерам видно - управлять и получать нужный результат стало еще проще.

Осталось только датчики к голове прикрутить, чтобы не писать промпты. 😁

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥21
🔹 Вышли Gemini 3 Pro и Nano Banana Pro. Коротко напишу. Кажется, наконец появился лидер среди ИИ‑инструментов. Как обычно бывает, многие отсеиваются, а остаются только крупные игроки. По моему мнению, этот тренд будет усиливаться, и остальные перейдут в режим догоняющих. По сути, Google выигрывает во многих сферах - будь то LLM, генерация изображений или видео (по видео OpenAI пока рядом или чуть впереди, но похоже, ненадолго) и тд.. Несмотря на новаторство, у OpenAI не вышло справиться с ростом: структура не выстроена, и даже при огромных бюджетах компания всё ещё похожа на стартап. А у Google, как у любого крупного игрока, есть стабильность, система и ресурсы. В общем, посмотрим дальше, но пока всё выглядит так.

🔹 Meta выпустила набор ИИ-инструментов:
● SAM 3 – новая версия Segment Anything Model. Позволяет выделять объекты на изображениях и видео по тексту, подсказке или примеру, очень быстро обрабатывает кадры, поддерживает отслеживание и точную сегментацию прямо во время просмотра видео.
● SAM 3D - расширение, способное строить и сигментировать 3D-модель объекта или человека по одной фотографии: восстанавливает форму, позу, геометрию. Есть две версии - для обычных предметов и для человеческих тел. Работает с фото, 3D-сканами и сценами, подходит для AR, игр и разработки.
Выглядит интересно.
Попробовать можно тут.
Презентация в комментариях.

🔹 OpenAI, чтобы хоть немного перетянуть одеяло выпустили на неделе сразу два обновления. Это коснулось:
GPT-5.1-Codex-Max. OpenAI представила новый Codex - теперь модель умеет работать в Windows и Powershell, появилась автономная работа агента прямо в терминале (можно настраивать права).
Codex может трудиться над задачами до 24+ часов без перерывов, используя механизм «компакции» - сжимает старую инфу и эффективно удерживает большой контекст, будто у неё есть краткосрочная и долгосрочная память.
По метрикам кодинга Codex показывает 77,9% точности - лучше, чем Gemini 3 и Claude Sonnet 4.5, и расходует на 30% меньше токенов при аналогичной сложности задач.
Групповые чаты. Возможность общаться сразу нескольким людям с ИИ‑ботом в одном чате. В таком чате участники видят все ответы друг друга и бота, могут обсуждать, задавать вопросы и получать совместные решения. Это удобно для командной работы, учебы, обсуждения идей или мозгового штурма с участием ИИ. Всё работает просто: добавляешь людей и пишешь вместе с ботом в одном окне.

🔹 Вышел Grok 4.1. В новой версии повысили эмоциональный интеллект и снизили количество галлюцинаций - теперь модель стала более чуткой, креативной и в три раза меньше придумывает лишнего. По тестам soft skills (EQ-Bench) и творческому письму - лучшие показатели, плюс уверенная победа на LMArena, обогнав Gemini 2.5 Pro на 31 балл.

🔹 Antigravity (и снова Google) - новая ИИ‑IDE (IDE - среда, где удобно писать, проверять и запускать код, всё собрано в одном окне) от Google, доступна бесплатно на Mac, Windows и Linux (50 запросов каждые 5 часов).
Главное отличие: режим Inbox - панель для асинхронного программирования и оркестрации агентов, где удобно ставить задачи и отслеживать результаты, как в почте.
Есть интеграция с Chrome - агент может запускать приложения, тестировать страницы и делать скриншоты прямо из расширения.
Минусы: сыроватая работа с GitHub/git и нестабильность на MacOS, особенно с VPN

🔹 Eleven Labs теперь стала платформой, которая поддерживает сторонние ИИ‑сервисы для генерации видео, изображений и других материалов. Это большой плюс, ведь Eleven Labs занимает лидирующие позиции на рынке озвучки, поэтому возможность озвучивать видео своими или специально подготовленными голосами - отличная идея. Презентация - в комментариях.

@VAI_ART
#VAI_News
👍85
VAI
Ну что, Gemini 3 от Google вышла - по бенчмаркам новый король! В ближайшее время ждём Nano Banana 2, её тоже должны подвезти, ведь она на базе Gemini 3. Бесплатно, но с дневными ограничениями. Нужен VPN. @VAI_ART #VAI_News
This media is not supported in your browser
VIEW IN TELEGRAM
🟥🟥🟥 Король умер - да здравствует новый король! Вышел Claude Opus 4.5, который по большинству метрик опережает представленный на прошлой неделе Gemini 3 Pro.

На самом деле очень интересно наблюдать за этой гонкой. Как будто находишься на Формуле-1 и смотришь на мчащиеся по трассе болиды. 🚀

Описание

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
👍63
This media is not supported in your browser
VIEW IN TELEGRAM
🟥🟥🟥Конец года, конечно, очень радует. Вот и Black Forest Lab, видимо, подождали, пока шумиха вокруг Banana немного утихнет, и наконец-то выпустили вторую версию своего нашумевшего генератора Flux.

🔹 Максимальное разрешение вывода: до 4 МП (например, 2048×2048 и выше; поддержка 2K и 4K режимов в PRO версии)​
🔹 Улучшили «знание реального мира»: модель лучше разбирается в том, как работают законы физики и оптики в нашем мире, поэтому генерации будут не такими пластмассовыми
🔹Улучшена детализация, качество освещения и генерации в целом
🔹Количество референсов: до 6 референсных изображений для поддержания стилистики, позы, персонажей и контекста без дополнительной донастройки (multi-reference)​
🔹 Параметры модели: 12 миллиардов (12B) параметров, гибридная архитектура с трансформерами и диффузией​
🔹 Качество текста: отличный рендеринг читаемого текста, подходит для инфографики, UI и мультиязычных надписей​
🔹 Контролируемость позы и деталей: прямое управление позой персонажа, детализированной композицией
🔹 Кол-во входных референсов: до 6 (официально; через Diffusers достигали 10, но рекомендуют не более 6 для стабильности)​
🔹 Поддержка редактур: JSON-подсказки и структурные промпты для сложной композиции, художественных и коммерческих кейсов


Ну и, конечно же, большой плюс в том, что BFL, к радости пользователей, не изменили своим принципам и выпустили, так же модель FLUX.2[dev] в общий доступ. А это значит, что каждый может установить её у себя и генерировать изображения на своём железе.

Так же 2 платные модели:

FLUX.2 Flex - текст,меолкая детализация,дизайн. Модель заточена под гибкость и скорость.

FLUX.2 Pro - фотореализм и максимальное качество.

Скачать FLUX.2[dev] - тут.
Протестировать тут и тут.

UPD. Потестил - выглядит примерно как первая BANANA, где то получше, где то похуже. Так что, скорее всего, кому-то для локальных решений или развертывания в облаке это может пригодиться.

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
👍43
Как и в прошлый раз с выходом новой Nano Banana Pro, немного поэкспериментировал с её возможностями. Поиграться и нагенерировать красивых картинок - это да, но я в первую очередь всегда пытаюсь понять, как можно применить новый инструмент в рабочих задачах и процессах. У меня есть задачи, которые я пытаюсь автоматизировать, и периодически прогоняю их через новые версии ИИ, чтобы посмотреть, что нового и как они сейчас справляются с этими задачами. 🤓

Одной из тем, поднятых мной ранее, было редактирование текстур. По моему мнению, с правильным подходом предыдущая версия Nano Banana справлялась неплохо. Не очень сложные задачи выполнялись хорошо. Писал про это тут.

А что если новая Banana теперь даёт больше возможностей в редактировании и доработке текстур? Я решил проверить, и мои ожидания оправдались. Новая модель не только начала справляться с более сложными задачами по редактированию текстур, но и научилась делать дополнительные карты. То есть, если в прошлый раз многие говорили, что этот метод с генерацией одной текстуры подходит далеко не для всех пайплайнов и что делать с дополнительными картами, то сейчас и этот вопрос начинает решаться. Хотите карту нормалей - без проблем, может быть карты оклюзии - без проблем, карту металика - без проблем. Да, всё ещё не идеально, результат можно получить не с первого раза, но в общем только представьте, что по одному запросу вы сможете сгенерировать любую карту, которая вам нужна для модели. И мы только в самом начале пути.

На сложных задачах, понятно, что косячит (чем сложнее развертка), но простые и средней сложности задачи уже можно решать. Не нужно скульптить или делать под сабдив модели, чтобы снять нужные карты. Достаточно иметь карту альбедо (изображение, которое определяет базовый цвет поверхности модели без теней и бликов) и, задав промпт, получить то, что нужно.

Также можно сгенерировать бесшовную текстуру для объекта и догенерировать любую дополнительную карту для неё.

Просто, быстро!💪

В общем, из плюсов - управляемость и послушность промпту действительно стали очень крутыми. Даже придумывать ничего не нужно: просто пишешь, например, «вдави стенки у сундука больше», и модель оставляет всё изображение, а стенки действительно вдавливает. Т.е., хирургические правки делаются легко и просто. В предыдущей версии Banana были проблемы с ракурсами - приходилось очень сильно изворачиваться, чтобы модель изменила положение объекта. Также были сложности с переносом стиля или, например, перенос одежды с одного персонажа на другого, если их пропорции имели значительные различия.

Конечно, не обходится без проблем. Как и писал ранее, не всегда можно получить результат (особенно сложный), поэтому помогает итерационный подход: не пытаться внести все правки сразу, а разделять их на этапы. Остаются и специфические трудности, как и в предыдущих версиях. Если помните, раньше модели «сходили с ума» при генерации людей вверх ногами - получались очень интересные результаты. Сейчас эту проблему давно решили, но если рассматривать пример с текстурами, часто текст может быть отражён, и даже Nano Banana Pro пока что не всегда понимает, как отразить текст. Я уже писал о том, как можно этого избежать, в прошлых постах.

Есть и плюсы: по крайней мере, модель пытается.🙂 Например, у меня было несколько одинаковых отражённых надписей. В некоторых случаях модель правильно отражала хотя бы одну, но обе отражённые надписи мне сделать так и не удалось. Возможно, итерационно с графическими подсказками можно добиться результата - сначала для одной надписи, потом для другой. Но, уже, проще сделать это вручную в Photoshop, поэтому существенной разницы нет. Тут ещё стоит уточнить, ни одна модель пока не понимает этого, а Banana Pro уже понимает, но пока не до конца.

P.S.Пока платно и на многих агрегаторах очень дорого. Надеюсь, скоро раскатают больше и на бесплатных пользователей. Так же как и всегда нужен VPN.

P.P.S. Всем хорошего завершения недели и отличных выходных. ❤️

@VAI_ART
#VAI_Practice
Please open Telegram to view this post
VIEW IN TELEGRAM
9👍5🔥4👎1
Новостей немного за неделю. Пару новых генераторов картинок, пару новых видео генераторов, но они не дают ничего нового по сравнению с уже существующими моделями, а зачастую и отстают от лидеров рынка. Поэтому нет смысла писать. Также вышел DeepSeek-Math-V2. Лучший в математике, но на этом плюсы заканчиваются.

На этой неделе особенно кратко.

🔹 Flux 2 вышла в релиз. Писал про нее тут. Немного ещё допишу своих мыслей. Я давно ждал этот релиз, так как вся тема с редактированием и доработкой нормально началась с первой модели, и она, вышедшая полгода назад, была своеобразным прорывом. Но из тестов, которые видел и сам делал, она сильно уступает Banana Pro. Она находится где-то на уровне первой Banana. Но и там из-за плюсов того, что Banana работает на базе LLM (в случае с первой — на версии Gemini 2.5), в понимании и простоте в работе я бы отдал победу той же Banana.

Из плюсов в линейке, как и в первой версии, есть открытая модель для общего использования. Можно поставить и генерировать у себя или развернуть в облаке. Что, в свою очередь, может быть полезно тем, кто не хочет, чтобы их информация и данные где-то появились.

🔹 Вышла Claude Opus 4.5. Писал тут. Вечно можно наблюдать, как горит огонь, течёт вода и как каждую неделю выходит новая LLM-модель, которая рвёт все предыдущие модели.

🔹 Hunyuan 3D Studio 1.1. Первая версия вышла месяца полтора назад. Тут целый комбайн с 3D. Работает пока сыровато, но есть и полезные вещи, которые могут ускорить процессы. Сейчас вышла обновленная версия, и пишут, что решили проблемы с топологией моделей. Пока не тестировал, но видео (которое в комментариях) выглядит хорошо.

@VAI_ART
#VAI_News
👍31
This media is not supported in your browser
VIEW IN TELEGRAM
Немного юмора, а то очень серьезно тут все :)

Всем отличной недели! 🙂
Please open Telegram to view this post
VIEW IN TELEGRAM
😁15😱1
Media is too big
VIEW IN TELEGRAM
Ладно, воспользуюсь правом админа и размещу тут вакансию. Частить не буду, но какие-то вакансии, которые сложно закрываются, буду через свои каналы дублировать.

Нам требуется FX-артист в Unity. Знаю, что тут много ребят с геймдева или около него. Может, кто-то захочет или посоветует хорошего знакомого за шоколадку 😀.

У нас на проекте накопился стек задач, которые нужно выполнить, и внутренними силами не справляемся с объёмом. Пока работа на фрилансе, условия и оплату давайте обговорим в личке.

Спасибо за внимание!

P.S. Заодно посмотрите трейлер, который делали 2 года назад и который мало кто видел, но это не дело 🤓.

UPD. Вакансию закрыл. Всем спасибо за отклики! ❤️

@VAI_ART
#Vacancies
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥43
Создание концептов становится всё проще и проще с каждым днём. Любая вариация, уже практически любой сложности, делается за считанные минуты. Это вы ещё концепты объектов и локаций не видели. Сделаю немного позже.

Сделано в Nano Banana Pro. Чем мне нравятся эти модели - что уже не нужно извращаться с промптом, всё делается и пишется очень просто.

Например:
Сделай из изображения детскую вязаную игрушку. Упрости детали, но образ должен быть узнаваем. Не порти качество изначального изображения.


Очень просто, а результат очень крутой! 🔥🔥🔥

В следующем году 3D догонит тоже, сделают какие-нибудь комбайны (нормально работающие). Будем просто писать основную идею или прикладывать концепт, а на выходе получать готовую модель. Думаю, до этого осталось уже недолго. 🚀

@VAI_ART
#VAI_Gallery
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10🔥3👌1
Одна из тех недель, когда тратишь больше времени, чтобы ужать все в один пост, чем собрать информацию. 🫡
Быстренько пробежимся.

🔹 Новые модели DeepSeek-V3.2 и DeepSeek-V3.2-Speciale.
Позиционируются как модели для агентов. DeepSeek-V3.2-Speciale – с акцентом на сложный долгий ризонинг и планирование.
Первая в общем доступе. Вторая, на данный момент, только по API.
Уровень GPT-5 и Gemini 3.0.Это очень круто, что есть модели, которые на опенсорсе дают уровень топовых платных моделей! Модели хорошие!
Взять как всегда можно на Hugging Face.
Графики в комментариях.

🔹Kling выдал марафон. Практически каждый день выкладывали интересные инструменты:

- Kling O1. Позволяет редактировать видео. Нужно заменить объект, человека, время суток и т. д. в видео - модель может с этим помочь.Всё ещё не идеально, но достаточно неплохо.
- Kling IMAGE O1. Ответ Nano Banana. Также можно редактировать изображения.Но вот все эти ребята типа Kling и Seedream (ниже в новостях) и тд. Что они могут противопоставить Gemini 3 Pro? Ничего, а значит, что в управляемости и простоте они даже и близко не могут быть рядом с Banana. Но модель неплохая.
- Kling 2.6. Новая версия достаточно неплохого видео генератора. Модель генерирует видео до 10 секунд в 1080p с синхронизированной речью, звуковыми эффектами, музыкой. Поддерживаются два режима: text-to-video и image-to-video, с возможностью указать характер голоса, стиль речи и звуковое окружение прямо в промпте.
- KlingAI Avatar 2.0. Обновлённая модель для создания говорящих аватаров, которая генерирует видео до 5 минут из одной фотографии и аудио.Главные улучшения: естественная мимика с микродвижениями глаз и головы, улучшенный липсинк без рывков, эмоциональная выразительность и поддержка пения с движениями тела в такт музыке. Модель работает с реальными людьми, AI-персонажами и даже животными/мультяшными героями, выдаёт 1080p при 30–48 FPS.
- Kling Element Library. Функция в Kling AI, которая позволяет загружать до 4 изображений (персонажи, объекты, фоны).Вы загружаете изображения элементов, описываете в промпте, как они должны взаимодействовать или двигаться, и модель создаёт видео, где все объекты выглядят точно так же, как на загруженных картинках.
Презентации инструментов в комментариях.

🔹 Опенсорсное семейство моделей Ministral 3.Небольшие модели, с хорошими показателями.На уровне DeepSeek-V3.1. Но, на этой неделе вышел DeepSeek-V3.2.Который уже обходит эту модель. Для локальных запусков, также, кому то может быть интересно.
Попробовать можно тут.
Графики также в комментариях.

🔹Google выпустили Gemini 3 Deep Think - модель показывает значительное превосходит Gemini 3 Pro и другие модели.Она использует технологию параллельных рассуждений, изучая одновременно несколько гипотез и объединяя результаты.
Пока доступна только подписчикам Ultra.
Графики в комментариях.

🔹 Seedream v4.5.Новая версия улучшила четыре ключевых области: сохраняет мелкие детали и текстуры объектов при редактировании вместо их размытия, значительно лучше работает с текстами на изображениях, генерирует более реалистичные портреты с чёткими чертами лица и правильной текстурой кожи даже на небольших объектах, и может обрабатывать до 10 референсных изображений одновременно с сохранением согласованности персонажей, стиля и композиции. Всё это может в 4K разрешении.
Попробовать можно тут и тут.

🔹 RunWay 4.5. Новая модель для генерации видео, которая заняла первое место в рейтинге Video Arena, обойдя Sora и Veo (сомнительно). Главные улучшения: реалистичная физика, лучшее следование промпту и высокая визуальная точность. Модель работает с разными стилями от фотореализма до анимации, поддерживает режимы text-to-video, image-to-video, video-to-video и работу с ключевыми кадрами.
Это одна из моделей, к которой я отношусь очень осторожно, так как зачастую их рекламные материалы имеют «небольшую» разницу с реальными результатами.Но то, что модель улучшается и становится лучше, вопросов нет.
Презентация в комментариях.

🔹 Grok Imagine. Так же идут за модой и прикручивают редактирование изображений к своей модели.

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍4🔥1
Я как-то писал пост о том, как LLM‑модели могут быть полезны художникам, вот писал про это тут. Тогда уже казалось классным, что не нужно ждать обновлений программ: любую проблему, которая мешает работать, или задачу по автоматизации процесса можно решить или реализовать за пару минут. 🧐

Но смотришь на развитие всего этого сейчас и понимаешь, что помимо того, что устранить любую проблему стало еще проще, с выходом новых LLM‑моделей можно практически в один запрос (с небольшими корректировками) описать и собрать почти любое приложение.

Сейчас множество LLM хорошо справляются с подобными задачами:

● GPTChat 5.1
● Gemini 3 Pro
● Claude Opus/Sonnet
● Grok 4.1
● DeepSeek‑V3.2

Достаточно большое количество инструментов, которые очень сильно бустят и помогают.

- хотите сделать приложение, которое организует всю вашу кучу референсов и создает структуру по папкам? Вы можете задать папки сами, или ИИ‑инструмент проанализирует контент и отсортирует его автоматически - без проблем.
- может быть, вы хотите создать рандомайзер текстур - запускаете скрипт, который генерирует 10 вариаций одной текстуры за раз.
- или более базовый сценарий: диск C переполнен, и нужно быстро что‑то удалить. Можно сделать скрипт, который проанализирует самые большие или наименее используемые файлы и выведет список - берете и удаляете.

Сделать можно всё, на что хватает фантазии.

Часто, конечно, нужно будет докачать библиотеки, установить тот же Python (язык программирования, который позволяет создавать приложения, скрипты, анализировать данные и автоматизировать задачи). Но можно попросить детальную инструкцию по каждому шагу - и всё пройдет без проблем. Это вообще не сложно.

Сейчас уже идет смещение ролей: программисты генерируют изображения, художники создают приложения и т.д. Конечно, и там, и там нужны навыки и понимание процессов. Но какое‑то базовое представление уже не требует длительного обучения.

Я как‑то писал, что учился на программиста, но, несмотря на 5 лет в университете, хорошим программистом так и не стал.🙃 Зато нашел себя в графике. И каждый раз радуюсь как ребенок, когда нужно написать скрипт или небольшое приложение для автоматизации и при этом практически ничего не делать вручную.

Для примера сделал приложение, работающее в браузере. Загружаете любое изображение, и оно его оформляет и выводит основные цветовые коды, которые использовались в изображении. Потратил 5 минут. Закинул в комментарии. Может кому то пригодится.

Как уже писал раньше, всё больше на первый план выходит мысль и идея, а реализация занимает минимальное количество времени. Конечно, пока еще не всё можно сделать, и система далека от идеала, но уже сейчас это впечатляет.

Читаешь статьи о том, как большие компании отдают 30 - 40% написания кода ИИ‑моделям, и немного офигеваешь. И при этом понимаешь, что мы только в начале пути развития ИИ. С одной стороны - немного страшно, с другой - безумно интересно посмотреть, к чему всё это приведет. 🤤

@VAI_ART
#VAI_General
Please open Telegram to view this post
VIEW IN TELEGRAM
👍101🔥1
Давайте рассмотрим ещё одну полезную функцию Nano Banana Pro - поиск вариаций.

Мы рассматриваем возможность внедрения персонажей из основного режима в детский и можем так же быстро проверить сами образы, чтобы понять, что и как лучше подойдёт.

Закидывайте вашего персонажа и референс, на который стоит ориентироваться при переделке стилистики, либо опишите всё промптом, либо совместите оба подхода. Дальше пошаговыми правками корректируйте формы: например, «сделай толще», «сделай больше», «сделай ниже» и т.д.


Заметьте как переносятся детали, практически ничего не теряется.

@VAI_ART
#VAI_Gallery
👍85🔥2
Как обычно наиболее интересные новости в сфере ИИ за прошлую неделю.

🔹 Вышла GPT 5.2. После выхода 5.1, где из основных нововведений было то, что модель стала говорить «теплее», здесь точно постарались и сделали модель действительно лучше.
Повышение точности и надежности, реализованное через введение трех специализированных режимов (Instant, Thinking, Pro) и снижение фактических ошибок до 38%. Модель теперь поддерживает контекст до 256 тысяч токенов, что улучшает способностью удерживать детали глубоко внутри текста, а также демонстрирует более высокое качество в написании кода, логических рассуждениях и интерпретации визуальных данных, таких как диаграммы.
Вообще, глобально модель не лучше последних Claude или Gemini (они местами даже лучше), но модель хорошая.
Очень надеюсь, что они перестанут заниматься ерундой и не отстанут от рынка, а то пока выглядит так, будто уже начали отставать. Сравнивают только со своими моделями. Графики в комментариях.

🔹 Photoshop добавили в ChatGPT. Пока функции ограничены. Можно редактировать изображения, например удалить фон, применить фильтры, добавить резкости и тд. Также добавили Express и Acrobat. Презентация в комментариях.

🔹 RunWay 4.5. Вышла только на этой неделе. Писал про модель на прошлой неделе. Также как и в случае с Kling (про который также писал на прошлой неделе) анонсировали кучу новостей. Смысла говорить нет, так как непонятно вообще когда они смогут выпустить все обещанное. Никаких дат нет.

🔹 Не писал про Figma, исправляюсь, там тоже идет внедрение большого количества ИИ инструментов. На этой недели сделали много интересного. Теперь можно выделять объекты (в том числе лассо), удалять их и расширять холст, при этом фон автоматически достраивается ИИ с сохранением света, теней и общей цветовой схемы. Эти функции встроены прямо в Figma Design/Draw, так что больше не нужно гонять кадры в Photoshop или другие редакторы для базового object removal и outpainting. Выглядит круто. Презентация в комментариях.

🔹 3D‑генераторы продолжают обрастать функциями. На этой неделе в Meshy 6 добавили генерацию персонажей сразу в A‑ и T‑позах: можно загрузить изображение персонажа, и модель будет сгенерирована в выбранной стандартной позе - удобно для дальнейшей доработки риггинга. Презентация в комментариях.

Было что-то еще интересное?)

@VAI_ART
#VAI_News
1👍92
This media is not supported in your browser
VIEW IN TELEGRAM
🟥🟥🟥 Ну что, GPT наконец-то разродились и выпустили GPT Images 1.5 для генерации изображений!

Первая версия была отличной, но давно уже устарела.

Посмотрим, насколько хороша новая!

Это новая модель, а не обновление прошлой модели на базе Sora.

Новый интерфейс "Images" внутри ChatGPT.

Руководство по промтингу.

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
👍51
Нового года тоже добавлю.🎄

Немного разных игрушек с нашей родной эстетикой.

Сделано в Nana Banana Pro.

Всех больше провозился с шаром из оливье. 🙃 Поэтому ловите на него промпт.
Фотография пышной елки среднего плана, фокус на отдельной игрушке. Винтажная рождественская игрушка представляет собой сферу, стилизованную под салат «Оливье». Весь шар покрыт глянцевой кремово-белой эмалью (имитирующей майонез). В эту белую поверхность вплавлены (или выступают рельефом) отчетливые крупные стеклянные кубики, имитирующие ингредиенты салата, разбросанные по всему периметру: оранжевые квадратики (морковь), розовые квадратики (ветчина) и зеленые шарики (горошек). Ингредиенты стилизованы, это не фотореалистичная еда, а именно декор. Текстура состаренного стекла с амальгамой, легкое окисление на металлическом колпачке. Соотношение сторон 9x16.


@VAI_ART
#VAI_Gallery
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
110🔥5🤩2🤮1🦄1