VAI
2.75K subscribers
424 photos
67 videos
4 files
119 links
15 лет в компьютерной графике, 6 лет — арт-директор.
Работал над десятками проектов.
Изучаю ИИ для развития и собираю здесь свой опыт, находки и эксперименты.
Присоединяйтесь!
Личный контакт - @AlexBakakin

AI l ИИ
Download Telegram
Электроник, но он Т-800 🤖

Результат понравился.

У меня самого есть несколько идей и сюжетов для похожего смешивания миров. Как доберусь - обязательно сделаю что-то подобное.

Автора, к сожалению, найти не удалось. Если кто-то знает, напишите в комментариях - обязательно укажу.

Судя по описанию, работа создана в Midjourney.

@VAI_ART
#VAI_Gallery
👍84🔥1😁1
Как насчёт того, чтобы большие посты сразу дублировать аудиодорожкой для прослушивания?
Anonymous Poll
33%
Круто!
38%
Без разницы
32%
Бла-бла-бла… Хоть бы уже что-нибудь выпустили, Лёх, а то одни обещания
4
Конец недели, подведем итоги интересных новинок в сфере ИИ. Новостей не много, но пройдемся. ⚡️

🔹 QWEN Camera Angles. Обновили интересный инструмент, который позволяет управлять положением и углом “камеры” при создании или генерации изображений с помощью AI.Можно попробовать на агрегаторах типа WeavyAI. Запустили также в Hugging Face space. Помнит еще кто то про каталог ИИ там?). А сам инструмент от QWEN можно посмотреть тут. Потестил, не всегда работает хорошо, но в общем можно сделать нужные ракурсы. Презентация в комментариях.

🔹 В chatGPT скоро появятся групповые чаты. Групповые чаты в GPT - это возможность нескольким людям общаться с одним ботом в одном чате одновременно. Все участники видят вопросы и ответы, могут вместе обсуждать темы, задавать вопросы, решать задачи или работать над проектом. Такой формат уже тестируется в некоторых сервисах (например, в ChatGPT Team и Slack-плагинах), но пока не везде доступен. Идея, чтобы бот помогал не одному человеку, а сразу всей группе в режиме живого диалога. Хз как это будет устроено, лично у меня чаты даже при небольшом общении начинают сильно виснуть и лагать и приходятся создавать новые. А тут будет целая группа людей, которая заполнит этот чат моментально. В общем, посмотрим.
Также вышла GPT 5.1, но нет смысла много писать. Так как из основных обновлений, сделали разговор более “теплым” 😀 и немного обновили thinking режим.

🔹 ElevenLabs Scribe v2 Realtime - это новый сервис для преобразования речи в текст. Можно просто диктовать через микрофон или загружать аудио/видео-файл - и сразу получать текстовую расшифровку. Поддерживает 92 языка, работает быстро и очень точно, подходит для интервью, роликов, разговоров или просто заметок голосом. Всё максимально просто: говоришь - получаешь текст. Презентация в комментариях.

🔹 Многие писали про новый генератор миров от стартап Фей-Фей Ли, по названием Marble. Marble - это 3D‑генератор, с которым можно создавать мир и ходить по нему. В отличие от Genie, здесь мир не меняется сам, но его можно дорабатывать по запросу или объединять с другими. Работает с текстом, картинками, видео и простыми 3D‑набросками. Генерация проходит по шагам: сначала создается основа мира, потом добавляются детали и оформление. Из интересных особенностей полученный мир можно выгрузить мешами в 3д или видео. Есть бесплатный тариф. Попробовать можно тут. Презентация в комментариях.

🔹 Google NotebookLM - это ИИ-инструмент для работы с заметками и исследованиями: загружаешь свои документы, он делает быстрые резюме, отвечает на вопросы с цитатами из твоих файлов и помогает создавать учебные материалы. Новая функция Deep Research позволяет автоматически искать инфу в интернете и формировать подробные отчёты. Всё удобно, ответы ссылаются на исходные материалы, но факт-чекинг всё равно нужен.
Пишут, что очень удобная штука. Сам не пробовал, но очень заинтересовали, обязательно посижу в нем. Сам Deep Research лично у меня не раскатали. Как понял, это должно произойти со дня на день.

В начале следующей недели планируется как минимум один пост из практической серии - о том, как создавался прототип игры. Начал с концептов персонажей. Пост получился объёмным, надеюсь, не слишком перегруженным.

Всем заранее отличной недели! 🐤

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
👍65
Начну серию практических постов.

Пока неясна периодичность, потому что пишу это не быстро, а свободное время постоянно стремится к нулю. Но точно до конца года выйдет что‑то ещё из этой серии.

Начну с концептов персонажей.

Есть много способов создать персонажа - как с нуля, так и на основе уже имеющихся референсов. Здесь, как и в обычном концепт‑арте, всё зависит от навыков.

Рассмотрим одни из самых простых способов.

Пока что, по моим наблюдениям, есть три способа получить результат:

1️⃣ Отталкиваться от промта. Самый абстрактный вариант, но даже так можно получить варианты, способные натолкнуть на интересные идеи. У меня много раз было так: просто описываешь, что хочешь получить, не имея чёткого видения, и итоговые генерации дают решения, которые помогают сформировать финальную концепцию.
2️⃣ Использование референсных изображений. ИИ без проблем подбирает нужный стиль. Можно добавить промт, чтобы подчеркнуть желаемую стилистику. Промт также создаётся через ИИ(можно закинуть референсное изображение и попросить вычленить стилистические особенности) и дорабатывается вручную.
3️⃣ Работа с наработками (например, скетчем). Можно отрисовать определённый дизайн или детали и дорабатывать их, двигаясь в нужную сторону.

⚡️В моём случае для прототипа я использовал два последних способа: брал свои наработки и референсные изображения, а затем на их основе делал концепт персонажа. Делал это через Sora - по‑моему, до сих пор это один из самых простых способов доработать нужную стилистику. Закинул референсы и примерно описал, что хочу получить.

Получив первый концепт, который уже более менее подходил я отправил его в языковую модель (у меня это был GPT). Затем забрал промт с характерным стилем, доработал его и закинув вместе с концептом получил серию изображений одного персонажа.

Доработал их вручную - это занимает не так много времени. Где-то немного поправил глаза, где-то уменьшил или увеличил объём персонажа. Иногда совмещал части одного персонажа с другим, иногда дорисовывал необходимые детали. Поскольку это этап концепта, делать всё вручную не сложно.

Всё довольно просто: понятно, что и концепты выходят достаточно простые, но суть та же и в более сложных задачах - просто появляется больше работы/итераций.

🍌 Дальше я использовал второй инструмент - Nano Banana. С его помощью я дорабатывал детали и доводил рендер до нужного качества.

У Nano Banana есть свои плюсы и минусы. После нескольких месяцев работы нашёл и сильные, и слабые стороны. Если интересно, могу написать отдельный пост, но вот-вот должна выйти вторая версия этого сервиса, поэтому накопленный опыт уже устареет. 🙂

В целом, все эти манипуляции заменяют огромный пласт ручной работы.

В данном случае важно было получить интересный образ персонажа с долей сумасшествия и щепоткой милоты, ведь для тела была заранее создана болванка, а его форма не играет принципиальной роли.

Кстати, и сам сумасшедший/милый образ, и болванка тела были продуманы по‑особому, но это уже нюансы нашей ниши - оффлайн VR со свободным перемещением. Если интересно, почему и для чего такое делается, могу рассказать об этом отдельно.

Обвесы, как пример, на последнем изображении, их планируется много.

Пишите, что интересно, а что нет - буду смотреть по вашим откликам.

Дальше пойдём по плану: поговорим о создании 3D по получившимся концептам. И дальше, уже разберём концепты и модели локаций.

Все концепты суммарно были сделаны за пару дней(это с ручными доработками, обвесами и тд.). В примерах процентов 40 из того, что было сделано.

Давайте обсудим! Что думаете? Может, у вас есть свои методы и пайплайны - будет интересно узнать что‑то новое.💪

P.S. Набросок черепахи с первого изображения был нарисован крутым художником и арт директором Олегом Юрковым.

ТГ
Арстанция

P.P.S. Аудиоверсия в комментариях.

@VAI_ART
#VAI_Practice
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍195🔥2🦄2
Ну что, Gemini 3 от Google вышла - по бенчмаркам новый король! В ближайшее время ждём Nano Banana 2, её тоже должны подвезти, ведь она на базе Gemini 3. Бесплатно, но с дневными ограничениями. Нужен VPN.

@VAI_ART
#VAI_News
👍41
Data Secrets
HuggingFace релизнули замечательную свежую книгу про обучение LLM 200+ страниц, 7 больших глав. Содержание примерно следующее: – Архитектуры, их особенности и оптимизация гиперпараметров – Работа с данными – Предобучение и какие в нем есть подводные камни…
SMOL_секреты_создания_LLM_мирового_класса_Перевод_t_me_aivkube.pdf
14.6 MB
Недавно делился книгой по обучению LLM от HuggingFace - теперь появился её перевод. Я по образованию программист, всегда интересно не только пользоваться, но и разбираться, как устроено всё “под капотом”. Времени хватает не всегда, но пусть будет под рукой - надеюсь доберусь почитать, ну а если кому-то тоже пригодится, отлично!

Перевел ее Сергей Долгов.

@VAI_ART
#VAI_News
5👍2🔥1
Media is too big
VIEW IN TELEGRAM
🟥🟥🟥 Все уже в курсе, но если кто‑то ещё не знает - вышла Nano Banana Pro.

🔹 объединяет до 14 референсов в одно изображение
🔹 поддерживает разрешение до 4K
🔹 ещё лучше переносит стили, контроль над результатом стал круче
🔹 улучшена работа с текстом, поддержка русского тоже есть


И это только малая часть возможностей Nano Banana Pro.

Во многих сервисах она уже доступна, в том числе здесь и здесь.

Пока сам не тестировал, но по доступным примерам видно - управлять и получать нужный результат стало еще проще.

Осталось только датчики к голове прикрутить, чтобы не писать промпты. 😁

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥21
🔹 Вышли Gemini 3 Pro и Nano Banana Pro. Коротко напишу. Кажется, наконец появился лидер среди ИИ‑инструментов. Как обычно бывает, многие отсеиваются, а остаются только крупные игроки. По моему мнению, этот тренд будет усиливаться, и остальные перейдут в режим догоняющих. По сути, Google выигрывает во многих сферах - будь то LLM, генерация изображений или видео (по видео OpenAI пока рядом или чуть впереди, но похоже, ненадолго) и тд.. Несмотря на новаторство, у OpenAI не вышло справиться с ростом: структура не выстроена, и даже при огромных бюджетах компания всё ещё похожа на стартап. А у Google, как у любого крупного игрока, есть стабильность, система и ресурсы. В общем, посмотрим дальше, но пока всё выглядит так.

🔹 Meta выпустила набор ИИ-инструментов:
● SAM 3 – новая версия Segment Anything Model. Позволяет выделять объекты на изображениях и видео по тексту, подсказке или примеру, очень быстро обрабатывает кадры, поддерживает отслеживание и точную сегментацию прямо во время просмотра видео.
● SAM 3D - расширение, способное строить и сигментировать 3D-модель объекта или человека по одной фотографии: восстанавливает форму, позу, геометрию. Есть две версии - для обычных предметов и для человеческих тел. Работает с фото, 3D-сканами и сценами, подходит для AR, игр и разработки.
Выглядит интересно.
Попробовать можно тут.
Презентация в комментариях.

🔹 OpenAI, чтобы хоть немного перетянуть одеяло выпустили на неделе сразу два обновления. Это коснулось:
GPT-5.1-Codex-Max. OpenAI представила новый Codex - теперь модель умеет работать в Windows и Powershell, появилась автономная работа агента прямо в терминале (можно настраивать права).
Codex может трудиться над задачами до 24+ часов без перерывов, используя механизм «компакции» - сжимает старую инфу и эффективно удерживает большой контекст, будто у неё есть краткосрочная и долгосрочная память.
По метрикам кодинга Codex показывает 77,9% точности - лучше, чем Gemini 3 и Claude Sonnet 4.5, и расходует на 30% меньше токенов при аналогичной сложности задач.
Групповые чаты. Возможность общаться сразу нескольким людям с ИИ‑ботом в одном чате. В таком чате участники видят все ответы друг друга и бота, могут обсуждать, задавать вопросы и получать совместные решения. Это удобно для командной работы, учебы, обсуждения идей или мозгового штурма с участием ИИ. Всё работает просто: добавляешь людей и пишешь вместе с ботом в одном окне.

🔹 Вышел Grok 4.1. В новой версии повысили эмоциональный интеллект и снизили количество галлюцинаций - теперь модель стала более чуткой, креативной и в три раза меньше придумывает лишнего. По тестам soft skills (EQ-Bench) и творческому письму - лучшие показатели, плюс уверенная победа на LMArena, обогнав Gemini 2.5 Pro на 31 балл.

🔹 Antigravity (и снова Google) - новая ИИ‑IDE (IDE - среда, где удобно писать, проверять и запускать код, всё собрано в одном окне) от Google, доступна бесплатно на Mac, Windows и Linux (50 запросов каждые 5 часов).
Главное отличие: режим Inbox - панель для асинхронного программирования и оркестрации агентов, где удобно ставить задачи и отслеживать результаты, как в почте.
Есть интеграция с Chrome - агент может запускать приложения, тестировать страницы и делать скриншоты прямо из расширения.
Минусы: сыроватая работа с GitHub/git и нестабильность на MacOS, особенно с VPN

🔹 Eleven Labs теперь стала платформой, которая поддерживает сторонние ИИ‑сервисы для генерации видео, изображений и других материалов. Это большой плюс, ведь Eleven Labs занимает лидирующие позиции на рынке озвучки, поэтому возможность озвучивать видео своими или специально подготовленными голосами - отличная идея. Презентация - в комментариях.

@VAI_ART
#VAI_News
👍85
VAI
Ну что, Gemini 3 от Google вышла - по бенчмаркам новый король! В ближайшее время ждём Nano Banana 2, её тоже должны подвезти, ведь она на базе Gemini 3. Бесплатно, но с дневными ограничениями. Нужен VPN. @VAI_ART #VAI_News
This media is not supported in your browser
VIEW IN TELEGRAM
🟥🟥🟥 Король умер - да здравствует новый король! Вышел Claude Opus 4.5, который по большинству метрик опережает представленный на прошлой неделе Gemini 3 Pro.

На самом деле очень интересно наблюдать за этой гонкой. Как будто находишься на Формуле-1 и смотришь на мчащиеся по трассе болиды. 🚀

Описание

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
👍63
This media is not supported in your browser
VIEW IN TELEGRAM
🟥🟥🟥Конец года, конечно, очень радует. Вот и Black Forest Lab, видимо, подождали, пока шумиха вокруг Banana немного утихнет, и наконец-то выпустили вторую версию своего нашумевшего генератора Flux.

🔹 Максимальное разрешение вывода: до 4 МП (например, 2048×2048 и выше; поддержка 2K и 4K режимов в PRO версии)​
🔹 Улучшили «знание реального мира»: модель лучше разбирается в том, как работают законы физики и оптики в нашем мире, поэтому генерации будут не такими пластмассовыми
🔹Улучшена детализация, качество освещения и генерации в целом
🔹Количество референсов: до 6 референсных изображений для поддержания стилистики, позы, персонажей и контекста без дополнительной донастройки (multi-reference)​
🔹 Параметры модели: 12 миллиардов (12B) параметров, гибридная архитектура с трансформерами и диффузией​
🔹 Качество текста: отличный рендеринг читаемого текста, подходит для инфографики, UI и мультиязычных надписей​
🔹 Контролируемость позы и деталей: прямое управление позой персонажа, детализированной композицией
🔹 Кол-во входных референсов: до 6 (официально; через Diffusers достигали 10, но рекомендуют не более 6 для стабильности)​
🔹 Поддержка редактур: JSON-подсказки и структурные промпты для сложной композиции, художественных и коммерческих кейсов


Ну и, конечно же, большой плюс в том, что BFL, к радости пользователей, не изменили своим принципам и выпустили, так же модель FLUX.2[dev] в общий доступ. А это значит, что каждый может установить её у себя и генерировать изображения на своём железе.

Так же 2 платные модели:

FLUX.2 Flex - текст,меолкая детализация,дизайн. Модель заточена под гибкость и скорость.

FLUX.2 Pro - фотореализм и максимальное качество.

Скачать FLUX.2[dev] - тут.
Протестировать тут и тут.

UPD. Потестил - выглядит примерно как первая BANANA, где то получше, где то похуже. Так что, скорее всего, кому-то для локальных решений или развертывания в облаке это может пригодиться.

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
👍43
Как и в прошлый раз с выходом новой Nano Banana Pro, немного поэкспериментировал с её возможностями. Поиграться и нагенерировать красивых картинок - это да, но я в первую очередь всегда пытаюсь понять, как можно применить новый инструмент в рабочих задачах и процессах. У меня есть задачи, которые я пытаюсь автоматизировать, и периодически прогоняю их через новые версии ИИ, чтобы посмотреть, что нового и как они сейчас справляются с этими задачами. 🤓

Одной из тем, поднятых мной ранее, было редактирование текстур. По моему мнению, с правильным подходом предыдущая версия Nano Banana справлялась неплохо. Не очень сложные задачи выполнялись хорошо. Писал про это тут.

А что если новая Banana теперь даёт больше возможностей в редактировании и доработке текстур? Я решил проверить, и мои ожидания оправдались. Новая модель не только начала справляться с более сложными задачами по редактированию текстур, но и научилась делать дополнительные карты. То есть, если в прошлый раз многие говорили, что этот метод с генерацией одной текстуры подходит далеко не для всех пайплайнов и что делать с дополнительными картами, то сейчас и этот вопрос начинает решаться. Хотите карту нормалей - без проблем, может быть карты оклюзии - без проблем, карту металика - без проблем. Да, всё ещё не идеально, результат можно получить не с первого раза, но в общем только представьте, что по одному запросу вы сможете сгенерировать любую карту, которая вам нужна для модели. И мы только в самом начале пути.

На сложных задачах, понятно, что косячит (чем сложнее развертка), но простые и средней сложности задачи уже можно решать. Не нужно скульптить или делать под сабдив модели, чтобы снять нужные карты. Достаточно иметь карту альбедо (изображение, которое определяет базовый цвет поверхности модели без теней и бликов) и, задав промпт, получить то, что нужно.

Также можно сгенерировать бесшовную текстуру для объекта и догенерировать любую дополнительную карту для неё.

Просто, быстро!💪

В общем, из плюсов - управляемость и послушность промпту действительно стали очень крутыми. Даже придумывать ничего не нужно: просто пишешь, например, «вдави стенки у сундука больше», и модель оставляет всё изображение, а стенки действительно вдавливает. Т.е., хирургические правки делаются легко и просто. В предыдущей версии Banana были проблемы с ракурсами - приходилось очень сильно изворачиваться, чтобы модель изменила положение объекта. Также были сложности с переносом стиля или, например, перенос одежды с одного персонажа на другого, если их пропорции имели значительные различия.

Конечно, не обходится без проблем. Как и писал ранее, не всегда можно получить результат (особенно сложный), поэтому помогает итерационный подход: не пытаться внести все правки сразу, а разделять их на этапы. Остаются и специфические трудности, как и в предыдущих версиях. Если помните, раньше модели «сходили с ума» при генерации людей вверх ногами - получались очень интересные результаты. Сейчас эту проблему давно решили, но если рассматривать пример с текстурами, часто текст может быть отражён, и даже Nano Banana Pro пока что не всегда понимает, как отразить текст. Я уже писал о том, как можно этого избежать, в прошлых постах.

Есть и плюсы: по крайней мере, модель пытается.🙂 Например, у меня было несколько одинаковых отражённых надписей. В некоторых случаях модель правильно отражала хотя бы одну, но обе отражённые надписи мне сделать так и не удалось. Возможно, итерационно с графическими подсказками можно добиться результата - сначала для одной надписи, потом для другой. Но, уже, проще сделать это вручную в Photoshop, поэтому существенной разницы нет. Тут ещё стоит уточнить, ни одна модель пока не понимает этого, а Banana Pro уже понимает, но пока не до конца.

P.S.Пока платно и на многих агрегаторах очень дорого. Надеюсь, скоро раскатают больше и на бесплатных пользователей. Так же как и всегда нужен VPN.

P.P.S. Всем хорошего завершения недели и отличных выходных. ❤️

@VAI_ART
#VAI_Practice
Please open Telegram to view this post
VIEW IN TELEGRAM
9👍5🔥4👎1
Новостей немного за неделю. Пару новых генераторов картинок, пару новых видео генераторов, но они не дают ничего нового по сравнению с уже существующими моделями, а зачастую и отстают от лидеров рынка. Поэтому нет смысла писать. Также вышел DeepSeek-Math-V2. Лучший в математике, но на этом плюсы заканчиваются.

На этой неделе особенно кратко.

🔹 Flux 2 вышла в релиз. Писал про нее тут. Немного ещё допишу своих мыслей. Я давно ждал этот релиз, так как вся тема с редактированием и доработкой нормально началась с первой модели, и она, вышедшая полгода назад, была своеобразным прорывом. Но из тестов, которые видел и сам делал, она сильно уступает Banana Pro. Она находится где-то на уровне первой Banana. Но и там из-за плюсов того, что Banana работает на базе LLM (в случае с первой — на версии Gemini 2.5), в понимании и простоте в работе я бы отдал победу той же Banana.

Из плюсов в линейке, как и в первой версии, есть открытая модель для общего использования. Можно поставить и генерировать у себя или развернуть в облаке. Что, в свою очередь, может быть полезно тем, кто не хочет, чтобы их информация и данные где-то появились.

🔹 Вышла Claude Opus 4.5. Писал тут. Вечно можно наблюдать, как горит огонь, течёт вода и как каждую неделю выходит новая LLM-модель, которая рвёт все предыдущие модели.

🔹 Hunyuan 3D Studio 1.1. Первая версия вышла месяца полтора назад. Тут целый комбайн с 3D. Работает пока сыровато, но есть и полезные вещи, которые могут ускорить процессы. Сейчас вышла обновленная версия, и пишут, что решили проблемы с топологией моделей. Пока не тестировал, но видео (которое в комментариях) выглядит хорошо.

@VAI_ART
#VAI_News
👍31
This media is not supported in your browser
VIEW IN TELEGRAM
Немного юмора, а то очень серьезно тут все :)

Всем отличной недели! 🙂
Please open Telegram to view this post
VIEW IN TELEGRAM
😁15😱1
Media is too big
VIEW IN TELEGRAM
Ладно, воспользуюсь правом админа и размещу тут вакансию. Частить не буду, но какие-то вакансии, которые сложно закрываются, буду через свои каналы дублировать.

Нам требуется FX-артист в Unity. Знаю, что тут много ребят с геймдева или около него. Может, кто-то захочет или посоветует хорошего знакомого за шоколадку 😀.

У нас на проекте накопился стек задач, которые нужно выполнить, и внутренними силами не справляемся с объёмом. Пока работа на фрилансе, условия и оплату давайте обговорим в личке.

Спасибо за внимание!

P.S. Заодно посмотрите трейлер, который делали 2 года назад и который мало кто видел, но это не дело 🤓.

UPD. Вакансию закрыл. Всем спасибо за отклики! ❤️

@VAI_ART
#Vacancies
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥43