Ну что, ещё один год позади. В нём было много хорошего и, как в любом году, хватало и плохого. Следующий год будет примерно таким же: в нём тоже будет много хорошего и не обойдётся без плохих дней. Желаю вам меньше пропускать через себя плохое и больше акцентироваться на хорошем.
В области ИИ, судя по тенденциям, всё будет ещё жёстче, чем в этом году: скорость появления новых релизов, похоже, продолжит расти в гонке за вниманием со стороны крупных компаний. Поэтому сил и терпения нам всем, чтобы не утонуть в потоке информации и остаться на плаву.
А я буду тут и дальше стараться делиться с вами новой информацией, фишками и способами применения ИИ в работе и в жизни.
В следующем году постараюсь переделать структуру и подачу в группе. Планов много. Спасибо за доверие!
Всех обнял!🤗
С наступающим Новым годом!🦄
@VAI_ART
#VAI_Notes
В области ИИ, судя по тенденциям, всё будет ещё жёстче, чем в этом году: скорость появления новых релизов, похоже, продолжит расти в гонке за вниманием со стороны крупных компаний. Поэтому сил и терпения нам всем, чтобы не утонуть в потоке информации и остаться на плаву.
А я буду тут и дальше стараться делиться с вами новой информацией, фишками и способами применения ИИ в работе и в жизни.
В следующем году постараюсь переделать структуру и подачу в группе. Планов много. Спасибо за доверие!
Всех обнял!
С наступающим Новым годом!
@VAI_ART
#VAI_Notes
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12❤3🔥3🎉1🤗1
Пока полмира доедает салаты и отдыхает, новостей немного, но всё‑таки пробежимся по тому, что произошло в мире ИИ.
🔹 Еще недавно вышла Qwen-Image-2511.Писал в новостях ранее. Как, практически через неделю выходит 2512. Пишут, что еще лучше работает с деталями, материалами и текстом. Протестировать можно тут и тут. Модель тут. Презентация в комментариях.
🔹 В линейке FLUX.2 [dev] появился Turbo. Но это не официальный релиз, а дистилят от FAL.ai, который выдает такое же качество при меньших шагах. По сути открытые модели этим и хороши, что их потом можно дорабатывать, настраивать уже под себя и свои ресурсы. В этом, конечно, они выигрывают перед закрытыми. Модель выложили тут.
🔹 Meta покупает Manus за $2 млрд. Громкая сделка конца года. Meta (Facebook) приобрела стартап Manus, который прославился созданием «универсального ИИ-агента», способного выполнять задачи в браузере так же, как человек.
Видим как крупные компании начинают поглощать конкурентов или выкупать команды, которые делают решения, отсутствующие в их собственной линейке продуктов.
Движемся дальше!💪
@VAI_ART
#VAI_News
🔹 Еще недавно вышла Qwen-Image-2511.Писал в новостях ранее. Как, практически через неделю выходит 2512. Пишут, что еще лучше работает с деталями, материалами и текстом. Протестировать можно тут и тут. Модель тут. Презентация в комментариях.
🔹 В линейке FLUX.2 [dev] появился Turbo. Но это не официальный релиз, а дистилят от FAL.ai, который выдает такое же качество при меньших шагах. По сути открытые модели этим и хороши, что их потом можно дорабатывать, настраивать уже под себя и свои ресурсы. В этом, конечно, они выигрывают перед закрытыми. Модель выложили тут.
🔹 Meta покупает Manus за $2 млрд. Громкая сделка конца года. Meta (Facebook) приобрела стартап Manus, который прославился созданием «универсального ИИ-агента», способного выполнять задачи в браузере так же, как человек.
Видим как крупные компании начинают поглощать конкурентов или выкупать команды, которые делают решения, отсутствующие в их собственной линейке продуктов.
Движемся дальше!
@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤1
Продолжаю тему применения ИИ при создании концептов. Ранее я писал про персонажей, а теперь затрону тему концептирования локаций.
Сейчас мы вовсю делаем детские режимы для наших игр, поэтому и стиль, и тематика концептов ориентированы на детскую аудиторию.
Инструменты ИИ развиваются каждый день, и пайплайны можно менять так же часто. Раньше я уже пробовал создавать локации через ИИ, но тогда модели просто «не вывозили» объем контекста. Все ломалось, особенно когда нужно было сделать что-то логичное: концепт превращался в «кашу». Но сейчас ситуация изменилась: новые инструменты позволяют заметно ускорить разработку. Положительные сдвиги начались еще с Nano Banana - даже она показывала неплохой результат, но с Pro-версией всё стало намного лучше.🔥
Я использую первую версию в AI Studio, так как там дают много бесплатных попыток в день: генерируя целый день с двумя Google-аккаунтами, я даже не успеваю израсходовать лимиты. А для Nano Banana Pro я купил подписку Gemini Pro. Там, помимо самой Gemini 3, можно прямо в чате генерировать изображения (Banana Pro) и видео в VEO 3.1. Минус в том, что в режиме чата Banana портит изображения: уже после 2-3 итераций картинка начинает сильно «шуметь». Поэтому в таком режиме приходится работать очень аккуратно.
И там и там нужен VPN.
Перейдем к самому процессу.
На старте как я вижу можно использовать разные подходы:
1️⃣ Набросок от руки: лайн или простенький скетч сразу в цвете.
2️⃣ Работа от референсов: собрать исходники, подходящие по стилю/качеству, и на их основе сделать первый вариант.
3️⃣ Комбинированный вариант: для более жесткого контроля (но и более трудозатратный) - сделать лайн и цвет, а затем отрендерить в нужной стилистике.
Все, как обычно, зависит от требуемого финального результата.
Для этой задачи я выбрал самый простой (на мой взгляд) способ: собрал референсы и работал с ними.
Конечно, не обошлось без косяков - кое-где пришлось «пробежаться» руками и доделать детали. Но это минимальная работа.🤓
Сама локация тоже не финальная. Она скорее служит для понимания атмосферы, а итоговая версия будет выглядеть немного иначе. Покажу её уже после того, как соберём всё в Unity.
Технически пайплайн можно миксовать как угодно: тут всё, как и в промптинге, основано на фантазии и опыте.
Сейчас техническая реализация уже не является проблемой. Основная сложность - это идея. Если она есть, реализовать ее теперь не сложно.
Интересно послушать, как вы справляетесь с подобными задачами в новых реалиях?🧐
P.S. Дальше по плану обсудим, как генерировать локации и персонажей в 3D и собирать их. Покажу на примере движка Unity.
P.P.S. Также закинул в комментарии еще один промежуточный вариант концепта, который не утвердили и другое освещение по рабочей локации.
@VAI_ART
#VAI_Practice
Сейчас мы вовсю делаем детские режимы для наших игр, поэтому и стиль, и тематика концептов ориентированы на детскую аудиторию.
Инструменты ИИ развиваются каждый день, и пайплайны можно менять так же часто. Раньше я уже пробовал создавать локации через ИИ, но тогда модели просто «не вывозили» объем контекста. Все ломалось, особенно когда нужно было сделать что-то логичное: концепт превращался в «кашу». Но сейчас ситуация изменилась: новые инструменты позволяют заметно ускорить разработку. Положительные сдвиги начались еще с Nano Banana - даже она показывала неплохой результат, но с Pro-версией всё стало намного лучше.
Я использую первую версию в AI Studio, так как там дают много бесплатных попыток в день: генерируя целый день с двумя Google-аккаунтами, я даже не успеваю израсходовать лимиты. А для Nano Banana Pro я купил подписку Gemini Pro. Там, помимо самой Gemini 3, можно прямо в чате генерировать изображения (Banana Pro) и видео в VEO 3.1. Минус в том, что в режиме чата Banana портит изображения: уже после 2-3 итераций картинка начинает сильно «шуметь». Поэтому в таком режиме приходится работать очень аккуратно.
И там и там нужен VPN.
Перейдем к самому процессу.
На старте как я вижу можно использовать разные подходы:
1️⃣ Набросок от руки: лайн или простенький скетч сразу в цвете.
2️⃣ Работа от референсов: собрать исходники, подходящие по стилю/качеству, и на их основе сделать первый вариант.
3️⃣ Комбинированный вариант: для более жесткого контроля (но и более трудозатратный) - сделать лайн и цвет, а затем отрендерить в нужной стилистике.
Все, как обычно, зависит от требуемого финального результата.
Для этой задачи я выбрал самый простой (на мой взгляд) способ: собрал референсы и работал с ними.
🔹 Закинул референсы в Banana и попросил на их основе создать изометрическую локацию.
🔹 Получив первый результат, начал его дорабатывать. Для этого использовал новый инструмент Qwen-Image-Layered (писал о нем ранее). Модель открытая, ее можно запустить локально или найти демки на Hugging Face. Суть в том, что она разбивает изображение на слои. Пусть слои не идеальные, но это уже слои!
🔹 Я подвигал элементы, поправил композицию, что-то удалил или быстро подрисовал (не особо стараясь, так как это набросок).
🔹 Снова закинул результат в Banana и попросил исправить рендер, вписав элементы в окружение.
🔹 Когда концепт начал меня устраивать, я обсудил его с командой. Убедившись, что это то, что нужно, перешел к детализации: добавил трубы, телевизор, телефон и прочее. Добавлял через маски: рисовал силуэт в нужной зоне и просил сгенерировать объект, соблюдая форму и стилистику.
🔹Получившийся результат прогнал через апскейлер. В моем случае это был Topaz (я пользуюсь им через Krea, но есть и другие варианты).
Конечно, не обошлось без косяков - кое-где пришлось «пробежаться» руками и доделать детали. Но это минимальная работа.
Сама локация тоже не финальная. Она скорее служит для понимания атмосферы, а итоговая версия будет выглядеть немного иначе. Покажу её уже после того, как соберём всё в Unity.
Технически пайплайн можно миксовать как угодно: тут всё, как и в промптинге, основано на фантазии и опыте.
Сейчас техническая реализация уже не является проблемой. Основная сложность - это идея. Если она есть, реализовать ее теперь не сложно.
Интересно послушать, как вы справляетесь с подобными задачами в новых реалиях?
P.S. Дальше по плану обсудим, как генерировать локации и персонажей в 3D и собирать их. Покажу на примере движка Unity.
P.P.S. Также закинул в комментарии еще один промежуточный вариант концепта, который не утвердили и другое освещение по рабочей локации.
@VAI_ART
#VAI_Practice
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍12🔥4❤2🦄2⚡1
Все еще видимо отдыхают, но всё‑таки стоит пробежаться по интересным новостям за неделю:
🔹 Недели 2 назад вышел Qwen-Image-Edit-2511. Уже несколько раз писал про него. Qwen-Image-Edit-2511-Multiple-Angles-LoRA - это дополнительная «надстройка» (LoRA) к модели Qwen Image Edit 2511, которая позволяет из одной картинки получать тот же объект с разных ракурсов: спереди, сбоку, сзади, сверху или снизу, с контролем расстояния и угла «виртуальной камеры» для более точных и предсказуемых ракурсов. Не со всеми входными данными работает нормально, но все же интересный инструмент. Попробовать тут. Скачать тут. Пример в комментариях.
🔹 OpenAI запустила ChatGPT Health - отдельный раздел ChatGPT для общения про здоровье, который делали вместе с врачами и протестировали на ~600 000 оценок от 260+ докторов за два года. Он не ставит диагнозы и не заменяет врача, а помогает разобрать анализы, данные трекеров и даёт базовые рекомендации. Раздел работает в изолированной памяти с усиленным шифрованием, чаты из него не используют для обучения моделей, а при желании можно подключить Apple Health, MyFitnessPal, Peloton и другие сервисы, но доступен он пока только пользователям с аккаунтом США. Дальше раскатают на всех. Работает с американским VPN.
🔹 Higgsfield хоть последнее время и не радует, но иногда может и удивлять. Relight - это инструмент, который позволяет вам управлять светом в уже снятом видео так, будто вы находитесь в настоящей киностудии. Вы можете добавить виртуальную лампу с любой стороны, изменить её яркость или цвет, а нейросеть сама «дорисует» реалистичные тени и блики на лицах и предметах. В отличие от обычных фильтров, она понимает объем сцены, поэтому свет ложится естественно, позволяя превратить даже обычное видео с телефона в качественный ролик с профессиональным «киношным» освещением. С виду все еще как игрушка, как инструменты типа Runway Aleph, но выглядит интересно. Презентация в комментариях.
🔹 Hunyuan обновил свою линейку 3d до версии 3.1. Обещают:
@VAI_ART
#VAI_News
🔹 Недели 2 назад вышел Qwen-Image-Edit-2511. Уже несколько раз писал про него. Qwen-Image-Edit-2511-Multiple-Angles-LoRA - это дополнительная «надстройка» (LoRA) к модели Qwen Image Edit 2511, которая позволяет из одной картинки получать тот же объект с разных ракурсов: спереди, сбоку, сзади, сверху или снизу, с контролем расстояния и угла «виртуальной камеры» для более точных и предсказуемых ракурсов. Не со всеми входными данными работает нормально, но все же интересный инструмент. Попробовать тут. Скачать тут. Пример в комментариях.
🔹 OpenAI запустила ChatGPT Health - отдельный раздел ChatGPT для общения про здоровье, который делали вместе с врачами и протестировали на ~600 000 оценок от 260+ докторов за два года. Он не ставит диагнозы и не заменяет врача, а помогает разобрать анализы, данные трекеров и даёт базовые рекомендации. Раздел работает в изолированной памяти с усиленным шифрованием, чаты из него не используют для обучения моделей, а при желании можно подключить Apple Health, MyFitnessPal, Peloton и другие сервисы, но доступен он пока только пользователям с аккаунтом США. Дальше раскатают на всех. Работает с американским VPN.
🔹 Higgsfield хоть последнее время и не радует, но иногда может и удивлять. Relight - это инструмент, который позволяет вам управлять светом в уже снятом видео так, будто вы находитесь в настоящей киностудии. Вы можете добавить виртуальную лампу с любой стороны, изменить её яркость или цвет, а нейросеть сама «дорисует» реалистичные тени и блики на лицах и предметах. В отличие от обычных фильтров, она понимает объем сцены, поэтому свет ложится естественно, позволяя превратить даже обычное видео с телефона в качественный ролик с профессиональным «киношным» освещением. С виду все еще как игрушка, как инструменты типа Runway Aleph, но выглядит интересно. Презентация в комментариях.
🔹 Hunyuan обновил свою линейку 3d до версии 3.1. Обещают:
● Поддержка 8 ракурсов (Multi-view). В отличие от версии 3.0, которая работала с 4 изображениями, версия 3.1 поддерживает ввод до 8 фотографий одного объекта. Это позволяет создавать 3D-модели с почти идеальной геометрией без «слепых зон».
● Текстовая анимация (HY-Motion 1.0). В модель встроили движок анимации. Теперь можно не просто создать 3D-персонажа, но и задать ему движение через текст (например, «персонаж делает сальто»). Модель генерирует скелетную анимацию, готовую для экспорта в FBX.
● Smart Topology. Улучшена работа с сеткой. Нейросеть теперь генерирует более чистую топологию (включая поддержку квадов), что упрощает ретопологию для использования в Unreal Engine или Unity.
@VAI_ART
#VAI_News
❤9👍4
Сегодня каналу исполняется ровно год!🔥 Интересный опыт. Пожалел ли я о том, что начал это? Честно скажу, не раз. 😁 Но во всём есть и плюсы: я стал намного лучше разбираться в сфере ИИ, что логично. А постоянный мониторинг новых ИИ‑инструментов позволяет оставаться на волне и понимать, что происходит на рынке.
Надеюсь и вам чем то помог.
Сделал анализ канала за год. Больше всего удивило 110 т. просмотров. Это лично для меня очень круто.
В этом году планов много (о них позже). Рвём дальше! 🚀🚀🚀
@VAI_ART
#VAI_Notes
Надеюсь и вам чем то помог.
Сделал анализ канала за год. Больше всего удивило 110 т. просмотров. Это лично для меня очень круто.
В этом году планов много (о них позже). Рвём дальше! 🚀🚀🚀
@VAI_ART
#VAI_Notes
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥25👍7❤5🎉3
Ниже - пока еще редкая, но уже полноценная рубрика!
Спасибо всем, кто пишет и делится своими наработками и решениями.🙌
Отчасти этот канал и создавался для того, чтобы обсуждать новые технологии и делиться опытом их применения.
Спасибо всем, кто пишет и делится своими наработками и решениями.
Отчасти этот канал и создавался для того, чтобы обсуждать новые технологии и делиться опытом их применения.
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Fast 2D Render
Всем привет! Прежде всего, огромное спасибо Алексею, автору канала VAI за возможность поделиться своими наработками здесь.
Я собрал воркфлоу способный сократить время на технический рендер, не теряя при этом авторского контроля над формой. Воркфлоу работает на базе Nano Banana Pro + ComfyUI + Photoshop.
Как это работает:
Дизайн и композиция остаются полностью за художником. Инструмент берет на себя монотонную работу, оставляя нам самое интересное - творчество и поиск идей. Буду рад, если мой опыт окажется кому-то полезен!
Если возникнут вопросы, автора воркфлоу можно найти здесь.
@VAI_ART
#VAI_Authors
Всем привет! Прежде всего, огромное спасибо Алексею, автору канала VAI за возможность поделиться своими наработками здесь.
Я собрал воркфлоу способный сократить время на технический рендер, не теряя при этом авторского контроля над формой. Воркфлоу работает на базе Nano Banana Pro + ComfyUI + Photoshop.
Как это работает:
◻️ Вы задаете силуэт и дизайн через лайнарт и простую заливку (или 3D).
◻️ Цвет берется из заливки, а фактуры - из ваших референсов (будь то старый металл, камень или бумага).
◻️ Играть и чередовать заливку и материалы.
Дизайн и композиция остаются полностью за художником. Инструмент берет на себя монотонную работу, оставляя нам самое интересное - творчество и поиск идей. Буду рад, если мой опыт окажется кому-то полезен!
Если возникнут вопросы, автора воркфлоу можно найти здесь.
@VAI_ART
#VAI_Authors
🔥8👍7❤3🗿2⚡1
Мир понемногу просыпается и релизов стало значительно больше. Новостная рубрика.Погнали!
🔹 Anthropic (те кто делаю Claude)выпкустили Cowork. Cowork - это новый «агентский» режим в приложении Claude для компьютера (сейчас только macOS),который работает напрямую с вашими локальными данными.Вы даете ему доступ к конкретной папке, и он превращается в полноценного напарника: сам сканирует файлы,вносит правки в код, создает новые документы или наводит порядок в ассетах,не заставляя вас копировать текст в чат и обратно.В отличие от обычного диалога,Cowork действует автономно - он составляет план задачи и последовательно выполняет его прямо у вас на диске,запрашивая подтверждение только для важных действий,что фактически дает нейросети «руки» внутри вашей операционной системы.
Вообще последнее время очень много новостей про Claude Code.Например
один пользователь за рождественские каникулы создал полный оптимизирующий компилятор: 594 коммита, 3272 теста, 74 тысячи строк кода.Всё написал СС. Так же инженер из команды Gemini API в Google,написала что дала СС трёхабзацное описание проблемы - он за час сгенерировал то,что её команда строила в прошлом году.
Презентация в коментариях.
🔹 OpenAI реши конкурировать с Google (много где, список всех их проектов достаточно внушительный) и выпустили свой полноценный переводчик,который поддерживает 50 языков.Можно менять стиль перевода от разговорного до официального, но пока только текст. Изображения и аудио ввод обещают чуть позже.
🔹 Google практически одновременно с OpenAI выпустили TranslateGemma TranslateGemma - это узкоспециализированная «открытая» нейросеть от Google,созданная исключительно для максимально точного и качественного перевода.Модели поставляется сразу в трех вариантах (4B, 12B и 27B параметров): это позволяет гибко выбрать модель под любую мощность - от простого ноутбука до мощного сервера. В отличие от универсальных чат-ботов,она сфокусирована только на лингвистике, поэтому лучше справляется со сложным контекстом,техническими терминами и сохранением смысла в длинных текстах, при этом оставаясь достаточно компактной для запуска прямо на вашем локальном компьютере. Это идеальный и бесплатный инструмент для тех, кому нужна качественная локализация проектов или приватный перевод документов без необходимости отправлять данные в облако.Скачать локально тут, тут и тут.
🔹 FLUX.2 [klein] - это новое семейство ИИ-моделей для генерации изображений от Black Forest Labs. Название «klein» переводится как «маленький», и это главная фишка: модель настолько быстрая и компактная, что способна создавать или редактировать картинки меньше чем за секунду прямо на обычном домашнем компьютере. Модель объединяет в себе сразу две функции - генерацию по тексту и глубокое редактирование готовых фото (можно менять объекты или стили), при этом младшая версия (4B) полностью открыта и бесплатна для использования. По сути, это профессиональный инструмент, который «летает» даже на средних видеокартах, сохраняя при этом фотореалистичное качество и умение идеально прорисовывать текст. Попробовать тут. Скачать тут и тут.
🔹 Это должно было когда то произойти и произошло.Как говорится первый прецедент, дальше, думаю этот начнется идти у всех по накатанной.OpenAI заявили, что начинают вводить рекламу для бесплатного и тарифа за 8$(раньше были только для Индии, сейчас раскатали на всех).Ничего хорошего нет, теперь, скорее всего ИИ начнет заполнять реклама.
🔹 Появился новый апскейлер видео Crystal Upscaler.Есть Topaz, но он не дешевый, и вот появилась альтернатива.Его фишка в том, что при соотносимом качекстве, он намного дешевле. Стоимость от $0.10/сек за 720p до $0.80/сек за 4K.Попробовать можно на разных агрегаторах типа Replicate и тд.
🔹 И на последок, Higgsfield представила новую фишку под названием «Что было дальше?».Загружаете изображение, а нейросеть предлагает 8 вариантов развития сюжета. Можете выбираете лучший, также сделать апскейл картинки или использовать ее для анимации.Выглядит как игрушка, но интересная игрушка.Презентация в комментариях.
@VAI_ART
#VAI_News
🔹 Anthropic (те кто делаю Claude)выпкустили Cowork. Cowork - это новый «агентский» режим в приложении Claude для компьютера (сейчас только macOS),который работает напрямую с вашими локальными данными.Вы даете ему доступ к конкретной папке, и он превращается в полноценного напарника: сам сканирует файлы,вносит правки в код, создает новые документы или наводит порядок в ассетах,не заставляя вас копировать текст в чат и обратно.В отличие от обычного диалога,Cowork действует автономно - он составляет план задачи и последовательно выполняет его прямо у вас на диске,запрашивая подтверждение только для важных действий,что фактически дает нейросети «руки» внутри вашей операционной системы.
Вообще последнее время очень много новостей про Claude Code.Например
один пользователь за рождественские каникулы создал полный оптимизирующий компилятор: 594 коммита, 3272 теста, 74 тысячи строк кода.Всё написал СС. Так же инженер из команды Gemini API в Google,написала что дала СС трёхабзацное описание проблемы - он за час сгенерировал то,что её команда строила в прошлом году.
Презентация в коментариях.
🔹 OpenAI реши конкурировать с Google (много где, список всех их проектов достаточно внушительный) и выпустили свой полноценный переводчик,который поддерживает 50 языков.Можно менять стиль перевода от разговорного до официального, но пока только текст. Изображения и аудио ввод обещают чуть позже.
🔹 Google практически одновременно с OpenAI выпустили TranslateGemma TranslateGemma - это узкоспециализированная «открытая» нейросеть от Google,созданная исключительно для максимально точного и качественного перевода.Модели поставляется сразу в трех вариантах (4B, 12B и 27B параметров): это позволяет гибко выбрать модель под любую мощность - от простого ноутбука до мощного сервера. В отличие от универсальных чат-ботов,она сфокусирована только на лингвистике, поэтому лучше справляется со сложным контекстом,техническими терминами и сохранением смысла в длинных текстах, при этом оставаясь достаточно компактной для запуска прямо на вашем локальном компьютере. Это идеальный и бесплатный инструмент для тех, кому нужна качественная локализация проектов или приватный перевод документов без необходимости отправлять данные в облако.Скачать локально тут, тут и тут.
🔹 FLUX.2 [klein] - это новое семейство ИИ-моделей для генерации изображений от Black Forest Labs. Название «klein» переводится как «маленький», и это главная фишка: модель настолько быстрая и компактная, что способна создавать или редактировать картинки меньше чем за секунду прямо на обычном домашнем компьютере. Модель объединяет в себе сразу две функции - генерацию по тексту и глубокое редактирование готовых фото (можно менять объекты или стили), при этом младшая версия (4B) полностью открыта и бесплатна для использования. По сути, это профессиональный инструмент, который «летает» даже на средних видеокартах, сохраняя при этом фотореалистичное качество и умение идеально прорисовывать текст. Попробовать тут. Скачать тут и тут.
🔹 Это должно было когда то произойти и произошло.Как говорится первый прецедент, дальше, думаю этот начнется идти у всех по накатанной.OpenAI заявили, что начинают вводить рекламу для бесплатного и тарифа за 8$(раньше были только для Индии, сейчас раскатали на всех).Ничего хорошего нет, теперь, скорее всего ИИ начнет заполнять реклама.
🔹 Появился новый апскейлер видео Crystal Upscaler.Есть Topaz, но он не дешевый, и вот появилась альтернатива.Его фишка в том, что при соотносимом качекстве, он намного дешевле. Стоимость от $0.10/сек за 720p до $0.80/сек за 4K.Попробовать можно на разных агрегаторах типа Replicate и тд.
🔹 И на последок, Higgsfield представила новую фишку под названием «Что было дальше?».Загружаете изображение, а нейросеть предлагает 8 вариантов развития сюжета. Можете выбираете лучший, также сделать апскейл картинки или использовать ее для анимации.Выглядит как игрушка, но интересная игрушка.Презентация в комментариях.
@VAI_ART
#VAI_News
👍6❤4
Также показывает стоимость генераций, является ли модель открытой или закрытой и тд.
Помогает всегда быть в курсе и не тратить кучу времени на поиск информации!
Из минусов - не заходит без VPN.
P.S. Лично для меня стало новостью, что ElevenLabs - на втором месте, а на первом - Aura Stella (первый раз слышу))
@VAI_ART
#VAI_Notes
Please open Telegram to view this post
VIEW IN TELEGRAM
LLM Stats
AI Leaderboards 2026 - Compare All AI Models
Comprehensive AI leaderboards comparing LLM, TTS, STT, video, image, and embedding models. Compare performance, pricing, and capabilities.
👍7🔥3⚡2❤1
Уже писал про создание концепта персонажей и локации.Сейчас по плану, как и обещал,создание модели персонажа.
У нас используется только часть пайплайна через ИИ.Но даже эта часть ускоряет работу.
Сейчас уже можно еще больше внедрить ИИ в процессы.Есть идеи,но пока не добрался,так как те процессы реализовывались уже месяца 2-3 назад,а в эру ИИ это соизмеримо с несколькими годами ранее без ИИ в процессах.На новых персонажах уже попробую докрутить процессы и еще сильнее их оптимизировать.Опишу позже,как доберусь.
Создание персонажей все еще остается достаточно сложной с творческой и технической стороны задачей.Но сейчас современные технологии уже помогают ее решить.🔥
Можно:
1️⃣ Генерировать 3D под обрисовку. Сейчас генераторы практически идеально подходят под этот тип задач. Художники, которым было лень учить 3D,ваш день уже давно настал)
2️⃣ Для несложных проектов в техническом плане.Это подходит для таких проектов, как у нас,где больше важна подача,с которой генераторы уже неплохо справляются.А в совокупности с той же Nano Banana можно вытащить карты нормалей, рафнеса и т.д.Для несложных проектов сделать это уже можно.Писал тут.
3️⃣ Для сложных проектов.Зачастую большой пласт работы составляет скульпт и попадание в нужные формы. На таких проектах скульпты могут делать по несколько недель.При помощи генераторов даже сейчас можно сократить это время в раза два, сэкономив приличный пласт времени. Да,где-то он может ошибаться в формах, но в общем, при обладании нормальными скиллами,это не проблема исправить
Мы продолжаем развивать наши детские режимы и так же создавать для них персонажей.🐶
Как выглядит пайплайн:
Модель этой собаки была сделана за 2 дня.Это от генерации до финального результата.
Из нюансов:у нас нет лицевого рига, поэтому и авторетоп,по сути, нормально подошел.🤓
С виду кажется,что работа ИИ была незначительная.Но это не так.ИИ решил одну из основных проблем,а именно - попадание в характер персонажа.Люди,которые работают в этой сфере,понимают,что это один из основных моментов в создании персонажа,и зачастую на него может тратиться большая часть времени,так как это творческий процесс и многое зависит от скиллов.С технической частью уже все давно понятно,это измеримый процесс,а вот творчество пока мало чем измеряется и является субъективным.
Как вы справляетесь с подобными задачами в современных условиях.
Дальше поговорим про генерацию локаций.😎
@VAI_ART
#VAI_Practice
У нас используется только часть пайплайна через ИИ.Но даже эта часть ускоряет работу.
Сейчас уже можно еще больше внедрить ИИ в процессы.Есть идеи,но пока не добрался,так как те процессы реализовывались уже месяца 2-3 назад,а в эру ИИ это соизмеримо с несколькими годами ранее без ИИ в процессах.На новых персонажах уже попробую докрутить процессы и еще сильнее их оптимизировать.Опишу позже,как доберусь.
Создание персонажей все еще остается достаточно сложной с творческой и технической стороны задачей.Но сейчас современные технологии уже помогают ее решить.
Можно:
1️⃣ Генерировать 3D под обрисовку. Сейчас генераторы практически идеально подходят под этот тип задач. Художники, которым было лень учить 3D,ваш день уже давно настал)
2️⃣ Для несложных проектов в техническом плане.Это подходит для таких проектов, как у нас,где больше важна подача,с которой генераторы уже неплохо справляются.А в совокупности с той же Nano Banana можно вытащить карты нормалей, рафнеса и т.д.Для несложных проектов сделать это уже можно.Писал тут.
3️⃣ Для сложных проектов.Зачастую большой пласт работы составляет скульпт и попадание в нужные формы. На таких проектах скульпты могут делать по несколько недель.При помощи генераторов даже сейчас можно сократить это время в раза два, сэкономив приличный пласт времени. Да,где-то он может ошибаться в формах, но в общем, при обладании нормальными скиллами,это не проблема исправить
Мы продолжаем развивать наши детские режимы и так же создавать для них персонажей.🐶
Как выглядит пайплайн:
🔹 Загоняю концепт в 3D-генератор.Я считаю,что по цене/качеству сейчас все еще в топе Hunyuan 3D.Качество моделей получается неплохим а в совокупности с тем,что они дополнительно дают 20 генераций в день,делает модель в глазах бесплатных и экономных пользователей вообще «золотой».
🔹 Получаю полноценную модель персонажа.Беру с персонажа только голову.Тут и возникает момент,про который писал ранее.Когда делали раньше,было сложновато подогнать тела под нужные типы и стилистику, поэтому мы в большей части ориентировались на характер персонажа.А само тело делали руками.
🔹 Заранее была сделана болванка тела, которая отображала все нюансы, которые нам были нужны в пропорциях и сетке.Далее в планах было подгонять эту болванку под каждого персонажа,немного дорабатывая массы и формы.Если налажу процесс с созданием полноценных концептов с нужными пропорциями,то модель с сеткой можно будет просто проецировать на сгенерированную модель и быстро получать модель с правильной сеткой и правильными массами.
🔹 Голова была сделана авторетопом и немного доработана руками.
🔹 Быстро развернул тело,так как там нет ничего сложного.
🔹 Соединил голову с телом и добавил ошейник для того,чтобы не было видно шва соединения,так как сетка немного отличалась.
🔹 Текстура головы также была спроецирована со сгенерированной модели и доработана в редакторе,а вот тело было покрашено руками полностью.Но,опять же,модели простые, поэтому проблем больших не было.
🔹 Получил готовую модель.
🔹 Обвесы(одежда,часы,цепи и т.д.),которые на концептах,планирую делать отдельными объектами с отдельной текстурной картой,так как планируется сделать их много для каждого персонажа.
Модель этой собаки была сделана за 2 дня.Это от генерации до финального результата.
Из нюансов:у нас нет лицевого рига, поэтому и авторетоп,по сути, нормально подошел.
С виду кажется,что работа ИИ была незначительная.Но это не так.ИИ решил одну из основных проблем,а именно - попадание в характер персонажа.Люди,которые работают в этой сфере,понимают,что это один из основных моментов в создании персонажа,и зачастую на него может тратиться большая часть времени,так как это творческий процесс и многое зависит от скиллов.С технической частью уже все давно понятно,это измеримый процесс,а вот творчество пока мало чем измеряется и является субъективным.
Как вы справляетесь с подобными задачами в современных условиях.
Дальше поговорим про генерацию локаций.
@VAI_ART
#VAI_Practice
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11👍8🔥4🤩1
Новостная рубрика за неделю.С небольшой задержкой.Погнали!
🔹3D-генератор Meshy обновился,в новой версии добавили интересную функцию, которая позволяет контролировать позу модели.Загружаете два изображения для генерации и для позы.Ранее они добавили генерацию в А и Т-позах.Пока 3D-генераторы обвешиваются функционалом,но не решают основные проблемы,следим дальше.Презентация в комментариях.
🔹Hunyuan обновил свою 3d Studio до версии 1.2.Если кто-то не знал или позабыл: тут они предоставляют полный пайплайн в 3D с контролем каждой стадии.Думаю,из этого может вырасти что-то интересное,и не удивлюсь,если они первые сделают полный пайплайн в ИИ.Основные нововведения направлены на повышение точности и контроля при создании 3D-ассетов:
Презентация в комментариях.
🔹 Выходит новость про Higgsfield,думаю писать ли,с одной стороны,это бесполезные вещи,а с другой-выглядит прикольно.В этот раз они выпустили конструктор персонажей.Можно создать любое существо, и оно будет консистентно в любом кадре и истории.Если кто не знал,сейчас популярны искусственно созданные персонажи,для которых заводят свои соцсети и развивают аккаунты за счет сгенерированного контента.Поскольку персонажи имеют интересную внешность или какие-то особенности,это хавают).А Higgsfield,как всегда,впереди и предоставляет инструменты для таких вещей.Пару примеров в комментариях.
🔹 Style Morphing в Suno-функция,которая позволяет взять готовый музыкальный фрагмент и «перекрасить» его в любой другой жанр или настроение, сохраняя при этом оригинальную мелодию и гармонию.В отличие от обычной генерации с нуля,морфинг дает возможность превратить,например,медленную фортепианную тему в энергичный рок-хит или техно-трек,просто изменив промпт или темп.
🔹 Runway Gen-4.5 Image to Video,фокусируется на улучшении физики движений и более точном следовании исходному кадру.Модель стала лучше отрабатывать вес и инерцию объектов.Но с Runway, как обычно,презентации хорошии,по итогу что-то невнятное.Пару примеров в комментариях.
🔹 Adobe внедрила ряд функций:Premiere получил интеллектуальный Object Mask для автоматического трекинга объектов в один клик и визуальные маркеры видеопереходов прямо на таймлайне,а After Effects обзавелся нативной 3D-геометрией и поддержкой материалов Substance 3D.Кроме того,значительно ускорился трекинг масок, появилась прямая интеграция с Firefly Boards и долгожданный импорт SVG как редактируемых шейпов.
Adobe радует.Практически единственный из старичков,кто участвует в гонке ИИ.Остальные закрыли глаза и делают вид,что ничего не происходит.
🔹 Krea realtime.Увидел эту новость и вспомнил,практически,ровно год назад была такая же.Но приглядевшись видно,что они его развивают и сделали более интересным в реализации.Теперь можно не просто генерировать с нуля,а редактировать готовые фото или генерации в реальном времени текстом.
🔹 Anthropic выпустили расширение для Claude Code в VS Code.Автономный ИИ-агент от Anthropic для терминала VS Code,который сам изучает ваш проект,правит код,запускает тесты и фиксит баги по текстовой команде,работая как полноценный помощник-разработчик.Сильный конкурент Cursor.
Cursor,тоже выпустил обновление 2.4.Появились Субагенты для параллельного решения задач разными моделями и встроенная генерация картинок через Nano Banana Pro прямо в проект.Также добавили асинхронные Q&A,позволяющие агенту продолжать работу в ожидании вашего ответа,и функцию Cursor Blame,которая детально отслеживает происхождение каждой строки кода (человек или ИИ) с прямой ссылкой на историю соответствующих чатов.
@VAI_ART
#VAI_News
🔹3D-генератор Meshy обновился,в новой версии добавили интересную функцию, которая позволяет контролировать позу модели.Загружаете два изображения для генерации и для позы.Ранее они добавили генерацию в А и Т-позах.Пока 3D-генераторы обвешиваются функционалом,но не решают основные проблемы,следим дальше.Презентация в комментариях.
🔹Hunyuan обновил свою 3d Studio до версии 1.2.Если кто-то не знал или позабыл: тут они предоставляют полный пайплайн в 3D с контролем каждой стадии.Думаю,из этого может вырасти что-то интересное,и не удивлюсь,если они первые сделают полный пайплайн в ИИ.Основные нововведения направлены на повышение точности и контроля при создании 3D-ассетов:
● Для реконструкции используется 8 ракурсов.Это должно помочь с точностью силуэта со всех сторон.
● Добавили интерфейс кистей для правки компонентов прямо в процессе.По задумке,это даст больше контроля над сеткой,но насколько это удобно в реальном пайплайне-вопрос открытый.
● Лимит воксельной сетки подняли до 15363. Это должно улучшить детализацию и разделение модели на части,но «грязную» геометрию само по себе не вылечит.
● Заявляют «уровень скульптинга» и более точную цветопередачу текстур.На презентациях выглядит неплохо.
Презентация в комментариях.
🔹 Выходит новость про Higgsfield,думаю писать ли,с одной стороны,это бесполезные вещи,а с другой-выглядит прикольно.В этот раз они выпустили конструктор персонажей.Можно создать любое существо, и оно будет консистентно в любом кадре и истории.Если кто не знал,сейчас популярны искусственно созданные персонажи,для которых заводят свои соцсети и развивают аккаунты за счет сгенерированного контента.Поскольку персонажи имеют интересную внешность или какие-то особенности,это хавают).А Higgsfield,как всегда,впереди и предоставляет инструменты для таких вещей.Пару примеров в комментариях.
🔹 Style Morphing в Suno-функция,которая позволяет взять готовый музыкальный фрагмент и «перекрасить» его в любой другой жанр или настроение, сохраняя при этом оригинальную мелодию и гармонию.В отличие от обычной генерации с нуля,морфинг дает возможность превратить,например,медленную фортепианную тему в энергичный рок-хит или техно-трек,просто изменив промпт или темп.
🔹 Runway Gen-4.5 Image to Video,фокусируется на улучшении физики движений и более точном следовании исходному кадру.Модель стала лучше отрабатывать вес и инерцию объектов.Но с Runway, как обычно,презентации хорошии,по итогу что-то невнятное.Пару примеров в комментариях.
🔹 Adobe внедрила ряд функций:Premiere получил интеллектуальный Object Mask для автоматического трекинга объектов в один клик и визуальные маркеры видеопереходов прямо на таймлайне,а After Effects обзавелся нативной 3D-геометрией и поддержкой материалов Substance 3D.Кроме того,значительно ускорился трекинг масок, появилась прямая интеграция с Firefly Boards и долгожданный импорт SVG как редактируемых шейпов.
Adobe радует.Практически единственный из старичков,кто участвует в гонке ИИ.Остальные закрыли глаза и делают вид,что ничего не происходит.
🔹 Krea realtime.Увидел эту новость и вспомнил,практически,ровно год назад была такая же.Но приглядевшись видно,что они его развивают и сделали более интересным в реализации.Теперь можно не просто генерировать с нуля,а редактировать готовые фото или генерации в реальном времени текстом.
🔹 Anthropic выпустили расширение для Claude Code в VS Code.Автономный ИИ-агент от Anthropic для терминала VS Code,который сам изучает ваш проект,правит код,запускает тесты и фиксит баги по текстовой команде,работая как полноценный помощник-разработчик.Сильный конкурент Cursor.
Cursor,тоже выпустил обновление 2.4.Появились Субагенты для параллельного решения задач разными моделями и встроенная генерация картинок через Nano Banana Pro прямо в проект.Также добавили асинхронные Q&A,позволяющие агенту продолжать работу в ожидании вашего ответа,и функцию Cursor Blame,которая детально отслеживает происхождение каждой строки кода (человек или ИИ) с прямой ссылкой на историю соответствующих чатов.
@VAI_ART
#VAI_News
👍15❤7
Напишу сюда планы на развитие как небольшое обещание себе. 🙂
Все требует развития. Невозможно сидеть в одних рамках все время. Это нужно для движения во всем. Тут также нужно развиваться и двигаться. Поэтому я поставил некоторые планы на этот год.
1️⃣ Купить наконец-то микрофон и начать записывать посты голосом также.
2️⃣ Купить камеру, чтобы записывать полноценные видеоролики.
3️⃣ Запустить страницу на Boosty. Буду там размещать более подробные посты с полным разбором пайплайнов через ИИ.
4️⃣ Запустить канал на YouTube. Буду размещать полноценные видеоролики (но это не точно).
Тут главное не порвать штаны.😁
В ТГ всё останется так же. Надеюсь, его не прикроют.🤞 На том же Boosty будут разборы и применение инструментов на практике. Так как такие вещи отнимают очень много времени, я решил брать за применение таких инструментов символическую плату.
P.S.Кстати, буду благодарен за наводки по микрофону и камере (цена/качество).
P.P.S.Пост про генерацию локации будет на следующей неделе, уже начал подготовку.
@VAI_ART
#VAI_Notes
Все требует развития. Невозможно сидеть в одних рамках все время. Это нужно для движения во всем. Тут также нужно развиваться и двигаться. Поэтому я поставил некоторые планы на этот год.
1️⃣ Купить наконец-то микрофон и начать записывать посты голосом также.
2️⃣ Купить камеру, чтобы записывать полноценные видеоролики.
3️⃣ Запустить страницу на Boosty. Буду там размещать более подробные посты с полным разбором пайплайнов через ИИ.
4️⃣ Запустить канал на YouTube. Буду размещать полноценные видеоролики (но это не точно).
Тут главное не порвать штаны.
В ТГ всё останется так же. Надеюсь, его не прикроют.
P.S.Кстати, буду благодарен за наводки по микрофону и камере (цена/качество).
P.P.S.Пост про генерацию локации будет на следующей неделе, уже начал подготовку.
@VAI_ART
#VAI_Notes
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12👍5
Ох.Праздники прошли и начинается сумасшедший карнавал новостей.То,про что говорил в конце года.Происходит очень много всего и везде.Быстро пробежимся по самому интересному.
🔹 Kling анонсировал новую версию 3.0.Поддержка 4K-разрешения и частоты 60 кадров в секунду без потери качества.Модель получила обновленный физический движок, который исправил ошибки при взаимодействии объектов,увеличила длительность роликов до 60 секунд и внедрила глубокую консистентность персонажей для создания серийных видео.Все это работает на базе архитектуры Omni,позволяющей генерировать видео сразу с синхронизированным звуком и управлять процессом через интерактивный холст.
Появится уже скоро.Должна быть хорошей моделью,которая будет либо лучше,либо конкурировать с VEO и Sora.
🔹 Google запустили Project Genie.Новый экспериментальный сервис от Google,который превращает текстовое описание или обычную картинку в интерактивные 3d миры.В отличие от обычных нейросетей,которые просто создают видео,Genie выстраивает полноценную модель мира:вы придумываете локацию и персонажа,а затем можете буквально бегать по этому пространству,управляя героем с клавиатуры в реальном времени, также позволяет создавать короткие 60-секундные игровые сессии.Пока доступна для владельцев подписки Google AI Ultra(в США).
Много было постов на неделе.
Презентация и пару примеров в комментариях.
🔹 HunyuanImage 3.0-Instruct.Открытая нейросеть от Tencent.Благодаря встроенному механизму рассуждений она понимает сложные команды на человеческом языке и идеально подходит для точного редактирования:вы можете попросить её добавить предмет,переодеть человека или объединить детали из трёх разных фото в одно,при этом остальная часть картинки останется нетронутой.Протестировать можно тут. Гитхаб тут.Хагингфэйс тут.
Презентация в комментариях.
🔹 Suno запускают Sounds.Заходят на поляну генераторов звуков.
Презентация в комментариях
🔹 Интересное событие.Обновился сервис decart.ai.Его интересная особенность-это захват движения в реальном времени с переносов на референсное изображение.
Презентация в комментариях.
🔹 Два обновления за неделю в LLM моделях.Что примечательно,обе модели являются открытыми и уже практически на уровне топовых закрытых моделей,которыми мы все пользуемся.
1. Вышла Qwen3-Max-Thinking.Флагманская нейросеть от Alibaba,которая обладает интеллектом уровня топовых моделей.С её 1 триллионом параметров она специализируется на сложнейшей математике,программировании и научном анализе,выстраивая длинные логические цепочки и самостоятельно исправляя свои ошибки в процессе рассуждения.Модель работает как опытный эксперт:она сама решает,когда нужно заглянуть в интернет или запустить код,чтобы выдать максимально точный и проверенный результат.Пробуем тут.
Графики в комментариях.
2. Вышла Kimi-K2.Мощный мультимодальная модель,которая умеет запускать рой из 100 субагентов для мгновенного решения задач:от превращения видео в живой фронтенд до анализа 100-страничных отчетов со сложными таблицами.Главная фишка в том,что нейросеть обучалась через систему,позволяющую ей самостоятельно принимать решения и исправлять собственный код,буквально посмотрев на результат в браузере.Она понимает медиафайлы и документы целиком,работая быстрее конкурентов за счет уникальной архитектуры, объединяющей зрение и логику в одном «теле».Попробовать тут.Гитхаб тут.
Презентация и графики в комментариях.
🔹 Hunyuan 3D 3.1 теперь доступен на 3d.hunyuanglobal.com.Многие писали,что сложно с китайской версией работать.Ваш день настал.🫡
🔹 Anthropic прикрутила Claude прямо в Microsoft Excel.Очень удобно для тех кто работает с таблицами.Ведь теперь можно автоматизировать практически все.
Презентация в комментариях.
🔹 Google Chrome и агент на основе Gemini 3.Встроенный «автопилот»,который сам кликает по сайтам:он может забронировать отель,сравнить цены или заполнить анкеты по одной команде.Агент видит содержимое вкладок,понимает ваши данные из Google-сервисов и выполняет рутинные задачи в браузере за вас,требуя лишь подтверждения.
Может еще что то интересное пропустил?
@VAI_ART
#VAI_News
🔹 Kling анонсировал новую версию 3.0.Поддержка 4K-разрешения и частоты 60 кадров в секунду без потери качества.Модель получила обновленный физический движок, который исправил ошибки при взаимодействии объектов,увеличила длительность роликов до 60 секунд и внедрила глубокую консистентность персонажей для создания серийных видео.Все это работает на базе архитектуры Omni,позволяющей генерировать видео сразу с синхронизированным звуком и управлять процессом через интерактивный холст.
Появится уже скоро.Должна быть хорошей моделью,которая будет либо лучше,либо конкурировать с VEO и Sora.
🔹 Google запустили Project Genie.Новый экспериментальный сервис от Google,который превращает текстовое описание или обычную картинку в интерактивные 3d миры.В отличие от обычных нейросетей,которые просто создают видео,Genie выстраивает полноценную модель мира:вы придумываете локацию и персонажа,а затем можете буквально бегать по этому пространству,управляя героем с клавиатуры в реальном времени, также позволяет создавать короткие 60-секундные игровые сессии.Пока доступна для владельцев подписки Google AI Ultra(в США).
Много было постов на неделе.
Презентация и пару примеров в комментариях.
🔹 HunyuanImage 3.0-Instruct.Открытая нейросеть от Tencent.Благодаря встроенному механизму рассуждений она понимает сложные команды на человеческом языке и идеально подходит для точного редактирования:вы можете попросить её добавить предмет,переодеть человека или объединить детали из трёх разных фото в одно,при этом остальная часть картинки останется нетронутой.Протестировать можно тут. Гитхаб тут.Хагингфэйс тут.
Презентация в комментариях.
🔹 Suno запускают Sounds.Заходят на поляну генераторов звуков.
Презентация в комментариях
🔹 Интересное событие.Обновился сервис decart.ai.Его интересная особенность-это захват движения в реальном времени с переносов на референсное изображение.
Презентация в комментариях.
🔹 Два обновления за неделю в LLM моделях.Что примечательно,обе модели являются открытыми и уже практически на уровне топовых закрытых моделей,которыми мы все пользуемся.
1. Вышла Qwen3-Max-Thinking.Флагманская нейросеть от Alibaba,которая обладает интеллектом уровня топовых моделей.С её 1 триллионом параметров она специализируется на сложнейшей математике,программировании и научном анализе,выстраивая длинные логические цепочки и самостоятельно исправляя свои ошибки в процессе рассуждения.Модель работает как опытный эксперт:она сама решает,когда нужно заглянуть в интернет или запустить код,чтобы выдать максимально точный и проверенный результат.Пробуем тут.
Графики в комментариях.
2. Вышла Kimi-K2.Мощный мультимодальная модель,которая умеет запускать рой из 100 субагентов для мгновенного решения задач:от превращения видео в живой фронтенд до анализа 100-страничных отчетов со сложными таблицами.Главная фишка в том,что нейросеть обучалась через систему,позволяющую ей самостоятельно принимать решения и исправлять собственный код,буквально посмотрев на результат в браузере.Она понимает медиафайлы и документы целиком,работая быстрее конкурентов за счет уникальной архитектуры, объединяющей зрение и логику в одном «теле».Попробовать тут.Гитхаб тут.
Презентация и графики в комментариях.
🔹 Hunyuan 3D 3.1 теперь доступен на 3d.hunyuanglobal.com.Многие писали,что сложно с китайской версией работать.Ваш день настал.
🔹 Anthropic прикрутила Claude прямо в Microsoft Excel.Очень удобно для тех кто работает с таблицами.Ведь теперь можно автоматизировать практически все.
Презентация в комментариях.
🔹 Google Chrome и агент на основе Gemini 3.Встроенный «автопилот»,который сам кликает по сайтам:он может забронировать отель,сравнить цены или заполнить анкеты по одной команде.Агент видит содержимое вкладок,понимает ваши данные из Google-сервисов и выполняет рутинные задачи в браузере за вас,требуя лишь подтверждения.
Может еще что то интересное пропустил?
@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🤝1