Psy Eyes
5.09K subscribers
1.05K photos
999 videos
5 files
1.18K links
Креатив + AI + Web3... и мемы

Личная страница @andrey_bezryadin
Download Telegram
Пара анонсов от авторов SuGaR, метода для получения чётких мешей из сплатов и их анимации.

Они выпустили код Gaussian Frosting. Это технология, являющаяся развитием идей SuGaR, и помимо получения с её помощью высококачественных трёхмерных объектов и их анимации, здесь вокруг мешей есть слой вариативной толщины для лучшей проработки деталей вроде меха или травы. Чем пушистее объект, тем толще слой. Также он автоматически подстраивается под изменение меша и его анимацию.

Второй анонс даже важнее — они сделали аддон для Blender, в котором можно редактировать и анимировать меш. Причём работать даже с несколькими объектами одновременно, главное чтобы они были получены одним и тем же методом (SuGaR или Frosting). Во время анимации кости и вертексы будут пропущены через SuGaR, а во время рендера через Frosting.

Аддон для Blender
Сайт SuGaR
Гитхаб
Сайт Frosting
Гитхаб
Udio: добавили возможность обрезать сгенерированную музыку, указав начало и конец через Trim в меню трека (троеточие). Работает на всех акках.

Suno: внедрили Inpaiting, через который можно выделить определённую часть трека и поменять слова в песне или добавить музыкальный инструмент, например. Доступно по платной подписке.

Причем, в Udio инпейтинг уже давно есть, а недавно они завезли тонкую настройку лирики.

Сайт Suno
Сайт Udio
Если ты пользовался Claude из-за генерации кода и Artifacts, то пришло время потестить свою веру... и нужду в подписке.

OpenWebUI, которые делают открытый веб-интерфейс для работы с любыми локальными языковыми моделями (LLM), в последнем обновлении тоже добавили инструмент Artifacts, собирающий и запускающий код из чата в боковом меню.

Как и у Claude, каждая новая правка это отдельная версия кода, между которыми можно переключаться мышкой и выводить запущенное на весь экран.

Плюс, в отличие от Anthropic, для генерации кода или текста можно сразу подрубать любую LLM, которая появляется в топах бенчей: DeepSeek 2.5, лама 3.2, Qwen 2.5, Mixtral, итд. Быть может даже крупняк вроде ламы 405B или Grok получится запустить через распределёнку.

Народ пилит HTML-игры, визуализацию данных, простенькие прилы под свои нужды, итд. Ну и просто чатится по файлам, или получает ответы на бытовые вопросы.

Для локальной работы нужно ещё Ollama установить. Запускайте те ллм, которые у вас влезут в видюху: грубо говоря в 8ГБ максимум влезет модель 7B (7 млрд параметров). Чтобы поставить например последнюю Qwen 2.5 7B с контекстом 128к (можно кормить книжки) нужно рядом с выбором модели нажать плюс и вбить команду ollama run qwen2.5:7b и нажать pull. Команды для скачивания других моделей тут.

Осталось чтобы оно папки и файлы само создавало и в агентном режиме тестило код плюс деплоило его.

Сайт
Установка через Pinokio
Гитхаб OpenWebUI
Ollama
This media is not supported in your browser
VIEW IN TELEGRAM
Я тут открыл для себя, что можно выделить любое место в посте, нажать Edit (Редактировать) и оно сразу откроется, там где ты выделил — не надо скролить простынку туда-сюда и искать где оно было. Жизнеспасательная вещь!

Кстати заметил с недавних пор при добавлении ссылки к выделенному слову она сама вставляется, а не как раньше тебе надо было вонзать Ctrl+V. Поначалу было непривычно и ощущалось скорее как баг, чем фича. Но сейчас уже синхронизация завершена.

И да, Паша там обещал, что в ближайшем апдейте можно будет добавлять файлы к уже вышедшим постам. I've been waiting for this for a thousand years.

Круче было бы только если б можно было ткнуть два раза в нужное место поста и он сразу открывался там для редактирования.
Продолжая тему кодинга. Где-то с месяц назад Replit показали своего AI-агента Replit Agent, который умеет не только писать код, но и настроит тебе окружение, поставит зависимости, оформит базу данных, и даже задеплоить может.

С тех пор в инфополе он особо не возникал, и до сих пор доступен только в ограниченном режиме владельцам подписки. Периодически натыкаюсь, как народ его использует в коопе с Claude: просят описать действия для Replit, чтобы тот организовал Gradio демо для какой-нить модельки на хаггинге.

Тем не менее, интересен сам факт его появления. Опенсорсный Artifacts у нас уже есть. Посмотрим как быстро функционал Replit Agent завезут.

Сайт
Alibaba: выпустили бета-версию инпейтинг контролнета для Flux.

1) Более детальные результаты
2) Работа в разрешении 1024х1024 без апскейлинга
3) Лучше следование промту

Потребляет 27 ГБ VRAM.

Хаггинг
Новости из будущего: снова Alibaba, только на этот раз они с Turbo версией Flux, которая должна выйти 16 октября, но уже лежит на хаггинге.

Turbo является дистиллированной версией Dev, и заточена генерить в 8 шагов. На картинке сравнение результатов базовой Dev в 28 шагов и Turbo в 8.

Может работать как просто для генерации картинок, так и в связке с контролнетами или лорами.

Ворфлоу для комфи на странице модели.

Хаггинг
Окей, начали появляться рабочие проекты на гитхабе по генеративным играм — ловите Diamond.

Там есть список игр, на которых модель натренирована. Двухмерный аналог Pacman с лёту запустился с привычным управлением. А вот как играть в генеративный CS:GO неочевидно. Тем не менее, регистрируем шажок в нейроигровом направлении. Будем следить за развитием событий.

Вполне возможно лавочку быстро прикроют (ибо Габен велик) как было с недавним GameGen0, у которого беспалевно на странице проекта были картинки с подписями о Cyberpunk 2077, Witcher 3, итд. Но в этот раз у нас хотя бы есть код, который, как минимум, можно скачать себе в качестве будущего музейного экспоната. Всё лучше, чем гугл, который только пускает пыль в глаза инвесторам и ничего не релизит (GameNGen и Genie, например).

Спс подписчику @JohnDoe171 за подгон.

Сайт
Гитхаб
Установка через Pinokio
This media is not supported in your browser
VIEW IN TELEGRAM
Найден способ повысить в fps в нейро контре. Нужно повернуться вправо, посмотреть вверх, и присесть. Заодно и звук появится.
This media is not supported in your browser
VIEW IN TELEGRAM
Adobe: на мероприятии Max сделали несколько анонсов.

Генеративная модель Firefly теперь вшита в Premiere и может использоваться для расширения видео, создания B-роллов на основе картинок, или добавления эффектов.

Судя по черрипикам контекст видео для продолжения ухватывает хорошо, а вот по качеству пока MiniMax, Kling, Movie Gen, и Runway лучше.

В бете нового премьера уже должно работать, но понадобится подписка Creative Cloud. Шустрые подписчики уже рапортуют, что зарубежный IP не нужен. Вейтлист в генератор видео на сайте тут.

Фича Generative Fill вышла из беты и начинает широко внедряться в продукты компании. А генеративная стёрка обновилась и стала лучше удалять объекты с контента.

Пост
Видео с мероприятия
This media is not supported in your browser
VIEW IN TELEGRAM
Также Adobe выкатили бета-версию Substance 3D Viewer. С помощью этой фичи можно вкидывать 3D объекты прямо в фотошопе, крутить их там как угодно, и быстро собирать дизайны продуктов. 3D контент будет восприниматься как смарт-объекты.

В Illustrator при этом добавился показанный в мае Project Neo, которым можно в изометрии собрать из 3D объектов сцену в нужном ракурсе, и потом экспортировать в редактируемом векторном формате или растре. Плюс появилась фича Objects on Path, позволяющая сгруппировать и перемещать объекты по направляющей.

InDesign теперь тоже располагает генеративным расширением изображения и text-2-image. А в Lightroom завезли Generative Remove для более аккуратного выделения и удаления объектов.

Пост
This media is not supported in your browser
VIEW IN TELEGRAM
Замес из Runway Gen-3 и AR.

Стильный писксельарт и минимум динамики, скрывающие огрехи нестабильности, делают своё дело.

Надписи правда пожеванные, и машина едет задом наперёд по встречке. Но кому станут камнем преткновения такие низменные, словно пыль, детали, когда обращаешься к высокому.

Твит