Psy Eyes
5.28K subscribers
1.05K photos
1.04K videos
5 files
1.22K links
Креатив + AI + Web3... и мемы

Личная страница @AndreyBezryadin
Download Telegram
Пока кто-то ждёт анонс 5090, китайцы переделывают 4090 D, выпущенные специально для китайского рынка, и пришивают к ним 48 ГБ VRAM. Также на прокачку пошла тачка 4080 Super с теперь уже 32 ГБ VRAM.

Изначально 4090 D имеют 12 модулей памяти. Но если взять PCB от 3090 Ti, которая поддерживает 24 модуля, то можно впихнуть вдвое больше VRAM.

До этого слышал только про 20 серию с 22 гигами.
Davinci V 19 таки вышла из беты и теперь релизнута полноценно.

AI-фичи:

* Видео можно транскрибировать, чтобы перевести озвучку в текст для поиска нужного момента по словам. Работает и с русским языком.

* Категоризация аудио контента (диалоги, музыка, эффекты) с подкатегориями вроде взрывов, плеска воды, итд.

* Изолирование голоса от других звуков.

* Трекинг движения объектов в 2D/3D и автоматическое панорамирование аудио за ними.

* DaVinci Neural Engine оптимизирован для ускорения производительности (до x4,7 при работе с масками и до х2 в рефрейме) на новых Snapragon чипах от Qualcomm. Отзывы техноблогеров на эту тему пока v 19 находилась в бете были смешанными. Посмотрим, что изменится с этим релизом.

Сайт
This media is not supported in your browser
VIEW IN TELEGRAM
Pinokio довольно сильно проапгрейдился в последнее время.

Раньше он позиционировался как инструмент для 1-кнопочной установки разных AI-приложений для тех кто не хочет копаться с гитхабом и вот этим вот всем, а по факту там надо было чуть ли не на каждом шаге что-то клацать и желательно представлять себе подкапотное пространство, ибо ошибки при установке были сплошь и рядом.

Сейчас же, благодаря интеграции скриптов для действий, это именно установочник в пару кликов:

* Через эксплорер легко найти популярные модели и инструменты (Comfy, A1111, Forge, Flux, итд).

* Нажимаешь на установку и дальше весь процесс автоматизирован. Причём скрипт установки можно настроить.

*Поставленные приложухи собраны в главном меню (иконка домика) и открываются прямо внутри окна пинокио, а не внешнем браузере.

* Если хочется именно в браузере, то можно настроить запуск прилы из автозаполнения как только начинаешь писать её название.

* Можно открыть несколько окон и работать одновременно с Flux и StableAudio, например. Или клонировать запущенное окно.

* Терминал и файлы приложения находятся в левом меню, которое можно скрыть, чтобы больше пространства было под интерфейс.

* Легко шарить запущенное AI-приложение — для него генерируется публичный или локальный линк/QR со входом по паролю.

* Все недоудалённые файлы и папки, которыми раньше засиралось место, теперь в пределах досягаемости для очистки через общие настройки.

* Да и сам пинокио стал шустрее.

Сайт
Гитхаб
This media is not supported in your browser
VIEW IN TELEGRAM
Postshot: подъехало обновление V 0.4 этого инструмента для создания сплатов. Я писал чем интересен Postshot ранее.

Что нового:
* Повысилось качество получаемых 3D сцен
* Тренировка стала быстрее, а память GPU на 15% меньше использоваться
* Новая система для стриминга изображений, позволяющая делать треню на массиве изображений, превышающем память доступную CPU
* Можно загрузить или экспортировать траекторию движения камеры. Также можно указать целевую траекторию.
* Новый тренировочный профиль "Splat MCMC"
* Треня на HDR футаже
* Поддержка RAW и новых цветовых пространств
* Управление командной строкой
* Поддержка Bundler формата *.out для импорта поз и точек

Сайт
Анонс
This media is not supported in your browser
VIEW IN TELEGRAM
Packshot: инструмент для визуализации продуктов и создания 3D мокапов. Запись в бету открыта.

Сайт

Твит
LangChain: выпустили LangGraph Studio — среду разработки (IDE) приложений на основе AI-агентов. Подойдёт для визуализации, интерактива и устранения багов в комплексных нейронных апах.

Визуализация графов упрощает разработчикам работу и делает структуру прозрачнее. Кроме того, можно изменить результат действий агента (или логику, лежащую в основе конкретного узла) на полпути его траектории. Это создает итеративный процесс, позволяя взаимодействовать и манипулировать состоянием в данный момент времени.

Пока только на Mac.

Гитхаб
Анонс
Xlabs, авторы популярных контролнетов для Flux, на связи
Forwarded from XLabs AI
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Luma: добавили управление камерой в генератор видео Dream Machine V 1.6.

Пишем в промт Camera и выбираем из вариантов:
* Move — влево/вправо/вверх/вниз
* Push/Pull — отдалить/приблизить
* Pan — панорама влево/вправо
* Orbit — поворот по/против часовой стрелки
* Crane — кран вверх/вниз

Сайт
LIVE2D: модель для работы с внешним видом 2D персонажей. Может пригодится в геймдеве и анимации.

Она автоматически делит персонажа на составные части (руки, ноги, причёска, итд), которые можно изменять, рисуя/стирая нужные элементы.

Есть поддержка Flux, SD 1.5, и SDXL. Со слов разраба 1.5 и SDXL работают наиболее стабильно. Если что, можно ими генерить, а флюском потом повысить разрешение через встроенный апскейлер.

Тут видео с обзором как оно работает в редакторе Krita.

Модель на Flux
Модель на SDXL
Модель на SD 1.5
Видео
Плагин для Krita
Niantic: выпустили V 4 приложения Scaniverse для создания 3D сцен/объектов на основе сплатов.

Как и раньше, рендер и редактирование происходят прямо на мобильном девайсе, без обработки на десктопе или в облаке. При этом на выходе высокое качество картинки, а экспорт доступен в OBJ, SPZ, и других форматах.

Фичами же нового релиза являются: возможность делиться и исследовать сплаты на глобальной карте, а также внедрение этой технологии в новый WebXR редактор Niantic Studio и игровой движок 8th Wall, где сплаты можно использовать в качестве сцен для игр или объектов для взаимодействия.

Анонс Scaniverse 4
Анонс 8th Wall
Приложение для Android
Приложение для iOS
This media is not supported in your browser
VIEW IN TELEGRAM
Linkin Park возвращаются с новой вокалисткой Эмили Армстронг из Dead Sara. И это правильное решение: Честера никто не заменит, а так по крайне мере удастся избежать прямых сравнений.

Новым составом они выпустят 15 ноября новый альбом «From Zero» и уже скоро отправятся в мини-тур. Перед анонсом отыграли концерт со старыми песнями.

Клип на новый трек «The Emptiness Machine» делали в Wonder Dynamics используя захват движения без маркеров.

YouTube
Потестил Fluxgym — простой интерфейс для тренировки лор на основе Flux.

Всё максимально прямолинейно:

Шаг 1)
* Даём название лоре
* Пишем триггерное слово/предложение
* Указываем имеющийся объём VRAM (20/16/12 ГБ)
* Повышая/уменьшая количество эпох, задаём число шагов

Есть ещё доп настройки кропа изображения, сида, ранка, итд, для тех, кто хочет поиграться с качеством лоры на выходе.

Шаг 2)
Закидываем изображения и нажимаем Add AI Captions. Нейронка Florence 2 глянет на изображения и подпишет их за вас. Особенно это полезно когда картинок сотни или тысячи. При этом триггерное слово уже сразу будет добавлено в подписи.

Шаг 3)
Нажимаем Start Training и уходим заваривать чай.

Я использовал 1-кликовый установщик в Pinokio. Благодаря оптимизированным скриптам, после того как Florence заканчивает генерацию подписей, освобождается 4 ГБ памяти и треня может влезть в 16/12/8 ГБ VRAM соответственно.

На пяти картинках в 1000 шагов с кропом 512 тренировка на одной 4090 заняла 15 минут. И действительно всё уместилось в 16 ГБ VRAM. С кропом 1024 ушло около часа, а памяти заняло 18 ГБ.

Дальше забираем испечённую лору в папке Outputs и кидаем в Forge или Comfy туда же, где лежат другие dev/schnell модели. Там в папке будет лежать финальная лора и чекпоинты под номерами — достаточно взять только последний файл.

Для использования лоры в Forge надо зайти на вкладку Loras, выбрать её, и в промте появится её название в <> скобках. Также в промте вбиваем триггерное слово и остальное, что хотите сгенерить.

В Comfy задействуется нода Load LoRA. У меня при её добавлении лора нашлась автоматически. Воркфлоу выглядит так, а скачать его можно тут, либо у меня в комментах.

Гитхаб
Установка через Pinokio
This media is not supported in your browser
VIEW IN TELEGRAM
Обновления в FluxGym:

* Треня теперь прозрачнее: можно автоматом генерить семпл картинки по указанному промту каждые N шагов для отслеживания как проходит процесс тренировки. И заодно наблюдать как оно познаёт мир, изучает новое.

* Разрешение в которое кропается изображение теперь можно задать любым, например 742, а не только 512/1024 как было ранее.

Для обновления в пинокио нажмите в панели слева Update. Когда FluxGym запустится, закройте пинокио и запустите снова, чтобы апдейт применился. Если всё ок, вы увидите в интерфейсе FluxGym новые поля: Sample Image Promt и Sample Image Every N Steps.

Если ставите с нуля оно у вас должно так установиться по умолчанию.

Как работать с FluxGym
Установка через Pinokio
Гитхаб
This media is not supported in your browser
VIEW IN TELEGRAM
Suno: выкатили в раннем доступе Covers — возможность делать каверы на свои треки, позволяя менять стиль композиции с сохранением текста.

Как работает:
1) Находите нужную песню на страницах Library или Create
2) Нажимаете "..."
3) Идёте в Create > "Cover Song"
4) Текст песни автоматом пойдёт в промт. Для лучших результатов рекомендуется лирику на старте не менять, и вносить правки уже потом, делая эксперименты.

Можно загружать свои инструменталки / навыть мелодию и генерить к ним вокал поверх. Или самостоятельно спеть слова и трансформировать их через кавер.

Фича пока работает нестабильно и в раннем доступе для платных подписчиков. За первые 200 каверов не списываются кредиты. Потом по 10 кредитов за генерацию.

PS: Кстати Suno запустили конкурс ремиксов с призовым пулом $100k. Вот настолько они боятся судиться с мейджор лейблами.

Анонс
Сайт
This media is not supported in your browser
VIEW IN TELEGRAM
Luma: открыли API. Теперь разработчики могут подрубить генерацию видео на основе текста или картинок в свои сервисы, мини-приложения, ботов, итд.

Рульки вроде кейфреймов, контроля камеры, формата кадра, расширения, или зацикливания тоже поддерживаются.

Оплата идёт за использованные кредиты. Цена $0.0032 за кадр или $0.35 за 5 сек 24 FPS при разрешении 1280×720p. Если запросов много, можно взять подписку.

Анонс