Psy Eyes
6.79K subscribers
1.43K photos
1.56K videos
5 files
1.55K links
Креатив + AI + Web3... и мемы

Личная страница @AndreyBezryadin

Купить рекламу: https://telega.in/c/Psy_Eyes
Без наценки Telegain и индивидуальными датами — в личке.
Download Telegram
3D контроль камеры для Qwen Image Edit 2511. До этого в демо была 2509 версия.

Мультикам лору натренировали Fal, она на хаггинге.

Comfy воркфлоу у них на гитхабе для шаблонов.

Ноду можно поставить через менеджер когда импортируете воркфлоу или с гитхаба. Если будет ругаться на каналы ставьте не nightly версию ноды а какую-нибудь из номерных стабильных под ней.

Демо
Хаггинг
Воркфлоу
Гитхаб
Comfy: в своём облаке увеличили количество контента, которое можно сгенерить за ту же цену подписки.

Я правда не пойму как они считают ибо цифры из поста не бьются с указанными на их сайте. Там ещё и если нажать на детали, то выясниться что время для генерации прикинуто из расчёта, что мы будем генерить 640х640, 16 fps, 4-шаговой лорой... а будет не так.

Но учитывая, что в большинстве случаев новые модели стартуют с ворками для Comfy, API ноды быстро добавляются, есть импорт моделей с Hugging Face и CivitAI, а гоняется всё на RTX6000 с 96 ГБ VRAM, предложение может быть интересным для тех, кто ищет всё в одном месте. Тем более, что упрощённый Simple интерфейс есть пока только в облачной версии.

А если чувствуешь, что подписку за месяц не израсходуешь или мощная машина уже есть, то можно обойтись оплатой только за API вызовы в локальном Comfy.

Кто-то уже пробовал их подписку/оплату за API вызовы с компа?

Сайт
Твит
Про Comfy Cloud
по горячим следам
Forwarded from дAI потестить!
Пару слов о ComfyUI Cloud (http://cloud.comfy.org)

1. Нужных нод нет, поэтому запустить можно только то, что лежит в шаблонах ComfyUI. Кстати, библиотека шаблонов заметно меньше, чем у локального ComfyUI.
2. "Свои" LoRA и модели можно добавить только с тарифа Creator (35 $). Но зачем - неясно: нужных нод нет.
3. Консоль всегда девственно чиста. Почему ворк не запустился, можно понять только при наличии опыта победы в 11-м сезоне "Битвы экстрасенсов".
4. Ворк обновляется не последовательно, как при локальных вычислениях, а целиком. Делать предпросмотр картинки где нить посередине ворка бессмысленно.
5. Регулярные дисконнекты.

Для кого это нужно - мне пока не ясно.
Исследовать новое - нет нод.
Катать свои ворки - нет нод.
Собирать свои ворки и запускать в облаке - правильно. Нет нод.

Мой вывод: нет железа - арендуй сервер.

Где арендовать:
- clore.ai (дешево)
- simplepod.ai
- gpudc.ru (рубли, Windows)
- massedcompute.com

Пару ссылок, которые помогут развернуть ComfyUI:
https://github.com/Tavris1/ComfyUI-Easy-Install
https://github.com/ai-dock/comfyui

Готовые сборки ComfyUI:
t.me/prompt_by_art
https://huggingface.co/OreX/ComfyUI/tree/main

P.S. Могли бы хоть внешний Api прикрутить, чтобы использовать их как сервер. Этого тоже пока нет🙁
Luma: выпустили видеогенератор Ray3.14 (как Rape Me у Nirvana только "рэйпи").

Что нового:
* Нативное 1080p (я думал оно у них уже было)
* 720p генерит в 4 раза быстрее и в 3 раза дешевле
* Улучшения в стабильности, детализации видео, и следованию промту
* Работает с текстом, картинками и видосами на входе
* Изменение объектов на видео длиной до 18 сек

На бесплатном тарифе можно в режиме драфта погенерить. Правда неизвестно сколько времени это займёт.

По ценам: 20 кредитов/сек.

PS: сегодня Rape Me это песня, которую поёт кошелек.

Сайт
Анонс
Media is too big
VIEW IN TELEGRAM
Nvidia: выпустили проект PPISP для улучшения детализации сплат сцен.

В отличие от других подходов здесь для генерации новых углов обзора по фоткам тренируется отдельная модель, связанная с параметрами камеры из EXIF (экспозиция, баланс белого, итд). Это позволяет отделить эффекты формирования изображения камерой от самой сцены, что приводит к более качественным и реалистичным результатам.

Уже интегрировано в gsplat и будет добавлено в 3DGRUT.

Сайт
Гитхаб
Media is too big
VIEW IN TELEGRAM
Тем временем от A$AP ROCKY вышел клип Helicopter полностью сделанный на связке сплатов и UE.

Людей снимали на фоне зеленки ригом из нескольких камер по периметру (на ютубе у него пачка видосов на эту тему). Поэтому действие каждого персонажа ограничевается зоной своего квадрата. А потом всё композилось.

Да видны артефакты на лицах, шумы на одежде, и прочее. Но они грамотно накинули эффектов, чтобы это не бросалось в глаза и казалось частью стиля.

Так-то 4D мы видели и качественнее ещё в прошлом году.

В общем ждём новых клипов на основе этой технологии. И желательно чё-нить потяжелее!

YouTube
У Heygen теперь новый Video Agent.

Даёшь краткое описание что ты хочешь чтобы аватар произнёс в кадре и как он должен выглядеть. Агент на несколько минут уйдёт в рассуждения и вернётся с планом действий.

Если всё ок, жмёшь утвердить и видео начнёт генериться. Через несколько минут получаешь видео длиной 12-20 сек, где аватар произносит и делает в кадре то, что ты попросил.

Если нужны правки (надпись, поза, освещение, итд) можно их сделать там же в рамках чата. Мне надо было поменять произнесённый текст с Psy Yes на Psy Eyes и всё получилось, хотя голос при этом стал другим.

Понравившийся вариант можно добавить в избранное, чтобы применять к другим видео.

На удивление генерится бесплатно (лимит пока не нащупал), хотя я помню что у меня на HeyGen давно кредиты кончились.

Сайт
Анонс