У капибары лапки | StableDiffusion: Extensions\Tools\Models\Tokens

#Midjourney #арт

Заметка из цикла "Что интересного есть в Midjourney?", написана исключительно для расширения кругозора.

/describe

Инструмент для генерации промпта (описания) по изображению на мощностях Midjourney. Чем-то похож на стандартный Interrogator в img2img или работу расширения CLIP Interrogator. Предложенные промпты очень похожи на результаты одной из опернсорс моделей. Удачного примера под рукой не оказалось, но /describe без всяких сомнений предлагает мусорные токены, вроде rtx on, windows vista, 32k uhd, etc.

Со сгенерированными внутри Midjourney изображениями работает точнее, в некоторых случаях позволяет получить почти идентичное изображение. С рисунками или генерациями других нейросетей справляется хуже, попадает не так уверенно.
Позволяет в один клик сгенерировать по любому из четырёх промптов, по всем сразу или проанализировать изображение заново.

Обнаруженные в изображении промпты

3d chibi character, anime, girl in red coat, wolf illustration, red wolf, in the style of kaethe butcher, alena aenami, necronomicon illustrations, sandara tang, group zero, dark gray, multilayered realism --ar 81:128

wolf girl, woman in fur coat and monsters, in the style of anime art, red, horror academia, low resolution, dark gray, northwest school, strong use of color --ar 81:128

3d wallpaper wolf lady on red forest with wolves, in the style of necronomicon illustrations, anime, commission for, slender, dark gray, simple, colorful illustrations, comic book-like --ar 81:128

the red walker wallpaper, black wolf, in the style of xiaofei yue, comic/cartoon, magali villeneuve, gothic illustration, naoki urasawa, animals and people, high-keyed palette --ar 81:128

К посту прикреплена моя генерация в Stable Diffusion (промпт на civitai). В комментариях покажу как describe распознаёт и повторяет сгенерированные внутри Midjourney изображения.

____
У капибары лапки • подписаться

❤15❤‍🔥3

2.49K viewsГлеб, 05:27

У капибары лапки | StableDiffusion: Extensions\Tools\Models\Tokens

#расширение

Depth map library and poser
https://github.com/wywywywy/sd-webui-depth-lib

Ранее уже рассказывал о расширении Depth Library, которое позволяет более-менее корректно генерировать кисти рук.
Depth map library and poser — доработанный форк, совместимый с последними версиями автоматика.

Принцип работы редактора: добавляете кисти рук с необходимым расположением пальцев в пространстве и на основе этого генерируете маску глубины (depth mask). При рисовании персонажа через ControlNet в одном юните задаёте скелет (open pose), во втором карты глубины (depth) из этого расширения и если всё сделано правильно — получатся идеальные руки. Аналогично на изображение добавляется текст или геометрические фигуры.

Настройки юнитов ControlNet
• Depth или Lineart, без препроцессоров, Starting Control Step = 0.1-0.2 (возможно ещё потребуется задать силу юнита), прочие настройки без изменений.
• Open Pose с нужным вам скелетом (важно, чтобы он был нарисован без костей пальцев).

Особенности расширения
• На момент написания обзора сбрасывает положение масок при смене фонового изображения, но восстанавливает при загрузке первоначального изображения.
• 39 шаблонов кистей рук, при желании можно скачать подборки с civitai (900 рук, 50 рук, 20 рук) или добавить собственные кисти самостоятельно.
• Все шаблоны кистей рук в расширении и на civitai мужские. Почему нет женских рук, если женских персонажей генерируется больше, чем всего остального вместе взятого — загадка.
• Инструмент для добавления текста на изображение.
• Инструмент для добавления простейших геометрических фигур.
• Отправка маски в один клик в ControlNet.
• Экспорт масок в png для дальнейшей работы.

____
У капибары лапки • подписаться

❤36❤‍🔥7

3.73K viewsГлеб, edited 13:26

У капибары лапки | StableDiffusion: Extensions\Tools\Models\Tokens

#ComfyUI #расширение

ComfyUI Extensions by Failfa.st
https://github.com/failfa-st/failfast-comfyui-extensions

Расширение не добавляет новых нод, но значительно повышает удобство работы с ComfyUI. Думаю, что это одно из обязательных расширений.

Базовые настройки
• Принудительное прилипание нод к сетке.
• Отключение скругления углов нод.
• Тени для нод.
• Изменения размеров шрифта в текстовых нодах (10 по умолчанию).
• Динамические цвета нод (все разные, однотипные одним цветом, все серые, по настройкам воркфлоу).
• Изменение размеров нескольких выделенных нод.

Функции, которые мне понравились
• Отображение типа данных на Reroute (пример на скрине).
• ПКМ по изображению — скопировать.
• Перекрашивает группу нод в один цвет вместе с подложкой.
• Pin/unpin и Freeze/Unfreeze для всех нод.

Прочие функции
• Изменение размеров нод Reroute (маленький и в точку).
• Автоматическое упорядочивание нод (чем-то похоже на стандартный механизм).

___________
У капибары лапки • подписаться

❤17❤‍🔥4

3.19K viewsГлеб, edited 14:29

У капибары лапки | StableDiffusion: Extensions\Tools\Models\Tokens

Сейчас я буду устанавливать все ~~игры~~ фотошопы!!1

В дополнение к постами про миджорней будут (возможно) посты про нейросетевые функции фотошопов.

Полгода не мог себя убедить что нужно возобновить подписку. Но звёзды сошлись, появилась простая возможность оплатить и вот я здесь.

❤‍🔥17❤7

2.94K viewsГлеб, edited 19:35

У капибары лапки | StableDiffusion: Extensions\Tools\Models\Tokens

#расширение

Add image number to grid
https://github.com/AlUlkesh/sd_grid_add_image_number

Крошечное расширение для вывода дополнительной информации в матрицу XYZ.

Включить: Settings - Saving images/grids (листать в самый низ страницы)

Add the image's number to its picture in the grid
Добавляет в каждую ячейку матрицы номер файла, если у вас включена настройка Add number to filename when saving на этой же странице.

Add X/Y/Z script info to its picture in the grid
— Добавляет в каждую ячейку информацию о параметрах генерации из матрицы. Может быть полезно при генерации очень больших гридов.
— Информация о настройках генерации отображается даже в режиме генерации батчем не создавая матрицы. Серьёзный недостаток. Завёл карточку на гитхабе с просьбой разделить настройку на матрицы и обычные батчи.
____
У капибары лапки • подписаться

❤‍🔥10❤8

3.04K viewsГлеб, 14:07

У капибары лапки | StableDiffusion: Extensions\Tools\Models\Tokens

#заметки

Сортировка моделей по папкам и вложенным папкам внутри \models\Stable-diffusion — самый простой способ сортировки моделей. Поддерживает до 12 (больше не проверял) вложенных папок, пути отображаются корректно. Структуру корректно понимают и автоматик, и комфи. Аналогичным способом сортируются лоры, это ещё удобнее.

Папки сортируются по алфавиту, удобно для размещения каталогов в нужном порядке. Например, перенести инпейнт модели в самый конец списка, чтобы не тратить время на их поиски.

Когда моделей много (у меня 80 штук на ~330 Гб), то сортировки по папкам недостаточно и на помощь приходит второй трюк. Поле с названием работает и как строка поиска: стираем текст и начинаем набирать что-то, чтобы получить все совпадения из доступных каталогов.
В комфи интерфейс чуть понятнее и строка поиска уже встроена в ноды загрузчиков.

В блоге нет тэга "взлом жизни", все полезные трюки отмечены хэштэгом

#заметки

.

____
У капибары лапки • подписаться

❤13❤‍🔥3

3.33K viewsГлеб, edited 10:17

У капибары лапки | StableDiffusion: Extensions\Tools\Models\Tokens

#мысливслух #SDXL #арт

Полноценная тренировка XL модели, а не мёрджи с другими моделями или вшивание лор, как делают некоторые авторы (есть и те, кто гордо называет свою поделку Checkpoint Trained и забывает скрыть метаданные о всех мёрджах) займёт не одну неделю машинного времени на условной 4090.
Поэтому странно, что сейчас на civitai столько XL моделей с ярлыком Checkpoint Trained, а новые версии появляются со скоростью горячих пирожков. Провести полноценную тренировку за столь короткий срок не представляется возможным. Но кого это смущает?

Почти все авторы стараются добавить больше весов, отвечающих за "фотографичность" людей и напрочь забывают (или забивают?) про природу и окружение.
Наверняка забивают и на всё остальное, но сегодня покажу только природу (ссылка на тяжёлый грид из сообщения ниже).

Два месяца назад я сомневался в будущем XL моделей только из-за жутчайших бед с анатомией. Может быть это и осилят поправить. Уверенности нет.
Но как будут бороться со скудностью исходного датасета XL 1.0 (по некоторым оценкам там чуть больше 1М изображений) и смогут ли корректно добавить недостающее не поломав существующие веса мы вряд ли узнаем.

Отсутствие публичного алгоритма тренировки рефайнеров — второй фатальный недостаток XL моделей. Технологически XL спроектирована как два прохода по изображению: одна модель упорядочивает шум, вторая повышает качество. Без дообученных рефайнеров ни одна XL модель сообщества не выдаст хорошие результаты. Просто потому что не сможет. Можно после базовой XL дважды пройтись по изображению 1.5 для вытягивания и улучшения деталей. Но зачем тогда нужна XL?!

Сомнений и вопросов стало больше, ответов и хороших XL моделей больше не стало.

В сообщении ниже грид на 700+ изображений, сгенерированных на популярных XL моделях. Не смотрите его если не хотите испортить себе вечер. Лучшие кадры из грида уже в этом посте.

____
У капибары лапки • подписаться

❤22❤‍🔥3

48.2K viewsГлеб, 15:43

У капибары лапки | StableDiffusion: Extensions\Tools\Models\Tokens

00112-34710x43508_SDXL_not_hehe.png

1.3 GB

Иллюстрация к предыдущему посту, на полноценное исследование этот скромный тест не претендует.

Размер файла не шутка. Это действительно картинка в формате png, грид с результатами генерации на самых популярных здесь и сейчас XL моделях.
По просьбе читателей конвертировал пнг в джипег, файл на 330 мегабайт в комментариях.

Грид сгенерирован на простых настройках:
• 1024х1024, Steps: 50, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 2119011767,
• 3 коротких промпта: landscape, nature, forest
• 11 моделей из топа цивиты (один клепатель мерджей попал в список трижды просто потому, что клепает быстрее, чем я нашёл время на запуск генерации грида).
• 3 негативных промпта с разным смыслом ("нарисуй что-то фотографичное", "нарисуй что-то удачное", "рисуй изо всех сил").

Steps: 50, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 2119011767, Size: 1024x1024, Model hash: df64bcef34, Model: copaxTimelessxlSDXL1_v5, Script: X/Y/Z plot, X Type: Prompt S/R, X Values: "landscape, nature, forest", Y Type: Checkpoint name, Y Values: "SDXL\\copaxTimelessxlSDXL1_v5.safetensors [df64bcef34],SDXL\\crystalClearXL_ccxl.safetensors,SDXL\\juggernautXL_version2.safetensors,SDXL\\juggernautXL_version3.safetensors [c4b501713f],SDXL\\juggernautXL_version4.safetensors,SDXL\\leosamsHelloworldSDXLModel_reality30.safetensors,SDXL\\nightvisionXLPhotorealisticPortrait_beta0702Bakedvae.safetensors,SDXL\\protovisionXLHighFidelity3D_beta0520Bakedvae.safetensors,SDXL\\realvisxlV10_v10VAE.safetensors,SDXL\\sdxlUnstableDiffusers_v6StabilityEater.safetensors,Y.SDXL\\dreamshaperXL10_alpha2Xl10.safetensors [0f1b80cfe8],Y.SDXL\\dynavisionXLAllInOneStylized_beta0371Bakedvae.safetensors,Y.SDXL\\rundiffusionXL_beta.safetensors", Z Type: Prompt S/R, Z Values: "\"cartoon, painting, illustration, (worst quality, low quality, normal quality:2)\",\"(deformed, distorted, disfigured:1.3), poorly drawn, blurry, dof, depth of field, bokeh\",  ", Version: v1.6.0

❤‍🔥12❤9

4.46K viewsГлеб, edited 15:44

У капибары лапки | StableDiffusion: Extensions\Tools\Models\Tokens

#Midjourney

Rank Pairs
https://www.midjourney.com/app/rank-pairs/

"Тиндер" сгенерированных на Midjourney изображениях. Доступен (увы) только при активной подписке любого уровня.

Способ найти что-то новое, ещё не попавшее на вкладку Explore (или Community Showcase, если у вас нет активной подписки).
Источник вдохновения, новых токенов или конструкций и пополнения избранного.

— Удобнее ли это главной civitai.com?
— Несомненно.

____
У капибары лапки • подписаться

❤12❤‍🔥5

4.56K viewsГлеб, 07:22

About

Blog

Apps

Platform