У капибары лапки | StableDiffusion: Extensions\Tools\Models\Tokens
2.12K subscribers
536 photos
5 videos
20 files
237 links
Оглавление и навигация: https://xn--r1a.website/capybara_paws/32

Консультации и предложения:

Рисую: https://www.artstation.com/capybara_paws
О канале: https://xn--r1a.website/capybara_paws/2
Download Telegram
#расширение #Automatic1111

Catppuccin
https://github.com/catppuccin/stable-diffusion-webui

Крошечное расширение, которое добавит 4 темы интерфейса в WebUI. И светлая тема, и все тёмные, выглядят интереснее стандартного набора Gradio.

Особенности:
• 1 светлая тема и 3 тёмных на выбор
• Светлая тема выглядит немного недоработанной из-за слишком светлых полей для ввода текста и комбо-боксов
• Тёмные темы выглядят многократно лучше --theme dark
• 14 цветовых схем для ключевых кнопок интерфейса (14 х 4 = 52 возможных комбинаций)
• Сочетается с темами Gradio (User interface - Gradio theme)
• В некоторых расширениях может не покрасить отдельные элементы. Но в большинстве случаев всё будет работать.
• Проверял работу только на WebUI от Automatic. Не знаю, совместимо ли оно с Vladmandic и другими форками.

____
Stable Diffusion: инструменты, расширения, модели, токены
7
#расширение #Automatic1111

Kitchen Theme
https://github.com/canisminor1990/sd-webui-kitchen-theme

Затронув тему нескучных обоев стоит упомянуть Kitchen Theme, более популярное, чем Catppuccin, расширение. Помимо улучшения цветовой схемы WebUI оно значительно изменяет интерфейс.

Особенности расширения
• Поддерживает светлую и тёмную темы Gradio (переключаются одной кнопкой в интерфейсе).
• Обе темы выглядят не хуже, чем стандартные темы Gradio.
• Переносит редко используемые элементы (выбор модели, лоры, вае, погружения в клип, ect) на боковые панели, которые скрываются и вызываются одним кликом. Это освобождает больше место и по вертикали, и по горизонтали. Удобно для мониторов с небольшим разрешением.
• Функция форматирования промпта: в один клик можно удалить лишние пробелы и запятые (запятая — токен, который влияет на результат генерации).
• Добавляет инструмент создания и редактирования промпта токенами, наподобие All Prompt In One, только неудобный. Или сломанный в момент написания обзора? У меня не получилось превратить свой промпт в тэги, а добавление новых тэгов стирало весь промпт.
• Стандартный набор тэгов можно заменить на ваш словарь. Файлы лежат в stable-diffusion-webui\extensions\sd-web-ui-kitchen-theme\src\data
• Проверял работу только на WebUI от Automatic. Не знаю, совместимо ли оно с Vladmandic и другими форками.

____
Stable Diffusion: инструменты, расширения, модели, токены
7
#арт #этофиаско

Неудачная попытка нарисовать пасхальную открытку. По задумке композиция состояла из пасхальных яиц, пасхального зайки и пасхального кекса. Но робот ничего не знает про пасхальные кексы, зато много знает про украшенные фигурками торты.

По возможности старайтесь избегать рисования всего, о чём модели диффузии не имеют представления. Иначе гарантированно получите фигню.
___
Stable Diffusion: инструменты, расширения, модели, токены
3
#мысливслух

Продолжаем рисовать еду. Попробуем чуть лучше подготовиться, взять современные модели и намазать фотографичных и фотореальных фильтров. Тест не претендует на серьёзное исследование из-за скромного размера выборки.

Даже у лучших в своём классе моделей серьёзные беды с рисованием популярной еды и посуды. Выглядит правдоподобно, если не всматриваться. Рисунки выглядят хорошо только с расстояния в несколько метров от монитора. Вблизи всё очень плохо.

В комментариях к предыдущему посту задан важный вопрос, попробую ответить на него развёрнуто.
«По возможности старайтесь избегать рисования всего, о чём модели диффузии не имеют представления.»
Где этот перечень о чём они не знают/знают?

Список формируется индивидуально, методом проб и ошибок. Если сильно обобщать, но здесь и сейчас актуальные модели хорошо (со множеством «но») рисуют только людей, на это есть запрос у сообщества. Например, фотореалистичные модели, вроде ReV Animated, дорисовывают на телах рельеф культуриста, который зачастую анатомически некорректен. О неточностях в рисовании глаз, волос, бровей, бород, пальцев, пальцев и прочих деталей вы сами всё знаете. Даже если модель в состоянии нарисовать правдоподобную пятерню, нарисовать как рука держит телефон, книгу, чашку или папиросу — колдунство высочайшего уровня. Не пытайтесь повторить это дома.

Большинство моделей удачно рисуют природу. Но чем ближе модель к фотографичности или фотореализму, тем нестабильнее результат. Все модели недурно рисуют интерьеры, но в детали лучше не всматриваться. Аналогично с автомобилями, мотоциклами, катерами и другой популярной техникой. Птицы и животные правдоподобны, но недостатков ещё больше.
В остальном — одни беды. Рисует и если не всматриваться, то сходство будет.

В комментариях к записи лежит сетка в оригинальном размере (4410x9456).
___
Stable Diffusion: инструменты, расширения, модели, токены
4
#арт

Фан-арт к замечательной Frostpunk?
Тизер интересного поста?
Обои для рабочего стола? (файлы 2048x1152 в комментариях)
Иллюстрация тезиса "диффузия недурно рисует здания, но в детали лучше не всматриваться"?

(^_<)〜☆

Первый рисунок (доработан в outpainting)
(dark magic:1.2),(grim:1.4), mountain valley, snowy village, river,  morning sunshine, (intricate details), (hyperdetailed), 8k hdr, soft cinematic light, dramatic atmosphere, atmospheric perspective
Negative prompt: blur, blurry, text, error, signature, watermark, logo
Steps: 24, Sampler: DPM++ 2M Karras, CFG scale: 6, Seed: 1658582188, Size: 1024x576, Model hash: 4199bcdd14, Model: PHOTOREAL—revAnimated_v122, Denoising strength: 0.35, Clip skip: 2, Hires sampler: Heun, Hires upscale: 2, Hires steps: 25, Hires upscaler: 4x-UltraSharp, Version: v1.3.2

Второй рисунок
(dark magic:1.2),(grim:1.4), mountain valley, snowy village, river,  morning sunshine, (intricate details), (hyperdetailed), 8k hdr, soft cinematic light, dramatic atmosphere, atmospheric perspective
Negative prompt: blur, blurry, text, error, signature, watermark, logo
Steps: 24, Sampler: DPM++ 2M Karras, CFG scale: 6, Seed: 1658582183, Size: 1024x576, Model hash: 980cb713af, Model: PHOTO—reliberate_v10, Denoising strength: 0.35, Clip skip: 2, Hires sampler: Heun, Hires upscale: 2, Hires steps: 25, Hires upscaler: 4x-UltraSharp, Version: v1.3.2
___
Stable Diffusion: инструменты, расширения, модели, токены
10
#рабочийпроцесс #арт #токен

Хочу представить собственный стиль альфа-версию с номером 0.1 стиля для создания мрачноватой атмосферы на пейзажах и портретах.

Особенности стиля версии 0.1
• Совместим практически с любыми моделями: фотореалистичными, аниме, артовыми и фотографичными
• В зависимости от промпта поможет диффузии нафантазировать лишнего. Сравните промпт (в конце поста) и рисунки на обложке.
• Яркий источник света в промпте на некоторых моделях может пережарить картинку.
• Рекомендованные значения CFG в диапазоне от 4 до 6.
• Рисование на артовом семплере семейства DPM и Hires. fix на Heun с денойзом не выше 0.4 выглядят интереснее, чем двойной проход одним и тем же семплером
• Протестирован только на коротких промптах, 1 чанк, 75 токенов.

Добавляем стиль в коллекцию
1. Открываем файл styles.csv из корневой папки WebUI любым текстовым редактором (блокнот, notepad++, wordpad, etc)
2. Добавляем в новую строку
Capybara | Somewhat Gloomy v0.1,"(dark magic:1.2), (grim:1.4), {prompt}, (intricate details), (hyperdetailed), 8k hdr, soft cinematic light, dramatic atmosphere, atmospheric perspective","blur, blurry, text, error, signature, watermark, logo, {prompt}"
3. Сохраняем файл, в интерфейсе WebUI рядом со списком стилей нажимаем кнопку "обновить"


Промпт рисунков с обложки
(masterpiece, best quality, anime, perfect anime illustration:1.3), (dark magic:1.2), (grim:1.4) dense forest, bushes with thorns, (intricate details), (hyperdetailed), 8k hdr,, high detailed, lot of details, high quality, refined
Negative prompt: (worst quality:1.3), (low quality:1.3), blur, blurry, text, error, signature, watermark, logo,

___
Stable Diffusion: инструменты, расширения, модели, токены
22❤‍🔥5
#токен

Для улучшения результата при создании фотографичных рисунков можно добавлять ворох различных токенов, например:
professional photo of
75mm camera RAW (или любой другой объектив)
f/2 (если вы понимаете что делаете)
8K HDR UHD (8k и 4k должны работать, остальные - нет)
• Модель камеры или объектива. Списки гуглируются, но их надо тестировать.
• Имя фотографа для имитации стиля.
• и другие заклинания

Есть и другой способ: добавление названия плёнки в промпт придаст рисунку особенности аналоговой фотографии, сделанной именно на эту плёнку. При использовании качественной фотографичной модели результат от единственного токена плёнки будет не хуже, чем от намазанного стиля с десятком токенов.

Особенности подборки
• 364 плёнки с примерами фотографий
• Два теста каждой плёнки на модели deliberate: со стандартным негативом и вообще без негатива (негатив может оказать сильное влияние на результат)
• Не все названия плёнок стабильно дают качественный результат, особенно на сложных промптах.
• Желательно сравнивать ваш результат с эталонами из интернет-магазинов плёнки, например тут.

Автор подборки: Максим "altervais" (altervais#7381), огромное ему спасибо

Все посты с подборками стилей.

____
Stable Diffusion: инструменты, расширения, модели, токены
❤‍🔥92
photo films.html
50.1 MB
364 плёнки для имитации стиля аналоговой фотографии
7