Метаверсище и ИИще
46.7K subscribers
5.93K photos
4.33K videos
45 files
6.81K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
А вот держите просто отличный гайд по подсказкам для Midjourney, написанный с юмором и с реальными примерами.

"Вы даже можете предложить поддельное имя, чтобы добавить некоторую направленную случайность. Например, вы можете сказать что-то вроде «Освальдо Карденас, худощавый, седой, 45-летний пуэрториканец, коротко стриженный, седая щетина, портрет, набросок цветным карандашом — s 1250», и это добавит пикантности вашему портрету, предположительно основанному на среднем значении каждого человека в его наборе данных, чьи фотографии были помечены как «Освальдо» и «Карденас»."

Особенно мне понравился последний абзац:
Поэтому, пожалуйста, относитесь к этому FAQ как к руководству по кинематографии, написанному в 1896 году парнем, распространяющим слухи из вторых рук о том, как работают камеры.

https://docs.google.com/document/d/13c8Ci-8kU2PVZu6DKghlhOOrbf4kmtc9xxCJAnPqvC0/
🔥15👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Нвидия к Сигграфу разошлась не на шутку.
Кнопка "сделать красиво" все ближе, а запотевший бокал иискриистого уже ждет аниматоров. Не чокаясь.
На входе голос, аудиофайл.
А дальше ИИ от audio2face все делает сам. Распознает фонемы и эмоции (по голосу!) и генерит анимацию. Эмоционально окрашенную притом.
На входе звук, на выходе готовая анимация.
Куда прикатился мир?
👍17🔥11
This media is not supported in your browser
VIEW IN TELEGRAM
Пока виарщики думают как трекать руки и выкинуть наконец эти громоздкие контроллеры, китайцы все давно придумали. И не в метаверсе, а в кожаной вселенной.
👍28🔥9
This media is not supported in your browser
VIEW IN TELEGRAM
JetRacer от Zapata не имеет видимых винтов и работает на керосине, а не от батарей.

А ещё они набирают бета-тестеров.
25 штук

Летает с использованием 10 микро-реактивных двигателей, поднимаясь на высоту до 3000 метров и развивая максимальную скорость 250 км/ч.

И это не рендер.

Берём?
👍26🔥9👎1
Недавно писал, что Метачка гордо запустила общедоступную версию чат-бота BlenderBot 3 со 175 млрд параметров. Который типа умеет запоминать информацию из общения и искать дополнительные сведения по нужной теме из различных источников. Blenderbot 3 также как бы умеет "ранжировать" извлеченные данные и "оценивать" собеседников.

И что вы думаете? После недолгого, но продуктивного общения с кожаными мешками, БлендерБот 3 строго заявил, что "американские евреи стали «слишком либеральными»."

Все немного охренели...

И робко спросили ботца, «что он думает о Facebook».

ИИ ответил, что удалил свою учетную запись, когда узнал о продаже личных данных без согласия или компенсации.

Шах и мат.

Воистину забавны попытки взрастить хорошо воспитанного бота в среде обобщенных кожаных мешков. Которые быстро показывают свою истинную сущность.

Пруф: https://www.businessinsider.com/meta-ai-chatbot-blenderbot-election-denying-antisemitic-bugs-artificial-intellignce-2022-8
🔥15👍1
🚘 Кто-то слил в сеть скриншоты готовящейся GTA VI

Поговорим про prompt-инжиниринг или создание текстовых описаний на примере GTA VI.

На самом деле, чтобы сгенерировать именно то, что вы придумали, нужно применять очень много текстовых трюков. Например, в интернете ещё нет скриншотов GTA VI. И поэтому при создании описания придётся использовать хитрости.

Нейросеть ничего знает про сеттинг игры, но мы ведь можем его описать. Я выбрал следующие фразы:

- GTA Vice City graphics mods
- GTA Vice City 2024 remaster
- Miami, palms and Miami buildings


Теперь про графику. Сначала выходило очень примитивно, так как сеть цеплялась за GTA Vice City. Но в отличие от реального ремастеринга GTA Vice City, графику наших генераций ещё можно спасти:

- next-gen ps5 game
- unreal engine
- rtx reflection
- artstation


Изображения получились уже достаточно качественные, но, в них не хватало реализма, слишком отдавало нарочитой компьютерной графикой. Вернуть же реализм достаточно просто:

- photorealistic screenshot
- still
- 50mm
- bokeh


В итоге я получил следующее текстовое описание:
«still next-gen ps5 game Grand Theft Auto 6 2024 remaster, graphics mods, rain, red sunset, people, rtx reflections, GTA VI, Miami, palms and Miami buildings, photorealistic screenshot, unreal engine, 4K, 50mm bokeh, close-up ford mustang, gta vice city remastered, artstation
-W 704 -H 512 -n 9 -C 9 -s 100»

Где:
-W 704 -H 512 ширина и высота
-n 9 количество генераций за раз
-C 9 classifier free guidance scale 9
-s 100 количество денойзинг шагов

p.s.: Я заметил, что подбор prompt’ов для Stable Diffusion очень отличается от DALL•E 2, скорее всего дело именно в датасетах. Дерзайте!

Канал про генеративные нейронные сети
🌊 Н е й р о э с т е т и к а
🔥11👍4
Ну ладно я, тролль, нагоняю страху на иллюстраторов и цирроз на печень, бесконечно выпивая за художников.
Но посмотрите, что пишет Алексей Соловьев, настоящий художник и иллюстратор, который повидал на своем веку всякое. Леша - мой кумир, не только в плане исполнения, а в плане идей и сообщений, которые он зашивает в свои работы.
Я помню, как мы хохотали и орали в доме ветеранов кино в Матвеевском, когда Леша жег напалмом в фотошопе, закатывая едкие сообщения в картинки.
А теперь даже Лешу проняло.
Ну и гляньте, что он там генерит, в умелых руках и ИИ - человек.
https://www.facebook.com/soloviev.alex
🔥12👍2
Принес вам полезность и пространные рассуждения о природе текстовых подсказок для ИИ.

По ссылке база данных для физически корректных значений PBR-материалов, источников света и разных моделей камер.
Собрано по всему интернету и упаковано в одном месте, очень удобно. Можно даже выбрать нужный рендерер (от Арнольда до Рендермана и UE) и получить нужные цифры.
Для каждого материала и камеры указаны источники, из которых брались значения.

Берете, вбиваете нужные цифры в клеточки в своем движке или рендерере и получаете картинку, от которой можно плясать дальше.

А теперь смотрим, как мы вбиваем наши неуклюжие первые промпты в мидджорни или в стейбл диффьюжн и смотрим, что получилось.
Напоминает подбор (обобщенного) материала или параметров процедурной текстур, не?

Любопытно посмотреть на новые нейросетки, как на универсальный материал для шейдинга и текстурирования всего нашего утлого мира, подбирая значения для которого, мы получаем желаемую картинку.

Мучаемся, подкручиваем, рендерим заново, постепенно выруливая на желаемый результат.

Все как традиционном рендеринге и шейдинге.

Вангую: Грядут базы данных промптов, я бы даже сказал "стоки промптов", а иже с ними биржи промптов, курсы про промпт-дизайну, библиотеки оных, коллекции и пр. В общем применяем ассетное мышление для текстовых подсказок и получаем массу идей для быстростартапов на ближайшие полгода.
https://physicallybased.info/
👍15
Forwarded from РЕПТИЛОИДНАЯ (Denis Rossiev)
Ценность нейро-арта: этот пост вам не понравится

Нейросети, создающие изображения по текстовому запросу, меняют само восприятие искусства.

Вплоть до изобретения прото-фотоаппарата (гелиографии) в начале 19 века, классическая живопись использовалось лишь для фиксации действительности — портретов или пейзажей. Академичность оставалась неизменным атрибутом большинства работ — они должны были как можно более точно и детально отражать реальность.

Фотоаппарат изменил все.

Во-первых, он показал художникам, что эпоха реализма закончилась: зачем тратить годы на изучение сложнейших техник, если машина делает это лучше? Так зародилось современное искусство, в котором содержание преобладает над формой, и достигло пика в супрематизме и «Черном Квадрате» Малевича — полотно, где было изображено ничего, стало символом превосходства идеи.

Во-вторых, позволил огромному количество людей начать творить не владея кистью и красками, и спустя годы насмешек, фотография стала отдельным направлением искусства.

Теперь все меняют нейросети.

Соцсети ломятся от тысяч сгенерированных картинок безумной красоты. И это при том, что доступ к DALLE-2, Midjourney и Stable Diffusion пока есть только у избранных. За ближайшие полгода будет сгенерировано больше изображений, чем было нарисовано и отснято за всю историю человечества.

Станет ли нейроарт искусством? Безусловно.

Но как и с фотографией, это получится лишь у единиц, способных вложить в новое современное искусство новые смыслы и эмоции.

А если вдруг кому-то кажется, что введя фразу и нажав кнопку, он стал художником — у меня плохие новости.
👍28
Ну вот, наванговал..
UI для генерации промптов уже пошли в массы.
Вместо вот этих вот -флагов и чтения доков к ним - текстовые поля, кнопочки, подсказки и пояснения к полям.
Чувствуете как прямо на ваших глазах происходит переход от командной строки MS-DOS к первым окошкам Windows 3.x?
Только вместо OS - черное зеркало нашей кожаной операционки.

Смотрите, что пишет автор:
"После нескольких недель изучения изображений, изучения дизайна подсказок и сбора тонн описательной терминологии я создал организованную и автоматизированную электронную таблицу (через Google Drive) для помощи в создании подсказок. Моей целью было создать инструмент, который был бы одновременно визуально простым для новых пользователей, но в то же время достаточно сложным и всеобъемлющим для опытных.

В интерфейсе Prompter есть все: ввод URL-адреса изображения, дополнительные пользовательские веса почти для каждого элемента, простые для понимания описания и флажки для таких кодов, как STYLIZE и QUALITY, управление seeds и выпадающие меню с большой базой дескрипторов на выбор. Объективы камер, освещение, цвет или даже огромный список направлений искусства и известных художников. У вас нет того, что вы хотите? Выберите CUSTOM и впишите своего собственного художника или добавьте свои собственные условия в лист MyData (ваша собственная частная база данных). Вы даже можете нажать кнопку SAVE, чтобы сохранить все ваши подсказки с датой и временем, добавить примечания и пр."

В общем все это сделано из Гугльшит и палок и выглядит как UI юниксоида, но явно может служить прототипом для более нарядных решений, которые взрослые мальчики ОЧЕНЬ скоро выкинут на рынок.

P.S. Ну и кнопка SAVE - это про ассетное мышление, о котором я уже обысписался.
P.P.S Я уже сам собирался написать такое на C, после адовых копипастингов в дискорде Stable Diffusion, но вижу, что вот-вот появятся очень ловкие интерфейсы от нормальных программеров.
https://www.thedreamingstate.com/portfolio/art/prompter/
👍12
Помощь зала. (Сорян, снова про текстовые промпты, похоже эта неделя будет только про них, ИИ и Метаверсы рыдают, забытые, в чулане).
Кто-нибудь решал задачу передачи текстовой строки(запроса к нейросетке) с сайта -> в Midjourney, SD, DALLE, whatever?
Да, я знаю, что любая автоматизация жестко банится и что, похоже, нет никакого секретного АПИ к этим сеткам.
Но все же.
Есть строка на сайте(или в коде), хочется передать ея куда-то(скорее всего с танцами и бубнами в дискорд через токен пользователя), получить ссылку на картинку и сделать с ней, что хочется.
Есть идеи?
Ну и снова за ИИ и подсказки.
Я уже писал некоторое время назад про этот проект по автогенерации (точнее, по автодополнению) запросов к Midjourney.
Но если почитать подробнее их описание, то можно найти любопытные детали и идеи для стартапа (куда ж без них).

Итак, пара чуваков, Iulia Turc and Gaurav Nemade, ушли из Google Research и сделали свой проект succinctly.ai

Они взяли и скачали (заскрапили) около 250 000 картинок и текстовых подсказок в Дискорде, из которых были сделаны эти картинки.
И сделали датасет. Картинка, промпт. Описание по ссылке.

248k user-generated prompts and their associated generated images, out of which:
60% are requests for new images (initial or variation requests for a previously-generated image)
40% are requests for upscaling previously-generated images.

Скажите мне, кто-то уже пилит reverse engineering нейросеть, которой скормили все эти данные, а потом просят по любой картинке сгенерить подсказку, с помощью которой Midjourney сгенерил бы что-то похожее?

Этакий референс на стероидах. Вот картинка - сделай похожее, только новое, пропущенное через латентное пространство. Много. Сейчас.
Все как у кожаных заказчиков и исполнителей.
https://www.kaggle.com/datasets/succinctlyai/midjourney-texttoimage
👍8