Метаверсище и ИИще

Я очень, прям очень переживаю и одновременно хочу выпить за всех этих супер-героев. Не без удовольствия

Точнее за конские бюджеты на их производство.
Многие уже выросли на них и не замечают бессмысленности происходящего на экране, ибо новая насмотренность, коды и все такое. Но когда-то трава была зеленая, а кино осмысленным, но с 2009 года и чуть раньше, что-то пошло не так. Ну точнее так, с точки зрения заработка, а не осмысленности.
Еще 15 лет назад, великолепный Женя Вендровский делал пророческий доклад "Комикс рулит Голливудом"
https://cgevent.ru/archives/724
С тех пор стало только .. сильнее.
Это я к тому, что производить комиксоподобные истории с минимумом смыслов будет все проще. Их будет все больше, они будут все проще. И тут ИИ будет несложно спуститься на уровень кожаной культуры потребления и дать им то, что они хотят.

Просто исторгнув вот такой вот промпт:
"Close-up of the Hulk seated at a tiny café table, his massive hands holding delicate tweezers. In front of him is a small, elegant plate of pastel macaroons. With extreme precision, he uses the tweezers to delicately place a macaroon in his gigantic mouth, pleasure as he chews each one delicately."

Это Minmax, если что.

@cgevent

👍24🔥13😁4❤2👎1

8.54K viewsSergey Tsyptsyn ️️, 13:17

Метаверсище и ИИще

А знаете, кто скрывался под загадочным названием blueberry - модели, которая в клочья разорвала Image Arena? (я писал тут)

Это FLUX1.1 [pro]!!

Срочно читаем про Announcing FLUX1.1 [pro] and the BFL API тут:

https://blackforestlabs.ai/announcing-flux-1-1-pro-and-the-bfl-api/

Это доступ только по API.
Никаких новый Flux Dev или Schnell, кодов, весов и прочая - не анонсированно.

Я проверил, на Glif.app пока не завезли.

"FLUX1.1 [pro] генерирует в шесть раз быстрее, чем его предшественник FLUX.1 [pro], при этом улучшая качество изображения, оперативность и разнообразие. В то же время мы обновили FLUX.1 [pro], чтобы генерировать тот же результат, что и раньше, но в два раза быстрее." - тут я запуталсо.

1🔥29👍7😱7

8.02K viewsSergey Tsyptsyn ️️, edited 13:56

Метаверсище и ИИще

Forwarded from Psy Eyes

2:50

Media is too big

VIEW IN TELEGRAM

Небольшой тест MIDIJourney.

Suno и Udio вам при упоминании конкретных артистов и треков откажутся что-либо генерить. А вот языковым моделям (LLM) всё-равно.

Попросил Perplexity (будет работать и с другими, имхо) расписать промты на кик, бас, синты, итд. Дальше просто закидывал их в MIDIjourney внутри Ableton и генерил миди.

Не все инструменты звучат сразу годно, да и это не Prodigy как в промте, но так как мы в DAW, то тут можно детально отредактировать звук в отличие от музыкальных генераторов.

Для голоса можно дорожки экспортировать в Suno и сгенерить его поверх. Скачать вокальный стэм, и, если нужно, вправить слова через Udio.

Дальше, чтобы всё собрать гармонично всё также нужны ручки и скиллы.

Гитхаб

2👍34😁5🔥3

6.06K viewsSergey Tsyptsyn ️️, 14:27

Метаверсище и ИИще

1:10

This media is not supported in your browser

VIEW IN TELEGRAM

1:30

This media is not supported in your browser

VIEW IN TELEGRAM

Тут OpenAI сделал AI Notebook++. Нет, скорее Wordpad.

Подписчики мне пишут, что это типа аналог Курсора, но давайте немного разберемся.

Я тут часто поругиваю OpenAI за то, что технологии космические, а продуктовые упаковки - ну такое.
Плагины, не взлетевший магазин джипитишек, сам интерфейс chatGPT - все это похоже на "давайте быстро сделаем вебморду" и поглядим.

В общем к chatGPT прикрутили возможность редактировать его ответы примерно как в любом текстовом редакторе.
Но "редактировать" не тыкая пальчиком в букафки (хотя и это тоже), а промптами, то есть указаниями типа "перепиши кусок", "напиши что думаешь по этому поводу", "убери воду, графоман".
А обновления будут прямо в тексте!

Да, для кодинга это тоже работает и по идее для кода это здорово, когда можно работать с выделенными кусками. Но я вот не уверен, что это прям конкурент курсора - тут замысел более широкий и менее нишевый - редактирование текста беседой с автором текста (chatGPT).

В общем поглядите два видоса, все сами поймете.

P.S. У Гугла и Микрософта продуктовая экспертиза примерно в 1000 раз лучше, чем у openAI, поэтому я думаю, что интеграция в продуктах Гугла или в Офисе будет на порядок.. ловчее.
Но мы же любим chatGPT не за это..
А за красоту и за идею.

У меня еще не появилось...

@cgevent

5❤38👍14🔥8

6.77K viewsSergey Tsyptsyn ️️, 18:55

Метаверсище и ИИще

К вопросу о генерации контента. Причем хорошего контента.

Моя ранняя риторика состояла в том, что сейчас ИИ засрет весь интернет среднего и шлакового уровня контентом, а мы будем платить деньги за просеивание и доступ к нормальному контенту.

Похоже ИИ засрет интернет хорошим контентом. Основательно притом. Ибо уже умеет.

Смотрите, вот последний твит Адрея Карпатого:

За последние ~2 часа я подготовил новый подкаст из 10 эпизодов под названием "Histories of Mysteries".
Найти его на Spotify можно здесь

10 эпизодов этого сезона:
Эп 1: Затерянный город Атлантида
Эп 2: Багдадская батарея
Эп 3: Колония Roanoke
Эп 4: Антикитерский механизм
Эп 5: Манускрипт Войнича
Эп 6: Крах позднего бронзового века
Эп 7: Ого! сигнал
Эп 8: Мария Целеста
Эп 9: Гöбекли-Тепе
Эп 10: LUCA: Last Universal Common Ancestor

Процесс:
- Я исследовал крутые темы, используя ChatGPT, Claude, Google
- Я связал NotebookLM с записью в Википедии по каждой теме и сгенерировал аудио подкаста
- Я использовал NotebookLM для написания описаний подкаста/эпизодов
- Ideogram для создания всех цифровых артов для эпизодов и самого подкаста
- Spotify для загрузки и размещения подкаста

Я сделал это как исследование пространства возможностей, открываемых генеративным ИИ, и механизмов, доступных при использовании ИИ. Тот факт, что я, как один человек, могу за 2 часа создать подкаст, кажется мне просто невероятным. Я также полностью понимаю и признаю потенциальную и непосредственную опасность, когда сгенерированные ИИ помои захватывают интернет. Думаю, послушайте подкаст, когда пойдете гулять/ездить в следующий раз, и поглядите, что вы думаете об этом.

А теперь просто послушайте, это не просто слушабельно, это интересно.

Ну и про засирание интернета. Как только вышел OmniGen, я облазил весь твиттор, реддит и гитхаб (код в октябре) и потом оказался по ссылкам на Youtube. Так вот, там оказалось (через пару дней после анонса) тьма подкастов про OmniGen! Я, алкая, полез слушать, и понял, что инфоцыгане, набивающие трафик, тупо берут хайповые бумаги или новости, фигачат это в подкасты и заливают ютюб таким вот добром.

Куда это все прикатится, я уже не понимаю..

https://open.spotify.com/show/3K4LRyMCP44kBbiOziwJjb

@cgevent

👍32🔥13😱7👎5❤1

6.92K viewsSergey Tsyptsyn ️️, edited 19:34

Метаверсище и ИИще

На Глифченко завезли Флюксенко 1.1 Про

Короче, на glif.app появился Flux 1.1 Pro

Причем дают 20 генераций в день и они быстрые. И в отличие от остальных платформ, тут дают порулить и сидом, и, что важно, Steps. А то на каком-нибудь Freepik или Replicate ничего нарулить нельзя.

Go Glif!

@cgevent

🔥22👍7❤4

7.16K viewsSergey Tsyptsyn ️️, 20:04

Метаверсище и ИИще

0:30

This media is not supported in your browser

VIEW IN TELEGRAM

0:17

This media is not supported in your browser

VIEW IN TELEGRAM

0:11

This media is not supported in your browser

VIEW IN TELEGRAM

ИИ-люди, астанавитесь!

Новый апдейт Хедры:

Character-2 - новая foundation model для генерации
Вертикальные видео (Тикток ликуэ)
Нет ограничения на соотношения сторон
Ну и самое главное, приподзатащили качество наконец-то!
Мылит точно меньше.
Ну и в отличие от Хейгена Хедра умеет приподдать эмоций, даже когда в аудиотреке тишина.
Ну и 4 минуты!

В демо-ролике у них, конечно, все сладчайше, но мы-то сразу видим пост.
Поэтому вот вам пара новоиспеченных роликов прям из Хедры.
Да, качество подтянули, но видно, что сильно зависит от исходника, и, мне кажется, от освещения на исходнике.
Ну и в отличие от Хейгена на вход можно присовывать любые генерации-фантазии, а не только фото.

Пластилиновый перс на демо - огненный конечно.

И у них до фига бесплатных кредитов и они не падают!
https://www.hedra.com/

@cgevent

👍50❤9👎5😁4🔥3

8.58K viewsSergey Tsyptsyn ️️, 20:06

Метаверсище и ИИще

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

Утренняя разминка с визуализацией.

Сегодня на завтрак ряды Фурье божественно представленные в лаконичном виде.
И да, в пределе нужно бесконечное количество окружностей.

P.S. Чтобы приукрасить пост и сделать его менее скучным, попросил chatGPT написать промпт, иллюстрирующий природу рядов Фурье. Потом сгенерил эти картинки в DALL·E 3 и Flux 1.1

@cgevent

2👍46❤8👎2🔥1😱1

6.47K viewsSergey Tsyptsyn ️️, 09:38

Метаверсище и ИИще

Тут интернетик приподвзорвался новым "хаком" для генерации во Flux.

Выглядит это примерно так:

Try using a prompt like "IMG_1025.HEIC" to get very very realistic images with FLUX1.1.

Это я взял с линкедИна, на твитторе пишут:
If you give FLUX1.1 a prompt like "IMG_1018.CR2" you get back images that are so very hard to tell they're AI.

Вы можете также использовать хорошо знакомые по телефонам: DSC_0123.JPG

Если не просто репостить, а немного потестить, то выясняется, что линкедыновские просто переизобрели все эти олдскульные теги из Stable Diffusion 1.5, типа "wow", "trending on artstation" или "redshift render".

Я погонял это в Фордже для Flux.Dev - благо там есть Plot X\Y\Z - эти промпты дают рандомные картинки, но можно убедить себя, что они как будто фотки (но нет). Там много мусора.

Флюкс Про 1.1 по ним генерит в основном ... траву. И цветочки.

Ну а теперь делаем простой эксперимент - во Флюксе 1.1, чтобы как у людей.

photo of a chineese character
photo of a chineese character DSC_0123.JPG

Получаем иллюстрацию для первого промпта и закос по 3Д и одновременно под фото - для второго.

Ну да, получается, что эта шаманская добавка добавляет как бы фоториал стиль.

В этом смысле - это лайфхак, потому что Флюкс не очень дружит со стилями из коробки и без Лор.

Но это очень частный случай.

И, кстати, это будет работать только на коротких промптах.

Ну и попробуйте понять, где тут пара из Pro 1.1, а где Dev.

Кстати, я немного еще потестил - "raw photo" в промпте дает похожий эффект

@cgevent

👍18😁11❤2👎1🔥1

6.4K viewsSergey Tsyptsyn ️️, 11:05

Метаверсище и ИИще

Ну и вот вам иллюстрация, что этот лайфхак не работает во многих случаях. Текстовый энкодер уводит в другой домен.

Тут вот так (Про 1.1 в Глиф, Seed 10, 9:16, 35 steps):

picture of a chineese character
picture of a chineese character DSC_0123.JPG (вторая картинка)

@cgevent

😁13👍6👎2❤1🔥1

6.54K viewsSergey Tsyptsyn ️️, 11:10

Метаверсище и ИИще

0:12

This media is not supported in your browser

VIEW IN TELEGRAM

0:03

This media is not supported in your browser

VIEW IN TELEGRAM

Тут можно потихоньку наливать за постпродакшены в рекламе и даже за модизов(понемногу).

Иллюстрация того, что зумеры НЕ изобрели Elastic Reality и что это не морфинг картинок.
А хороший такой 3Д-морфинг (со светом и тенями!).

И это одна кнопка! И две картинки - начальный и финальный кадры в Luma Dream Machine.

Ну, за моделинг, анимацию, текстуринг и рендер, не чокаясь.

@cgevent

👍53🔥19😁8❤6👎3

7.17K viewsSergey Tsyptsyn ️️, 11:41

About

Blog

Apps

Platform