Метаверсище и ИИще
47.3K subscribers
6.02K photos
4.49K videos
46 files
6.92K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Новый опен-сорсный видео генератор.

Pyramidal Flow Matching for Efficient Video Generative Modeling


Обучен только на открытых наборах данных в течение 20,7 тыс. часов на A100.

Примеры - ну такое. Лучше, чем Open Sora, конечно, плюс умеет в 1280x768, 10s, 24fps.

Я бы пропустил эту новость, но в авторах - четверо из Kling (Kuaishou Technology)

Теперь придется поставить и следить за ними.

Все здесь:
https://pyramid-flow.github.io/

@cgevent
1🔥32👍8👎3
Очень любопытная новость. Нвидия рубит свой CPU?

Слухи ходили давно, ну и это прям просится в сценарий - центральный процессор от Нвидия.

В китайском инфополе прошли новости, Mediatek и Nvidia сотрудничают в создании 3-нм "ИИ-процессора"Говорят, что процессор выходит на стадию производства в этом месяце, а массовое производство запланировано на конец 2025 года.

Ожидается, что процессор "MediaTek AI" будет работать в паре с графическим процессором Nvidia. В сообщении также называются Lenovo, Dell, HP и Asus в качестве потенциальных клиентов, желающих использовать процессор в OEM-оборудовании. По слухам, цена чипа составит 300 долларов.

MediaTek в основном делает процессоры для таких устройств как медиаплееры или смарфоны. Интересно, какого рода устройства будут оснащены таким ИИ-процессором. Пишут что "настольный класс".

Qualcomm Snapdragon X Elite наделал много шума при запуске. Но про реальные продажи ничего непонятно. Ибо главная претензия была - "слабая графика".

А чип Mediatek будет оснащен графикой Nvidia - получается отличное комбо.

Ждем.
https://www.notebookcheck.net/Nvidia-and-MediaTek-to-enter-the-CPU-race-with-3nm-AI-PC-processor-slated-to-be-mass-produced-in-2025.898977.0.html

@cgevent
👍24🔥121
This media is not supported in your browser
VIEW IN TELEGRAM
В Suno доставили inpainting!

Для выделенных фрагментов можно изменять тексты песен и добавлять инструментальные паузы, например гитарный риф барабаны.

Будет работать хорошо только на длинных выделениях - от 15-20 секунд, иначе трудно втиснуться с новым вариантом. Это не чистка, это замена крупных кусков.

Ну и кстати, я опять поворчу, что микроэлементы из профсофтов вползают во все эти веб-аппы и генераторы. И это точно просится во все наши ВидеоГенераторы.

Для солидных господ (Pro & Premier users) делаем так:

1. Right-click on a song or click the vertical “...” to open the More Actions menu.

2. Go to Edit > Replace Section.

3. You’ll be taken into Edit Mode with the song. Select the song portion you wish to recreate (must be 10-30 seconds long). Lyrics (if present) will automatically be populated into the Lyrics box.

4. Update your lyrics if you wish, or try typing [drum break]

5. Click the “Replace Section” button.

6. Two versions will be generated. Listen to both and click “Select” on the one you prefer.

7. Once you select a section, you’ll be redirected to the Create page where a full song will begin generating automatically.

@cgevent
🔥49👍134
Раз уж в этому году Нобелевку дают ИИ-шникам направо и налево (хотя старик Нобель ненавидел математиков), надо было подаваться с каналом на Нобелевку по литературе 2024.
Я б даже канал бы переименовал в "Погребальная".

Дали б?

@cgevent
😁7221👎8🔥5🙏4👍1
Imagen 3 раскатали по миру, а не только в Штатах.

Спойлер: расходимся, недоDALL·E 3 какой-то.

Залез я в Гемини, а она мне такая: Imagen3 не желаешь?

Наливай, говорю.

В общем я обычно тестирую генераторы на трех промптах:

Photo of a red sphere on top of a blue cube. Behind them is a green triangle, on the right is a dog, on the left is a cat

Three transparent glass bottles on a wooden table. The one on the left has red liquid and the number 1. The one in the middle has blue liquid and the number 2. The one on the right has green liquid and the number 3

и наш любимый:
goddess princess beautiful face portrait ram skull zbrush sculpt. jellyfish phoenix head, nautilus, orchid, skull, betta fish, bioluminiscent creatures, intricate artwork by Tooth Wu and wlop and beeple. octane render, trending on artstation, greg rutkowski very coherent symmetrical artwork. cinematic, hyper realism, high detail, octane render, 8k

на совместимость со стародиффузным наречием.

В общем Gemini из коробки понимает промпт очень неплохо, там явно огромный текстовый енкодер и с пониманием все ок.
Но качество!

Ну и самое главное - она пугливая как куропатка, пишет что угодно, лишь бы не сгенерить что-нибудь "такое".

Принчессу генерить отказалась
"Я все еще учусь генерировать определенные виды изображений, поэтому, возможно, пока не смогу создать именно то, что вы ищете. Кроме того, я не могу помочь с фотореалистичными изображениями идентифицируемых людей"

Дальше интереснее:

portrait of beautiful lady

"Генерация изображений людей доступна только в раннем доступе в Gemini Advanced. Получите ранний доступ к новым функциям Gemini, подписавшись на Advanced здесь."

Грубо говоря, "люди за бабки".

Ладно, я рассматриваю инвестиции в ИИ как в карму и жизнь после сингулярности - апгрейжусь до Advanced.

И тут начинается совсем странное. Идем в следующий пост.

@cgevent
1👍20👎6😁63😱1
Gemini Advanced плюс Imagen3: тормоза на виражах.

Зарегистрировал Gemini Advanced.

И по какой-то неведомой причине скорость генерации упала раза в три (может модель другая? вряд ли)

Понимание промпта снизилось, собачки и бутылочки явно погрустнели, недолив и тоска.

Но появились люди.

Я погонял разные промпты - она очень нестабильная, прям очень.
Кожа в основном пластиковая, но девушку на траве сделала.

С пальцами ок.

Ну и главное наблюдение - не любит короткие промпты, любит хорошее описание.

Но если оно слишком длинное - отказывается. Не могу, говорит, я лишь языковая модель.

Хорошая новость - лимита я не нащупал. Но скорость, пугливость и нестабильнось делают ее непригодной. Ну для меня...

И люди за бабки - это конечно маркетинговый ход.

уж лучше chatGPT...

Потестируйте на логотипах что ли...

@cgevent
2👍306🔥3👎1
На фоне новостей про массовое применение ИИ в программировании и разработке, хорошо бы понять, а что думают сами разработчики, а не журналисты.

Компания Экопси проводит масштабный опрос на эту тему.

Что нужно сделать для участия?
Честно и вдумчиво ответить на вопросы по ссылке, а в конце ввести свой ник в Telegram или адрес почты.

Что дает участие в опросе?
➡️возможность узнать о новых семействах и моделях генеративных нейросетей,
➡️повод задуматься о том, что на самом деле важно в использовании и выборе нейросетей именно для вашей работы.

Среди участников опроса также разыгрываются:
▪️годовой доступ к Telegram Premium
▪️месяц премиум-подписки на ChatGPT
▪️подписку на два месяца в Альпина Digital

Опрос займёт не больше пяти минут, но принесёт много пользы тем, кто занимается разработкой. Не пожалейте пяти минут, польза будет для всех.
#промо
erid=2VtzquoHf7g
👎26👍4🙏21🔥1
Krea Video Generator.

Точнее Krea Video Aggregator.

Креа молодцы, конечно.

Они норовят стать этаким генеративным хабом с инструментами для нормальных людей. Без этих вот Distillation CFG.

Как вы помните, они уже завезли к себе Флюкс, а сейчас и вовсе сделали ход конем.

У них уже есть свой видеогенератор, но он немного тряпочный - это код AnimDiff и там все немного кипит.

И тут они просто взяли, и пристегнули на сайт Люму, Рунвей, Клинг и Минимакс!

В одном окне!

Выбираешь, чем генерить, промпт, картинка и Большая Кнопка. И все!

Бета-фича, только для платных тарифов.
Я настолько растрогался, что оплатил месяц и ну генерить. За 10 баксов. Все, Везде и Сразу!

Но поздно. Их сервера уже повалили. Точнее, сервера их провайдеров.

Мне удалось сгенерить воина в Люме, по двум кадрам.
И бокал в Люме и Клинге. По тексту.
И все, потом все упало.

Там немного старый АПИ. В Рунвей нет последнего кадра. В Клинг и Минимаксе - только текст на вход.

Но я успел насладиться гениальным трюком.

Пока идет генерация, вам показывают "ход мыслей модели". Мне кажется, там рандомные умные фразы, но я даже успел записать для вас видос (см выше). И ты такой ждешь генерацию, читаешь, киваешь, да, дорогая, давай, поднажми.

В общем с одной стороны есть Адобченко и у него есть полный фарш по UI\UX и юзербазе.
Но Одна модель, и своя.

С другой стороны, рано или поздно появится такая МетаКреа, которая просто будет дергать за ВСЕ ГЕНЕРАТОРЫ ПЛАНЕТЫ, а вы только будете перебирать щами(генераторами), кричать "еще" и платить за подписку и кредиты.
В ОДНОМ МЕСТЕ!

Молодцы Креа, додумались быстро.

Завтра пойду пробовать еще...

ПС. 4 видоса съели у меня 20% от 10 баксов.

@cgevent
👍60🔥238😱2👎1