Метаверсище и ИИще

Подсобрал для вас видосов из нового грядущего Клинга 2.1, который пока в Early Access.

Надо сказать, что после Veo3, конечно, сложновато смотреть на пережженные цвета, пластиковую кожу и немых персонажей.
Я, конечно, перебираю щщами и бешусь с жиру. Год назад у нас была только неведомая и недоступная Сора, а теперь видеогенераторов есть на любой вкус и цвет.

Veo3 вплотную подошел к планке качества картинки, за которой начнется гонка инструментов. И тут у Клинга есть пока пара козырей. Но инструменты дело наживное.

Ждем веб-монтажек от всех.

@cgevent

👍45❤10🔥2😱1

8.96K viewsSergey Tsyptsyn ️️, 10:46

Метаверсище и ИИще

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

Зато Kling 2.1 умеет вот так

The person strides confidently down the runway, raises the sword high with one hand, and gives a sharp look to the camera, which tracks backward smoothly and keeps pace from a low angle.

Image2video.

Больше примеров и промптов из 2.1 тут.

@cgevent

🔥61😁5❤2

8.17K viewsSergey Tsyptsyn ️️, 11:02

Метаверсище и ИИще

Помните Николая Иронова и доисторический лого-генератор от студии Лебедева?

Делали его очень смышленые ребята, и он, в каком-то смысле, сильно обогнал время. На тот момент никто и близко не делал что-то подобное.

А теперь это просто промпт для chatGPT:

Create a flat, iconic logo for a brand called [Brand Name], which operates in the [Industry/Niche] field.
The logo must be simple, bold, and concept-driven. Use a [Primary Color] and [Secondary Color] palette.
Incorporate abstract or symbolic shapes that represent the brand’s values or purpose — think clever geometry, subtle negative space, or minimal monograms.
Place the brand name below the icon in modern sans-serif typography, centered and styled with the chosen colors.
Use a clean white background. No shadows, no gradients.
Final result should feel premium, unique, and instantly recognizable — like it belongs to a real, future-ready brand.

Лого CG Event прям хорошо по смыслу.

@cgevent

👎28🔥27👍13❤6😁1

8.75K viewsSergey Tsyptsyn ️️, 11:37

Метаверсище и ИИще

0:07

This media is not supported in your browser

VIEW IN TELEGRAM

Пока Unitree мочат друг друга ногами, как в фильме Живая Сталь.. НейроДзюба такой: щас, прицел передерну.. и попаду. Если не упаду...

Футбол - это вам не MMA! Ноги прочь, нейротвари!

@cgevent

😁104❤8👎2👍1

11.1K viewsSergey Tsyptsyn ️️, edited 11:54

Радиио Африика.

Я довольно ровно дышу к БГ. Мои два любимых альбома это Табу и Радио Африка (и Синий Альбом). Там довольно забавные именно музыкальные эксперименты. Всегда хотел услышать каверы на Радио Африка, к которому приложили руку Курехин и Бутман.
И, конечно, я призвал на помощь Лешу Кондакова и его AI RADIO.
Оказалось (о, чудо), что SUNO кушает песни Аквариума напрямую, без плясок, и не ругается на копирайт. Видать ранний БГ не попал в базы.
Короче, держите каверы на Радио Африка. Особенно доставляют "рок-н-ролл мертв" и "мальчик евграф".
Suno 4.5 - это просто огнище плазменное. Там под капотом не только "перемешиватель песен", там целая LLM, которая считывает вайб и с текста, и с музыки, и аккуратно замешивает его в свои генерации. Суно "понимает" музыку. Возможно лучше, чем вы.

@cgevent

👍51🔥31👎4

8.8K viewsSergey Tsyptsyn ️️, 10:00

Метаверсище и ИИще

0:26

This media is not supported in your browser

VIEW IN TELEGRAM

Еще одна не пережеванная новость с Google I\O.

Gemini 2.5 Flash Preview TTS - генерилка речи по тексту. И не просто голоса и речи, ИИ может петь, орать, чихать и кашлять.

Я открыл AI Studio и нашел это в разделе Generate Media.

Поглядите, как народ издевается над ней, заставляя петь дурными голосами.

Причем есть мультиспикер-режим, 30+ голосов на выбор, поддержка русского тоже есть.

https://aistudio.google.com/generate-speech

@cgevent

😁42👍29🔥14❤1

8.69K viewsSergey Tsyptsyn ️️, 10:12

Метаверсище и ИИще

0:19

This media is not supported in your browser

VIEW IN TELEGRAM

0:22

This media is not supported in your browser

VIEW IN TELEGRAM

0:17

This media is not supported in your browser

VIEW IN TELEGRAM

А chatGPT не отстает! В него вернули режим пения!

Причем и в голосовом и в текстовом режимах.

Сбрасывайте свои хиты в коменты.

@cgevent

😁29👍12👎6🔥3

8.16K viewsSergey Tsyptsyn ️️, 10:18

Метаверсище и ИИще

Пока Европа смотрит, как Veo3 раскатали в Никарагуа и бьется в истерике, осваивая ВПН

Всё 15-миллионное население ОАЭ вскоре получит бесплатный доступ к ChatGPT Plus, став первой страной, реализующей подобную инициативу. Этот шаг является частью более широкого партнерства между OpenAI и правительством ОАЭ, которое также включает в себя развитие Stargate UAE, массивного центра обработки данных ИИ в Абу-Даби.

15 миллионов умножить на 20 долларов подписки в месяц.
300 миллионов в месяц, 3 600 000 000 долларов в год.

В - Возврат инвестиций.

@cgevent

❤45🔥39👍13😁5

19.7K viewsSergey Tsyptsyn ️️, 10:27

Метаверсище и ИИще

0:41

This media is not supported in your browser

VIEW IN TELEGRAM

Французы из kyutai, авторы Мойши выпустили свою платформу для создания голосового режима над любой LLM.

Это TTS и STT одновременно, с ультра малой задержкой и возможностью начать воспроизводить речевой ответ ДО того, как обработается весь кусок TTS.

На сайте и на видео используется Gemma 3 12B в качестве LLM.

Хотя каскадные системы теряют ценную информацию, такую как эмоции, ирония и т. д., они обеспечивают непревзойденную модульность: поскольку три части системы разделены, вы можете дать голос любой LLM, который хотите, без какой-либо настройки или адаптации.

На сайте вы сможете протестировать эту универсальность, настраивая системную подсказку Gemma 3, чтобы создать индивидуальность вашего цифрового собеседника, и самостоятельно изменяя голос TTS.

Модели преобразования речи в текст и текста в речь оптимизированы для низкой задержки. Модель STT работает в потоковом режиме и включает в себя семантическое определение активности голоса вместо того, чтобы полагаться на внешнюю модель. Модель TTS работает в потоковом режиме как в аудио, так и в тексте, то есть она может начать говорить до того, как будет сгенерирован весь ответ LLM. Вы можете использовать 10-секундный образец голоса, чтобы определить голос и интонацию TTS.

Ну и самое главное - это пойдет в опенсорс через пару недель.

https://unmute.sh/

@cgevent

🔥67❤4👍4

8.95K viewsSergey Tsyptsyn ️️, edited 10:48

Недавно предлагал выпить за репортажку и документалки.

Продолжаю настаивать. Настоечка из Veo3 и Veo2 просто крепчайшая.

Поглядите на титры и липсинк. Вы просто не будете в состоянии отличить булшит от реальности (хотя реальность местами сильно похожа на булшит, честно говоря).

Тут в коментах спрашивали, как достигается консистентность лиц.

С помощью Veo2: сначала генерятся Veo3-клипы, потом там где надо выдирается лицо стоп-кадром и кормится в ингредиенты Veo2, который умеет принимать их на вход. В нарезке замешиваются Veo3 и Veo2.

Ну за реальность, не чокаясь.

@cgevent

👍48🔥40😱13👎2❤1

9.96K viewsSergey Tsyptsyn ️️, edited 10:58

About

Blog

Apps

Platform