Метаверсище и ИИще
47K subscribers
5.97K photos
4.43K videos
45 files
6.87K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Подсобрал для вас видосов из нового грядущего Клинга 2.1, который пока в Early Access.

Надо сказать, что после Veo3, конечно, сложновато смотреть на пережженные цвета, пластиковую кожу и немых персонажей.
Я, конечно, перебираю щщами и бешусь с жиру. Год назад у нас была только неведомая и недоступная Сора, а теперь видеогенераторов есть на любой вкус и цвет.

Veo3 вплотную подошел к планке качества картинки, за которой начнется гонка инструментов. И тут у Клинга есть пока пара козырей. Но инструменты дело наживное.

Ждем веб-монтажек от всех.

@cgevent
👍4510🔥2😱1
Зато Kling 2.1 умеет вот так

The person strides confidently down the runway, raises the sword high with one hand, and gives a sharp look to the camera, which tracks backward smoothly and keeps pace from a low angle.

Image2video.

Больше примеров и промптов из 2.1 тут.

@cgevent
🔥61😁52
Помните Николая Иронова и доисторический лого-генератор от студии Лебедева?

Делали его очень смышленые ребята, и он, в каком-то смысле, сильно обогнал время. На тот момент никто и близко не делал что-то подобное.

А теперь это просто промпт для chatGPT:

Create a flat, iconic logo for a brand called [Brand Name], which operates in the [Industry/Niche] field.
The logo must be simple, bold, and concept-driven. Use a [Primary Color] and [Secondary Color] palette.
Incorporate abstract or symbolic shapes that represent the brand’s values or purpose — think clever geometry, subtle negative space, or minimal monograms.
Place the brand name below the icon in modern sans-serif typography, centered and styled with the chosen colors.
Use a clean white background. No shadows, no gradients.
Final result should feel premium, unique, and instantly recognizable — like it belongs to a real, future-ready brand.

Лого CG Event прям хорошо по смыслу.

@cgevent
👎28🔥27👍136😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Пока Unitree мочат друг друга ногами, как в фильме Живая Сталь.. НейроДзюба такой: щас, прицел передерну.. и попаду. Если не упаду...

Футбол - это вам не MMA! Ноги прочь, нейротвари!

@cgevent
😁1048👎2👍1
Media is too big
VIEW IN TELEGRAM
Радиио Африика.

Я довольно ровно дышу к БГ. Мои два любимых альбома это Табу и Радио Африка (и Синий Альбом). Там довольно забавные именно музыкальные эксперименты. Всегда хотел услышать каверы на Радио Африка, к которому приложили руку Курехин и Бутман.
И, конечно, я призвал на помощь Лешу Кондакова и его AI RADIO.
Оказалось (о, чудо), что SUNO кушает песни Аквариума напрямую, без плясок, и не ругается на копирайт. Видать ранний БГ не попал в базы.
Короче, держите каверы на Радио Африка. Особенно доставляют "рок-н-ролл мертв" и "мальчик евграф".
Suno 4.5 - это просто огнище плазменное. Там под капотом не только "перемешиватель песен", там целая LLM, которая считывает вайб и с текста, и с музыки, и аккуратно замешивает его в свои генерации. Суно "понимает" музыку. Возможно лучше, чем вы.

@cgevent
👍51🔥31👎4
Еще одна не пережеванная новость с Google I\O.

Gemini 2.5 Flash Preview TTS - генерилка речи по тексту. И не просто голоса и речи, ИИ может петь, орать, чихать и кашлять.

Я открыл AI Studio и нашел это в разделе Generate Media.

Поглядите, как народ издевается над ней, заставляя петь дурными голосами.

Причем есть мультиспикер-режим, 30+ голосов на выбор, поддержка русского тоже есть.

https://aistudio.google.com/generate-speech

@cgevent
😁42👍29🔥141
А chatGPT не отстает! В него вернули режим пения!

Причем и в голосовом и в текстовом режимах.

Сбрасывайте свои хиты в коменты.

@cgevent
😁29👍12👎6🔥3
Пока Европа смотрит, как Veo3 раскатали в Никарагуа и бьется в истерике, осваивая ВПН

Всё 15-миллионное население ОАЭ вскоре получит бесплатный доступ к ChatGPT Plus, став первой страной, реализующей подобную инициативу. Этот шаг является частью более широкого партнерства между OpenAI и правительством ОАЭ, которое также включает в себя развитие Stargate UAE, массивного центра обработки данных ИИ в Абу-Даби.

15 миллионов умножить на 20 долларов подписки в месяц.
300 миллионов в месяц, 3 600 000 000 долларов в год.

В - Возврат инвестиций.

@cgevent
45🔥39👍13😁5
This media is not supported in your browser
VIEW IN TELEGRAM
Французы из kyutai, авторы Мойши выпустили свою платформу для создания голосового режима над любой LLM.

Это TTS и STT одновременно, с ультра малой задержкой и возможностью начать воспроизводить речевой ответ ДО того, как обработается весь кусок TTS.

На сайте и на видео используется Gemma 3 12B в качестве LLM.

Хотя каскадные системы теряют ценную информацию, такую как эмоции, ирония и т. д., они обеспечивают непревзойденную модульность: поскольку три части системы разделены, вы можете дать голос любой LLM, который хотите, без какой-либо настройки или адаптации.

На сайте вы сможете протестировать эту универсальность, настраивая системную подсказку Gemma 3, чтобы создать индивидуальность вашего цифрового собеседника, и самостоятельно изменяя голос TTS.

Модели преобразования речи в текст и текста в речь оптимизированы для низкой задержки. Модель STT работает в потоковом режиме и включает в себя семантическое определение активности голоса вместо того, чтобы полагаться на внешнюю модель. Модель TTS работает в потоковом режиме как в аудио, так и в тексте, то есть она может начать говорить до того, как будет сгенерирован весь ответ LLM. Вы можете использовать 10-секундный образец голоса, чтобы определить голос и интонацию TTS.

Ну и самое главное - это пойдет в опенсорс через пару недель.

https://unmute.sh/

@cgevent
🔥674👍4
Media is too big
VIEW IN TELEGRAM
Недавно предлагал выпить за репортажку и документалки.

Продолжаю настаивать. Настоечка из Veo3 и Veo2 просто крепчайшая.

Поглядите на титры и липсинк. Вы просто не будете в состоянии отличить булшит от реальности (хотя реальность местами сильно похожа на булшит, честно говоря).

Тут в коментах спрашивали, как достигается консистентность лиц.

С помощью Veo2: сначала генерятся Veo3-клипы, потом там где надо выдирается лицо стоп-кадром и кормится в ингредиенты Veo2, который умеет принимать их на вход. В нарезке замешиваются Veo3 и Veo2.

Ну за реальность, не чокаясь.

@cgevent
👍48🔥40😱13👎21