Media is too big
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Подсобрал для вас видосов из нового грядущего Клинга 2.1, который пока в Early Access.
Надо сказать, что после Veo3, конечно, сложновато смотреть на пережженные цвета, пластиковую кожу и немых персонажей.
Я, конечно, перебираю щщами и бешусь с жиру. Год назад у нас была только неведомая и недоступная Сора, а теперь видеогенераторов есть на любой вкус и цвет.
Veo3 вплотную подошел к планке качества картинки, за которой начнется гонка инструментов. И тут у Клинга есть пока пара козырей. Но инструменты дело наживное.
Ждем веб-монтажек от всех.
@cgevent
Надо сказать, что после Veo3, конечно, сложновато смотреть на пережженные цвета, пластиковую кожу и немых персонажей.
Я, конечно, перебираю щщами и бешусь с жиру. Год назад у нас была только неведомая и недоступная Сора, а теперь видеогенераторов есть на любой вкус и цвет.
Veo3 вплотную подошел к планке качества картинки, за которой начнется гонка инструментов. И тут у Клинга есть пока пара козырей. Но инструменты дело наживное.
Ждем веб-монтажек от всех.
@cgevent
👍45❤10🔥2😱1
🔥61😁5❤2
Помните Николая Иронова и доисторический лого-генератор от студии Лебедева?
Делали его очень смышленые ребята, и он, в каком-то смысле, сильно обогнал время. На тот момент никто и близко не делал что-то подобное.
А теперь это просто промпт для chatGPT:
Create a flat, iconic logo for a brand called [Brand Name], which operates in the [Industry/Niche] field.
The logo must be simple, bold, and concept-driven. Use a [Primary Color] and [Secondary Color] palette.
Incorporate abstract or symbolic shapes that represent the brand’s values or purpose — think clever geometry, subtle negative space, or minimal monograms.
Place the brand name below the icon in modern sans-serif typography, centered and styled with the chosen colors.
Use a clean white background. No shadows, no gradients.
Final result should feel premium, unique, and instantly recognizable — like it belongs to a real, future-ready brand.
Лого CG Event прям хорошо по смыслу.
@cgevent
Делали его очень смышленые ребята, и он, в каком-то смысле, сильно обогнал время. На тот момент никто и близко не делал что-то подобное.
А теперь это просто промпт для chatGPT:
Create a flat, iconic logo for a brand called [Brand Name], which operates in the [Industry/Niche] field.
The logo must be simple, bold, and concept-driven. Use a [Primary Color] and [Secondary Color] palette.
Incorporate abstract or symbolic shapes that represent the brand’s values or purpose — think clever geometry, subtle negative space, or minimal monograms.
Place the brand name below the icon in modern sans-serif typography, centered and styled with the chosen colors.
Use a clean white background. No shadows, no gradients.
Final result should feel premium, unique, and instantly recognizable — like it belongs to a real, future-ready brand.
Лого CG Event прям хорошо по смыслу.
@cgevent
👎28🔥27👍13❤6😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Пока Unitree мочат друг друга ногами, как в фильме Живая Сталь.. НейроДзюба такой: щас, прицел передерну.. и попаду. Если не упаду...
Футбол - это вам не MMA! Ноги прочь, нейротвари!
@cgevent
Футбол - это вам не MMA! Ноги прочь, нейротвари!
@cgevent
😁104❤8👎2👍1
Media is too big
VIEW IN TELEGRAM
Радиио Африика.
Я довольно ровно дышу к БГ. Мои два любимых альбома это Табу и Радио Африка (и Синий Альбом). Там довольно забавные именно музыкальные эксперименты. Всегда хотел услышать каверы на Радио Африка, к которому приложили руку Курехин и Бутман.
И, конечно, я призвал на помощь Лешу Кондакова и его AI RADIO.
Оказалось (о, чудо), что SUNO кушает песни Аквариума напрямую, без плясок, и не ругается на копирайт. Видать ранний БГ не попал в базы.
Короче, держите каверы на Радио Африка. Особенно доставляют "рок-н-ролл мертв" и "мальчик евграф".
Suno 4.5 - это просто огнище плазменное. Там под капотом не только "перемешиватель песен", там целая LLM, которая считывает вайб и с текста, и с музыки, и аккуратно замешивает его в свои генерации. Суно "понимает" музыку. Возможно лучше, чем вы.
@cgevent
Я довольно ровно дышу к БГ. Мои два любимых альбома это Табу и Радио Африка (и Синий Альбом). Там довольно забавные именно музыкальные эксперименты. Всегда хотел услышать каверы на Радио Африка, к которому приложили руку Курехин и Бутман.
И, конечно, я призвал на помощь Лешу Кондакова и его AI RADIO.
Оказалось (о, чудо), что SUNO кушает песни Аквариума напрямую, без плясок, и не ругается на копирайт. Видать ранний БГ не попал в базы.
Короче, держите каверы на Радио Африка. Особенно доставляют "рок-н-ролл мертв" и "мальчик евграф".
Suno 4.5 - это просто огнище плазменное. Там под капотом не только "перемешиватель песен", там целая LLM, которая считывает вайб и с текста, и с музыки, и аккуратно замешивает его в свои генерации. Суно "понимает" музыку. Возможно лучше, чем вы.
@cgevent
👍51🔥31👎4
Еще одна не пережеванная новость с Google I\O.
Gemini 2.5 Flash Preview TTS - генерилка речи по тексту. И не просто голоса и речи, ИИ может петь, орать, чихать и кашлять.
Я открыл AI Studio и нашел это в разделе Generate Media.
Поглядите, как народ издевается над ней, заставляя петь дурными голосами.
Причем есть мультиспикер-режим, 30+ голосов на выбор, поддержка русского тоже есть.
https://aistudio.google.com/generate-speech
@cgevent
Gemini 2.5 Flash Preview TTS - генерилка речи по тексту. И не просто голоса и речи, ИИ может петь, орать, чихать и кашлять.
Я открыл AI Studio и нашел это в разделе Generate Media.
Поглядите, как народ издевается над ней, заставляя петь дурными голосами.
Причем есть мультиспикер-режим, 30+ голосов на выбор, поддержка русского тоже есть.
https://aistudio.google.com/generate-speech
@cgevent
😁42👍29🔥14❤1
А chatGPT не отстает! В него вернули режим пения!
Причем и в голосовом и в текстовом режимах.
Сбрасывайте свои хиты в коменты.
@cgevent
Причем и в голосовом и в текстовом режимах.
Сбрасывайте свои хиты в коменты.
@cgevent
😁29👍12👎6🔥3
Пока Европа смотрит, как Veo3 раскатали в Никарагуа и бьется в истерике, осваивая ВПН
Всё 15-миллионное население ОАЭ вскоре получит бесплатный доступ к ChatGPT Plus, став первой страной, реализующей подобную инициативу. Этот шаг является частью более широкого партнерства между OpenAI и правительством ОАЭ, которое также включает в себя развитие Stargate UAE, массивного центра обработки данных ИИ в Абу-Даби.
15 миллионов умножить на 20 долларов подписки в месяц.
300 миллионов в месяц, 3 600 000 000 долларов в год.
В - Возврат инвестиций.
@cgevent
Всё 15-миллионное население ОАЭ вскоре получит бесплатный доступ к ChatGPT Plus, став первой страной, реализующей подобную инициативу. Этот шаг является частью более широкого партнерства между OpenAI и правительством ОАЭ, которое также включает в себя развитие Stargate UAE, массивного центра обработки данных ИИ в Абу-Даби.
15 миллионов умножить на 20 долларов подписки в месяц.
300 миллионов в месяц, 3 600 000 000 долларов в год.
В - Возврат инвестиций.
@cgevent
❤45🔥39👍13😁5
This media is not supported in your browser
VIEW IN TELEGRAM
Французы из kyutai, авторы Мойши выпустили свою платформу для создания голосового режима над любой LLM.
Это TTS и STT одновременно, с ультра малой задержкой и возможностью начать воспроизводить речевой ответ ДО того, как обработается весь кусок TTS.
На сайте и на видео используется Gemma 3 12B в качестве LLM.
Хотя каскадные системы теряют ценную информацию, такую как эмоции, ирония и т. д., они обеспечивают непревзойденную модульность: поскольку три части системы разделены, вы можете дать голос любой LLM, который хотите, без какой-либо настройки или адаптации.
На сайте вы сможете протестировать эту универсальность, настраивая системную подсказку Gemma 3, чтобы создать индивидуальность вашего цифрового собеседника, и самостоятельно изменяя голос TTS.
Модели преобразования речи в текст и текста в речь оптимизированы для низкой задержки. Модель STT работает в потоковом режиме и включает в себя семантическое определение активности голоса вместо того, чтобы полагаться на внешнюю модель. Модель TTS работает в потоковом режиме как в аудио, так и в тексте, то есть она может начать говорить до того, как будет сгенерирован весь ответ LLM. Вы можете использовать 10-секундный образец голоса, чтобы определить голос и интонацию TTS.
Ну и самое главное - это пойдет в опенсорс через пару недель.
https://unmute.sh/
@cgevent
Это TTS и STT одновременно, с ультра малой задержкой и возможностью начать воспроизводить речевой ответ ДО того, как обработается весь кусок TTS.
На сайте и на видео используется Gemma 3 12B в качестве LLM.
Хотя каскадные системы теряют ценную информацию, такую как эмоции, ирония и т. д., они обеспечивают непревзойденную модульность: поскольку три части системы разделены, вы можете дать голос любой LLM, который хотите, без какой-либо настройки или адаптации.
На сайте вы сможете протестировать эту универсальность, настраивая системную подсказку Gemma 3, чтобы создать индивидуальность вашего цифрового собеседника, и самостоятельно изменяя голос TTS.
Модели преобразования речи в текст и текста в речь оптимизированы для низкой задержки. Модель STT работает в потоковом режиме и включает в себя семантическое определение активности голоса вместо того, чтобы полагаться на внешнюю модель. Модель TTS работает в потоковом режиме как в аудио, так и в тексте, то есть она может начать говорить до того, как будет сгенерирован весь ответ LLM. Вы можете использовать 10-секундный образец голоса, чтобы определить голос и интонацию TTS.
Ну и самое главное - это пойдет в опенсорс через пару недель.
https://unmute.sh/
@cgevent
🔥67❤4👍4
Media is too big
VIEW IN TELEGRAM
Недавно предлагал выпить за репортажку и документалки.
Продолжаю настаивать. Настоечка из Veo3 и Veo2 просто крепчайшая.
Поглядите на титры и липсинк. Вы просто не будете в состоянии отличить булшит от реальности (хотя реальность местами сильно похожа на булшит, честно говоря).
Тут в коментах спрашивали, как достигается консистентность лиц.
С помощью Veo2: сначала генерятся Veo3-клипы, потом там где надо выдирается лицо стоп-кадром и кормится в ингредиенты Veo2, который умеет принимать их на вход. В нарезке замешиваются Veo3 и Veo2.
Ну за реальность, не чокаясь.
@cgevent
Продолжаю настаивать. Настоечка из Veo3 и Veo2 просто крепчайшая.
Поглядите на титры и липсинк. Вы просто не будете в состоянии отличить булшит от реальности (хотя реальность местами сильно похожа на булшит, честно говоря).
Тут в коментах спрашивали, как достигается консистентность лиц.
С помощью Veo2: сначала генерятся Veo3-клипы, потом там где надо выдирается лицо стоп-кадром и кормится в ингредиенты Veo2, который умеет принимать их на вход. В нарезке замешиваются Veo3 и Veo2.
Ну за реальность, не чокаясь.
@cgevent
👍48🔥40😱13👎2❤1