Израильтяне продолжают удивлять.
LTX заколлабились с Eleven Labs в области звука и выкатили Audio-to-Video.
Пока нашел только тут:
https://app.ltx.studio/ltx-2-playground/a2v
Но народ уже крутит ручки в комфи.
Это не просто липсинк, это как бы character-sync.
Берете аудио, потом картинку (i2v), потом пишете промпт. Дальше Audio-to-Video оживляет картинку не только по промпту (в котором теперь не надо писать, что скажет персонаж), но с учетом анализа аудио.
Из звука извлекается не только речь, но и ритм, и эффекты. Под этот ритм персонажи и пляшут, и машут. А не только губами ворочают.
Интересно, что он распознает два (может больше) трека для речи и назначает их на разных персонажей (а не как раньше, когда все говорили и двигались одинаково).
Выглядит убойно, если бы не качество видео((
Тут бы выпить за инфлюенсеров в очередной раз, но об этом через пост.
@cgevent
LTX заколлабились с Eleven Labs в области звука и выкатили Audio-to-Video.
Пока нашел только тут:
https://app.ltx.studio/ltx-2-playground/a2v
Но народ уже крутит ручки в комфи.
Это не просто липсинк, это как бы character-sync.
Берете аудио, потом картинку (i2v), потом пишете промпт. Дальше Audio-to-Video оживляет картинку не только по промпту (в котором теперь не надо писать, что скажет персонаж), но с учетом анализа аудио.
Из звука извлекается не только речь, но и ритм, и эффекты. Под этот ритм персонажи и пляшут, и машут. А не только губами ворочают.
Интересно, что он распознает два (может больше) трека для речи и назначает их на разных персонажей (а не как раньше, когда все говорили и двигались одинаково).
Выглядит убойно, если бы не качество видео((
Тут бы выпить за инфлюенсеров в очередной раз, но об этом через пост.
@cgevent
❤32🔥26👍8👎2
Media is too big
VIEW IN TELEGRAM
Audio as input for LTX2 для Comfy
Все эти персонажи и мемы оживлены по одной входной картинке и звуку.
Мне больше всего зашел дед с 0:53. Нейродед, чо.
Воркфлоу тут:
https://github.com/purzbeats/purz-comfyui-workflows/blob/main/ltx2/ltx2-audio_to_video_extension_5x.json
@cgevent
Все эти персонажи и мемы оживлены по одной входной картинке и звуку.
Мне больше всего зашел дед с 0:53. Нейродед, чо.
Воркфлоу тут:
https://github.com/purzbeats/purz-comfyui-workflows/blob/main/ltx2/ltx2-audio_to_video_extension_5x.json
@cgevent
😁25❤6👍1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Higgsfield AI Influencer Studio
Ну за инфлю-мать-их-енсеров. Не чокаясь.
Не знаю какие нейростероиды жрут в Хиггсе и сколько у них там вайбкодинга в быту, но они бахают продукт за продуктом. Причем каждый из этих типапродуктов может быть отдельным стартапом.
Впрочем так раньше и было со стартапами, но в последнее время смертность стартапов немного превышает рождаемость (стараниями Гугла и других взрослых игроков), поэтому Хиггсы делают такой зонтик для всего, что нейрошевелится.
Всем уже приподнадоели нейро-девочки с губами до земли и грудью до небес, поэтому Хиггсы чуют поляну и выкатывают инфлюенсеро-станок с перосонажами слегка "за рамками" привычных шаблонов.
Мне вот зашла квадратная голова с губами (пережиток прошлого). Кому-то ящеры зайдут или мамонты.
Любопытно, что там есть параметр "Вирусность". Это прям примета времени - контент или эстетика не важны, важна вирусность. Хиггсы умело эксплуатируют эту идею.
Ну вопрос удобства конструирования своих персонажей. С максимальной вирусностью, кого нынче трясет креативность..
@cgevent
Ну за инфлю-мать-их-енсеров. Не чокаясь.
Не знаю какие нейростероиды жрут в Хиггсе и сколько у них там вайбкодинга в быту, но они бахают продукт за продуктом. Причем каждый из этих типапродуктов может быть отдельным стартапом.
Впрочем так раньше и было со стартапами, но в последнее время смертность стартапов немного превышает рождаемость (стараниями Гугла и других взрослых игроков), поэтому Хиггсы делают такой зонтик для всего, что нейрошевелится.
Всем уже приподнадоели нейро-девочки с губами до земли и грудью до небес, поэтому Хиггсы чуют поляну и выкатывают инфлюенсеро-станок с перосонажами слегка "за рамками" привычных шаблонов.
Мне вот зашла квадратная голова с губами (пережиток прошлого). Кому-то ящеры зайдут или мамонты.
Любопытно, что там есть параметр "Вирусность". Это прям примета времени - контент или эстетика не важны, важна вирусность. Хиггсы умело эксплуатируют эту идею.
Ну вопрос удобства конструирования своих персонажей. С максимальной вирусностью, кого нынче трясет креативность..
@cgevent
😁36👎8🔥7😱3❤2👍1
Suno сделали морфинг песен.
Он называется Mashup.
Берете две пестни и суете их в Mashup blender и готово!
Потом берете Машап и другой Машап и Машапите их снова - ну вы поняли. Можете сблендивать все со всем.
Более того, там даже есть морфинг лирики! Можно выбрать лирику из любой песни, а можно сказать "замешай тексты".
Для тех у кого есть еще вопросы, поглядите сюда:
https://youtu.be/_iytIBY_EaA
Там все разжевано.
Интересно, если смешать оригинал и кавер или два кавера мы получим новый кавер?
@cgevent
Он называется Mashup.
Берете две пестни и суете их в Mashup blender и готово!
Потом берете Машап и другой Машап и Машапите их снова - ну вы поняли. Можете сблендивать все со всем.
Более того, там даже есть морфинг лирики! Можно выбрать лирику из любой песни, а можно сказать "замешай тексты".
Для тех у кого есть еще вопросы, поглядите сюда:
https://youtu.be/_iytIBY_EaA
Там все разжевано.
Интересно, если смешать оригинал и кавер или два кавера мы получим новый кавер?
@cgevent
1🔥38❤7👍2👎1
Media is too big
VIEW IN TELEGRAM
Нейропрожарка
God Is Banned — режиссёр Дима Терем
Всем привет. Я — Дима Терем, самый известный ноунейм Москвы.
Кинорежиссёр, медиа-художник, пишу и играю электронную музыку.
Это история создания фильма God is Banned.
Полная версия на 10 минут тут.
Синопсис:
Макс — режиссёр, который работает с ИИ. Он прилетает на Бали на церемонию фильмов, созданных ИИ. Но связь обрывается — и он теряется в джунглях.
Пока он идёт через влажные тропики, он рассказывает, как создаёт свои миры и персонажей, как заставляет нейросеть чувствовать хоть немного по-настоящему.
Его путь превращается в исповедь, а потом — в манифест.
И когда реальность начинает трещать по швам, Макс задаёт вопрос:
куда всё это ведёт —и останется ли искусство живым, если из него вырезать всё настоящее?
От фестивального задания к короткому метру.
Изначально я делал фильм для ai-фестиваля My Film 48.
Но что-то пошло не так. Или так.
Техзадание от феста было таким:
Главный герой прилетает на Бали, получает от молчаливого незнакомца древнюю карту, карточку с надписью что-то там про бога и какой-то храм на местном языке,
и флаер на церемонию награждения.
Что герой будет делать дальше с этим лутом — решает автор.
На всё про всё — 96 часов.
На вторые сутки производства я понял, что у меня получается не трейлер, а короткий метр.
Проблема нейросетевого контента — это избыточность образов: в моём случае либо резать, либо удлинять. Я выбрал длину — терпеть не могу строгие временные рамки, форматы и вот это всё.
Главная тема, которая меня волнует, — цензура при работе с AI.
Сегодня у одиннадцатилетнего подростка прав и свобод больше, чем у создателя нейроконтента.
Это выражено через метафору острова и вулкана, в кратер которого сбрасывают мусор — символ бесконечного AI-треша, производимого нейрохудожниками.
Главный герой — единственный кожаный, но слегка помятый нейронками.
Прототипом был мой друг Source actor Макаров Максим.
Во время производства фильма он удалённо сам себя снимал на телефон под конкретную сцену — с нужной эмоцией и ракурсом.
Также я использовал его старые архивные фотографии.
Из-за этого образ получился не совсем целостным.
Что под капотом
Veo 3
Klings 2.5
Sora 2 Pro
Nana banana
Suno 5
даунгрейд → апскейл (если у меня есть видео Full HD и 720p: я делаю сначала даунгрейд на 720p общий, а потом апскейл до Full HD через Topaz локально)
Цветокоррекция — сразу в промптах на этапе статики
Промпты и перевод на английский — в GPT,
а сцены, где требовалась жёсткость, делал через Grok.
Постепенно я понял важную вещь:
цензура в GPT и подобных моделях местами гораздо строже, чем в генерации изображения.
Например:
GPT отказался писать промпт про кричащего ребёнка,
Veo 3 тоже отказалась, зато Sora 2 спокойно создала голос ребёнка и видео, которое не понадобилось, анимацию ребёнка сделал уже в Klings.
Вот на таких костылях я собирал всю историю.
Работать с английским языком оказалось кайфово:
фразы стали короче, плотнее, кинематографичнее.
Сроки и бюджет
На нейронки потратил около 50 000 рублей
Производство заняло около пяти дней,
потому что я хотел успеть на другой фестиваль, но его название я уже не помню.
Всем спасибо за внимание. Приятного просмотра.
Полная версия тут
@cgevent
God Is Banned — режиссёр Дима Терем
Всем привет. Я — Дима Терем, самый известный ноунейм Москвы.
Кинорежиссёр, медиа-художник, пишу и играю электронную музыку.
Это история создания фильма God is Banned.
Полная версия на 10 минут тут.
Синопсис:
Макс — режиссёр, который работает с ИИ. Он прилетает на Бали на церемонию фильмов, созданных ИИ. Но связь обрывается — и он теряется в джунглях.
Пока он идёт через влажные тропики, он рассказывает, как создаёт свои миры и персонажей, как заставляет нейросеть чувствовать хоть немного по-настоящему.
Его путь превращается в исповедь, а потом — в манифест.
И когда реальность начинает трещать по швам, Макс задаёт вопрос:
куда всё это ведёт —и останется ли искусство живым, если из него вырезать всё настоящее?
От фестивального задания к короткому метру.
Изначально я делал фильм для ai-фестиваля My Film 48.
Но что-то пошло не так. Или так.
Техзадание от феста было таким:
Главный герой прилетает на Бали, получает от молчаливого незнакомца древнюю карту, карточку с надписью что-то там про бога и какой-то храм на местном языке,
и флаер на церемонию награждения.
Что герой будет делать дальше с этим лутом — решает автор.
На всё про всё — 96 часов.
На вторые сутки производства я понял, что у меня получается не трейлер, а короткий метр.
Проблема нейросетевого контента — это избыточность образов: в моём случае либо резать, либо удлинять. Я выбрал длину — терпеть не могу строгие временные рамки, форматы и вот это всё.
Главная тема, которая меня волнует, — цензура при работе с AI.
Сегодня у одиннадцатилетнего подростка прав и свобод больше, чем у создателя нейроконтента.
Это выражено через метафору острова и вулкана, в кратер которого сбрасывают мусор — символ бесконечного AI-треша, производимого нейрохудожниками.
Главный герой — единственный кожаный, но слегка помятый нейронками.
Прототипом был мой друг Source actor Макаров Максим.
Во время производства фильма он удалённо сам себя снимал на телефон под конкретную сцену — с нужной эмоцией и ракурсом.
Также я использовал его старые архивные фотографии.
Из-за этого образ получился не совсем целостным.
Что под капотом
Veo 3
Klings 2.5
Sora 2 Pro
Nana banana
Suno 5
даунгрейд → апскейл (если у меня есть видео Full HD и 720p: я делаю сначала даунгрейд на 720p общий, а потом апскейл до Full HD через Topaz локально)
Цветокоррекция — сразу в промптах на этапе статики
Промпты и перевод на английский — в GPT,
а сцены, где требовалась жёсткость, делал через Grok.
Постепенно я понял важную вещь:
цензура в GPT и подобных моделях местами гораздо строже, чем в генерации изображения.
Например:
GPT отказался писать промпт про кричащего ребёнка,
Veo 3 тоже отказалась, зато Sora 2 спокойно создала голос ребёнка и видео, которое не понадобилось, анимацию ребёнка сделал уже в Klings.
Вот на таких костылях я собирал всю историю.
Работать с английским языком оказалось кайфово:
фразы стали короче, плотнее, кинематографичнее.
Сроки и бюджет
На нейронки потратил около 50 000 рублей
Производство заняло около пяти дней,
потому что я хотел успеть на другой фестиваль, но его название я уже не помню.
Всем спасибо за внимание. Приятного просмотра.
Полная версия тут
@cgevent
1👎46👍15❤10🔥8😱2🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
Сколько Вилловсмитов 2026
Продолжаем обновлять наш регулярный рейтинг вилафсмитаф.
Сколько выпишем сегодня?
9.5?
АГИ уже здесь?
Напоминаю, что прошло МЕНЬШЕ ТРЕХ ЛЕТ!
Также напоминаю, что до выхода Sora видеомодели в принципе ничего не понимали про мир вокруг, а тупо генерили картинку за картинкой по изменениям в промпте или другом параметре.
Откусить кусок бургера/спагетти или примять траву, потрогав ея, было в принципе невозможно.
А щас генераторы миров\инфлюенсеров\аватаров и разные видеогенераторы на каждом шагу.
И мы такие.. не ну там кожа не такая и они неискренние какие-то, не верю.
Зажрались баяре...
Скоро Вилловсмитов не хватит на обоих руках, а у вас спагетти слишком альденте на видео..
Приподвзварчиваю...
@cgevent
Продолжаем обновлять наш регулярный рейтинг вилафсмитаф.
Сколько выпишем сегодня?
9.5?
АГИ уже здесь?
Напоминаю, что прошло МЕНЬШЕ ТРЕХ ЛЕТ!
Также напоминаю, что до выхода Sora видеомодели в принципе ничего не понимали про мир вокруг, а тупо генерили картинку за картинкой по изменениям в промпте или другом параметре.
Откусить кусок бургера/спагетти или примять траву, потрогав ея, было в принципе невозможно.
А щас генераторы миров\инфлюенсеров\аватаров и разные видеогенераторы на каждом шагу.
И мы такие.. не ну там кожа не такая и они неискренние какие-то, не верю.
Зажрались баяре...
Скоро Вилловсмитов не хватит на обоих руках, а у вас спагетти слишком альденте на видео..
Приподвзварчиваю...
@cgevent
1👍68🔥24😁9❤8😱3👎1
Anthropic бахнули готовое расширение для Claude Code для VS Code
https://code.claude.com/docs/en/vs-code
Проще, чем печатать в Claude Code плюс поддержка всех фич VSCode.
https://marketplace.visualstudio.com/items?itemName=anthropic.claude-code
@cgevent
https://code.claude.com/docs/en/vs-code
Проще, чем печатать в Claude Code плюс поддержка всех фич VSCode.
https://marketplace.visualstudio.com/items?itemName=anthropic.claude-code
@cgevent
Claude Code Docs
Use Claude Code in VS Code - Claude Code Docs
Install and configure the Claude Code extension for VS Code. Get AI coding assistance with inline diffs, @-mentions, plan review, and keyboard shortcuts.
🔥23👎14👍1
Forwarded from AI Product | Igor Akimov
Inworld запустила версию 1.5 своего лучшего движка текст-в-речь.
Пишут, что это самый быстрый и качественный Realtime AI на рынке, который занял первое место в лидерборде Artificial Analysis.
Главные фишки - супер-низкая задержка
1.5 Mini: <130 мс (идеально для гипер-чувствительных задач).
1.5 Max: <250 мс (максимальное качество). Это в 4 раза быстрее предыдущих поколений.
Плюс модель стала на 30% эмоциональнее и делает на 40% меньше ошибок (WER). Обещают звучание уровня профессиональных актеров озвучки.
Цена вообще сказочная:
Mini: $0.005 за минуту.
Max: $0.01 за минуту.
Поддержка 15 языков (русский есть)
Плюс возможность развертывания On-Prem (на своих серверах) для энтерпрайза.
Отлично! У ElevenLabs и OpenAI появился все более серьезный конкурент.
https://inworld.ai/blog/introducing-inworld-tts-1-5
Пишут, что это самый быстрый и качественный Realtime AI на рынке, который занял первое место в лидерборде Artificial Analysis.
Главные фишки - супер-низкая задержка
1.5 Mini: <130 мс (идеально для гипер-чувствительных задач).
1.5 Max: <250 мс (максимальное качество). Это в 4 раза быстрее предыдущих поколений.
Плюс модель стала на 30% эмоциональнее и делает на 40% меньше ошибок (WER). Обещают звучание уровня профессиональных актеров озвучки.
Цена вообще сказочная:
Mini: $0.005 за минуту.
Max: $0.01 за минуту.
Поддержка 15 языков (русский есть)
Плюс возможность развертывания On-Prem (на своих серверах) для энтерпрайза.
Отлично! У ElevenLabs и OpenAI появился все более серьезный конкурент.
https://inworld.ai/blog/introducing-inworld-tts-1-5
1👍59😱7❤4🔥3🙏1
Media is too big
VIEW IN TELEGRAM
Внедряешь в работу нейросети, но изображения и видео выглядят дешевыми, а не профессиональными.
Движения выглядят дергаными и нереалистичными?
Этот бесплатный мини-курс выведет твои генерации на новый уровень.
Ты научишься:
— получать качественные изображения, которые затем можно анимировать и интегрировать в монтаж
— добиваться фотореализма, поддерживать единый стиль и собирать сцену так, будто она снята на профессиональное кинооборудование.
Это уроки для тех, кто хочет выйти за рамки базовых промптов и собрать рабочий видеопродукт, за который клиенты готовы платить от 5000₽ за 1 секунду видео.
Ты увидишь как AI может ускорить производство создания роликов в 3–4 раза и открыть доступ к проектам уровня крупных брендов.
Забрать доступ к мини-курсу: @cnpneiro_bot
Реклама. ИП Чернышова Екатерина Сергеевна. ИНН: 745216997102. Еrid: 2Vtzqwf9YAP
Движения выглядят дергаными и нереалистичными?
Этот бесплатный мини-курс выведет твои генерации на новый уровень.
Ты научишься:
— получать качественные изображения, которые затем можно анимировать и интегрировать в монтаж
— добиваться фотореализма, поддерживать единый стиль и собирать сцену так, будто она снята на профессиональное кинооборудование.
Это уроки для тех, кто хочет выйти за рамки базовых промптов и собрать рабочий видеопродукт, за который клиенты готовы платить от 5000₽ за 1 секунду видео.
Ты увидишь как AI может ускорить производство создания роликов в 3–4 раза и открыть доступ к проектам уровня крупных брендов.
Забрать доступ к мини-курсу: @cnpneiro_bot
Реклама. ИП Чернышова Екатерина Сергеевна. ИНН: 745216997102. Еrid: 2Vtzqwf9YAP
👎49😁9👍8❤1😱1
Runway 4.5 Image to Video
Вчера вечером вышел апдейт от Runway. Основной упор на модель Image to Video. У них в твитторе и на сайте сладчайшие примеры, но я взял не черрипики, а реальные генерации и даже разыскал сравнение с Клингом и Сидримом.
Не могу сказать, что прям какая-то революция.
Качество не лучше, чем у Клинга(имхо)
Длина 5-10 секунд
720Р
И, как я понял, нет звука?!
Если вам интересно поглядеть на примеры, посмотрите обзор от Тима:
https://www.youtube.com/watch?v=D9iTe6tbNXU
@cgevent
Вчера вечером вышел апдейт от Runway. Основной упор на модель Image to Video. У них в твитторе и на сайте сладчайшие примеры, но я взял не черрипики, а реальные генерации и даже разыскал сравнение с Клингом и Сидримом.
Не могу сказать, что прям какая-то революция.
Качество не лучше, чем у Клинга(имхо)
Длина 5-10 секунд
720Р
И, как я понял, нет звука?!
Если вам интересно поглядеть на примеры, посмотрите обзор от Тима:
https://www.youtube.com/watch?v=D9iTe6tbNXU
@cgevent
👍13🔥4❤1