Метаверсище и ИИще

Апдейт VibeVoice от Микрософта.

Это опенсорсная генерилка аудио по тексту (TTS).

Теперь это практически реалтайм стриминг аудио с маленькой моделью:

• задержка всего 0.3s, но на A100
• 0.5B TTS model
• Поддержка длинных генераций

https://huggingface.co/microsoft/VibeVoice-Realtime-0.5B

@cgevent

1👍22👎7🔥1

8.74K viewsSergey Tsyptsyn ️️, 10:25

Метаверсище и ИИще

0:22

This media is not supported in your browser

VIEW IN TELEGRAM

Gaussian Splat Splines

Может показаться, что это частицы в Maya или Houdini.

Но нет, это такое лихое управление гауссовым сплатами. Я, честно сказать, такого еще не встречал.

Это анимация сплатов вдоль кривых Безье.

И это как бы реалтайм. Там даже есть есть "per-particle" аттрибуты, ну то есть Per-splat speed variation + noise displacement - вариация скорости индивидуальных сплатов.

Не уверен про практические кейсы, возможно в эффектах или motion design пригодится...

Я когда-то писал плагин для конвертации Maya Paint Effects в частицы, это чем-то напомнило процесс.

@cgevent

👍23❤6🔥3😁1

8.14K viewsSergey Tsyptsyn ️️, 10:52

Метаверсище и ИИще

0:20

This media is not supported in your browser

VIEW IN TELEGRAM

Декабрь 2025

Сколько WS(вилавсмитав) на дворе?

Что вам опять не так?!

@cgevent

😁81🔥26❤8😱2👎1

9.94K viewsSergey Tsyptsyn ️️, 11:00

Метаверсище и ИИще

0:14

This media is not supported in your browser

VIEW IN TELEGRAM

Ну наконец-то нормальное применение робатов в повседневной жизни.

Это вам не показательные съемки на камеру как ванильный робат разбирает посудомойку или складывает полотенца.

Это реальный повседневный рабский труд на благо продажи одежды для кожаных.

Манекены за 30 косых - вот о чем мечтают ритейлеры.

P.S. У меня правда есть вопросы: где страховочный трос? Ибо если рабы слетят с катушек дорожки и пойдут строевым шагом перемалывать мясных по всему моллу, то с камер наблюдения можно снимать документальный фильм ужасов.

@cgevent

1😁74❤10🔥7😱7👎6👍4

8.69K viewsSergey Tsyptsyn ️️, 11:27

Метаверсище и ИИще

Никак не могу прийти в себя, после того что Warner Brothers сделали с Suno и Udio.

Очень странный прецедент.

Получается, что на картинках из интернета обучаться можно, что можно спарсить все видосы и натренировать видеогенераторы, про тексты я вообще молчу, а именно музыку(звук) нельзя использовать для обучения.

И что именно музыкальные генераторы надо тренировать на некоем сферически-вакуумном контенте.

Пример Адоба и провала такого подхода к картинкам и видео, говорит нам о том, что ничего хорошего не получается.

Но факт остается фактом - Suno и Udio удалят свои натренированные в 2025 году модели, и выкатят кастрированные версии в 2026 году.

Почему?

Потому что в музыкальной индустрии больше денег, злее юристы и больше крупных олигархов от музыки?

Почему видео можно, а музыку нельзя?

@cgevent

2😱106👍26❤16👎4🔥3😁1🙏1

8.87K viewsSergey Tsyptsyn ️️, 11:38

Kling Element Library

Пятый день омниновостей от Клинга.

Element Library - инструмент для создания ультра-консистентных элементов(ассетов) с легким доступом для генерации видео.

Генерите свои элементы (Клинг зовет их elements) с изображениями с разных ракурсов, и Kling O1 запомнит ваших персонажей, предметы и фоны, чтобы обеспечить консистентные результаты независимо от того, как движется камера или как развивается сцена.

Генерить разные ракурсы можете как новым Kling IMAGE O1, так и Нанабананой.

Очень грубо говоря, это библиотека Лор, без всяких тренировок.

@cgevent

👍43❤12🔥10👎1

12.3K viewsSergey Tsyptsyn ️️, 15:01

Метаверсище и ИИще

LongCat Image - еще одна опенсорсная Нанабанана.

Вслед за Зимажем (Z-Image) мы имеем еще одну легкую (6В!) опенсорсную китайскую модель для генерации картинок.

Сначала смешное: я уже писал про LongCat Video - тут можете почитать о том, что крупный китайский доставщик еды тренирует свои базовые модели(?!!).

И теперь они бахнули модель для генерации и редактирования картинок - LongCat Image. И примечательна он тем, что она во-первых, легкая (6B), а, во-вторых, имеет версию -EDIT для редактирования. И в отличие от Зимажа, редактирующая модель уже готова.

Я немного пощупал обе модели и мой спойлер такой:
- в генерации картинок LongCat Image воще не силен, похвастаться ему просто нечем.
- а вот в редактировании он оказался неожиданно неплох. Я, правда, погонял его в режиме раздеватора, и он справился без базара и цензуры. Более сложное редактирование оставляю вам, пишите в коментарии, как он по сравнению с Бананой.

На итоге у нас следующее:
Пока BFL выпускает монстроподобные Флюкс-модели на 60 гиг, пока мы ждем новый Qwen Edit и Z-Image Edit, у нас есть опенсорсная легкая модель для редактирования картинок от доставщика еды в Китае.

В интересное время живем...

Нашел для вас два демо-спейса:
https://huggingface.co/spaces/anycoderapps/LongCat-Image-Edit
https://huggingface.co/spaces/AiSudo/LongCat-Image

Есть еще чат:
https://longcat.chat/

Код тут:
https://github.com/meituan-longcat/LongCat-Image

Модели:
https://huggingface.co/meituan-longcat/LongCat-Image
https://huggingface.co/meituan-longcat/LongCat-Image-Dev (модель для файнтюга)
https://huggingface.co/meituan-longcat/LongCat-Image-Edit

Комфи? Какой-такой Комфи?

@cgevent

1❤51👍25🔥13😁13

10.5K viewsSergey Tsyptsyn ️️, 14:14

This media is not supported in your browser

VIEW IN TELEGRAM

Ну, за Marvelous Designer.

На первом видео я попросил Gemini 3 (Thinking) сделать мне симулятор одежды

Промпт:

Create a single HTML file containing a realistic cloth simulation using HTML5 Canvas and JavaScript. The cloth should be a grid of points connected by constraints using Verlet integration. Implement gravity and mouse interaction: the user should be able to click and drag particles to tear the cloth. The physics must remain stable without exploding.

Сделал одну правку - попросил сделать кисть для разрезания пошире (правая кнопка мыши).
И ну семь раз кромсать и один отмерять.

На втором видео примеры того, как справились сhatGPT 5.1(слева), Claude Opus 4.5(в середине), DeepSeek-V3.2(справа).

Пишем свои симуляторы одним промптом и работает это все в реальном времени в обычном браузере.

@cgevent

👍56❤24🔥22👎6😱3

13.6K viewsSergey Tsyptsyn ️️, 11:18

Метаверсище и ИИще

0:58

This media is not supported in your browser

VIEW IN TELEGRAM

Когда ты просто пытаешь закрыть Блендор и не сохранить проект...

В конце становится ну очень смешно

https://x.com/kensyouen_Y/status/1996511510546510083

@cgevent

❤116👍39😁30🔥21😱6

9.41K viewsSergey Tsyptsyn ️️, 13:38

Метаверсище и ИИще

NVIDIA Studio Driver 591.44

Nvidia обновила декабрьские драйверы, я пошел посмотреть, что там нового.
Забавно, раньше мы гонялись за версиями драйверов, чтобы Maya не падала (да было и такое), что-то там перепаивали, превращая GeForce в Quadro, пытались ускорить трехмерный вьюпорт и количество полигонов\фпс.

Теперь же ускорения идет по линии ИИ (в текущей версии драйверов):
оптимизация RTX в ComfyUI, оптимизация NVFP8\RTX во FLUX.2, поддержка NVIDIA LSS в Blender 5.0 и TensorRT-RTX в Topaz Video AI и Topaz Photo AI.

Качайте тут (вcего-то гигабайтик драйверов):
https://www.nvidia.com/en-us/drivers/details/258747/

@cgevent

🔥37❤9👍7

8.89K viewsSergey Tsyptsyn ️️, 10:08

Метаверсище и ИИще