Нейронавт | Нейросети в творчестве

Avatar Forcing: Real-Time Interactive Head Avatar Generation for Natural Conversation

Рилтаймовый аватар головы от KAIST. Рилтайм на H100, 14GB

Генерирует движения аватара в реальном времени с низкой задержкой (около 500 мс)

Реагирует на аудио- и видеосигналы пользователя, включая речь, кивки и смех

Код ждем

#avatar #humanavaatr #talkinghead #realtime #portraitanimation

🔥13❤1🍌1

2.16K views16:19

Нейронавт | Нейросети в творчестве

1:41

This media is not supported in your browser

VIEW IN TELEGRAM

Продолжаем публиковать лучшие по вашему мнению ваши #работыподписчиков за прошлый год

Автор @pin_ai_eva :

Всем привет! Делюсь некоммерческой работой, которая выиграла несколько конкурсов, действительно горжусь ей, так как связана с реальным личным опытом

❤7😁4👍2🍾2⚡1

1.61K views17:22

Нейронавт | Нейросети в творчестве

2:27

Media is too big

VIEW IN TELEGRAM

NeoVerse: Enhancing 4D World Model with in-the-wild Monocular Videos

Реконструкция 4D миров на гауссианах из моно видео

— генерирует видео с новыми ракурсами и движениями камеры

— помогает в 3D-трекинге, стабилизации видео, его редактировании и улучшении разрешения

— может делать аутпейнтинг — расширять видимую область сцены

Гитхаб код ждем

#video2world #novelview #cameracontrol #videoto4d #gaussian #video2scene

👍7❤3

1.78K views17:52

Нейронавт | Нейросети в творчестве

#humor

😁25🤓2👍1

1.75K views19:12

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Qwen-Image-Edit-2511-Multiple-Angles-LoRA

Лора для смены ракурса от Fal.ai под #qie2511

спасибо @Bolserge

#cameracontrol #novelview

👍12❤8🔥6

1.74K viewsedited 06:21

Нейронавт | Нейросети в творчестве

Qwen-Image-Edit-2511-Multiple-Angles-LoRA Лора для смены ракурса от Fal.ai под #qie2511 спасибо @Bolserge #cameracontrol #novelview

ComfyUI-qwenmultiangle

А вот удобная приспособа в #ComfyUI для кручения-верчения ракурсов

Спасибо @StanShumsky

#cameracontrol #novelview

👍17❤3🌚1

1.84K views06:41

Нейронавт | Нейросети в творчестве

Нас набралось 15 человек, встрече быть

Всех кто собрался идти, приглашаю в отдельный чат
Остальных прошу не беспокоиться, там кроме обсуждения адреса и времени встречи ничего не будет

Всем ☮️

#оффтоп

Please open Telegram to view this post

VIEW IN TELEGRAM

Нейронавт - встреча 11 января Питер

Нейронавт invites you to join this group on Telegram.

🔥7

2.3K views07:11

Нейронавт | Нейросети в творчестве

Forwarded from Нейронавт | Нейросети в творчестве

Встреча в Питере 11 января

Anonymous Poll

Приду

11%

Возможно, пока не могу обещать

83%

Не приду, просто посмотрю сколько вас желающих

🔥5👍2

292 voters446 views07:11

Нейронавт | Нейросети в творчестве

Встреча в Питере 11 января

18 человек которые точно придут, залетайте в чат встречи

🤝4🔥2❤1👍1

1.59K views09:37

Нейронавт | Нейросети в творчестве

1:56

Media is too big

VIEW IN TELEGRAM

Продолжаем публиковать ваши #работыподписчиков за прошлый год

Автор @otyakovsky :

Театральный режИИссёр Дмитрий Отяковский, известный своими цифровыми спектаклями, снял уютный нейроклип, посвященный постоянным отключениям связи ☺️

а в своём втором канале он провел бесплатный мастеркласс по инструментам, которые использовал. посмотреть запись можно в закрепе здесь https://xn--r1a.website/+J6IMUKkFw80zMzYy

👍11👎5

1.74K views10:13

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Taming Hallucinations: Boosting MLLMs’ Video Understanding via Counterfactual Video Generation

Alibaba борется с галлюцинациями мультимодалок на понимании видео. Для этого генерируют для каждого видео пару с поломкой логики и пары вопросов-ответов

Код вероятно будет
Веса вероятно будут

#mllm #vlm #optimization

👍8❤1🔥1

1.6K views10:43

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

AdaGaR: Adaptive Gabor Representation for Dynamic Scene Reconstruction

Еще один реконструктор динамических 3D-сцен (4D сцен, получется) из монокулярных видео. Захватывает детали внешнего вида и одновременно обеспечивает плавное движение

Модель использует адаптивное представление Габора — это что-то среднее между гауссианами и габор-функциями, что позволяет балансировать между детализацией и стабильностью изображения

Код ждем

#rendering #video2scene #videoto4d #gaussian #novelview

❤9👍3🔥1

1.65K views12:43

Нейронавт | Нейросети в творчестве

1:43

This media is not supported in your browser

VIEW IN TELEGRAM

Talk2Move: Reinforcement Learning for Text-Instructed Object-Level Geometric Transformation in Scenes

Модель от Amazon по текстовой инструкции меняет расположение, поворот и размер объектов на картинке

Код ждем

#imageediting

👍12😱1

1.75K views13:46

Нейронавт | Нейросети в творчестве

0:36

This media is not supported in your browser

VIEW IN TELEGRAM

VINO: A Unified Visual Generator with Interleaved OmniModal Context

Картинко- и видеогенератор / редактор от Kling Team

работает с несколькими источниками данных одновременно — текстом, изображениями, видеоконтекстом

Базовая модель для видеогенерации — HunyuanVideo. Для обработки текста и изображений используется Qwen3-VL

Код ждем. репозиторий называется SOTAMak1r 🤩

#imageediting #videoedititng #referencing

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥8👍6😁2

1.96K views15:18

Нейронавт | Нейросети в творчестве

#humor

👍18😁11❤3🔥2

1.91K views17:37

Нейронавт | Нейросети в творчестве

Biniou

Веб-интерфейс-агрегатор для локальной работы с нейросетками.
Картинки, видео, аудио, LLM - все есть.

Впервые услышал о нем в апреле 2024, тогда на винде он самоуверенно все устанавливал на диск C:

Теперь если вас это не устраивает, можно выбрать другое место установки, для этого используйте способ установки через install_win.cmd

⚠️ Ну и вообще, автор рекомендует сделать перед установкой бэкап системы

Возможно подойдет на смену Pinokio который после переработки у меня не устанавливается, а автор игнорирует мой issue в гитхабе

Спасибо @EvgenyiPerm

#GUI #windows #macos #linux #tools

👍11🔥2😁1🤔1

1.7K viewsedited 08:11

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

LTX-2 Detail Enhancement LoRA

Лора на улучшение детальности для LTX-2

Спасибо @Vvicca1

#ltx2 #lora

👍10🤷‍♂2❤1🔥1

1.92K views10:13

Нейронавт | Нейросети в творчестве

#humor

Алиса не отстает от нейронки гугла, но есть нюанс

#humor

😁60❤1👍1🔥1

1.96K views11:14

Нейронавт | Нейросети в творчестве

NextFlow: Unified Sequential Modeling Activates Multimodal Understanding and Generation

Пониматор-генератор-редактор картинок и видео от ByteDance

Работает с текстом и изображениями одновременно. Обрабатывает перемешанные текстовые и визуальные данные и генерирует контент

Быстрый, создает картинки размером 1024x1024 всего за 5 секунд

И вообще #sota на двух бенчах DPG (88.32) и ImgEdit (4.49). Это уровень специализированных диффузных генераторов + рассуждательные способности LLM

Под капотом притаилось что-то основанное на Qwen2.5-VL-7B

Код ждем наверно

#vlm #multimodal #mllm #imageediting #CoT

🔥9👍1

1.9K views12:16

About

Blog

Apps

Platform