Нейронавт | Нейросети в творчестве

VIBE: Visual Instruction Based Editor

Генератор-редактор картинок, впихуемый в 24 ГБ VRAM из коробки
Генерирует 2K за 4 секунды на NVIDIA H100

Применяют Qwen3-VL для управления процессом редактирования и Sana1.5 для генерации

Судя по фамилиям, авторы собрались с русскоязычного пространства, что одновременно радует и настораживает

Гитхаб
HF
Демо

#imageediting

❤8👍6😁5👀1

2.5K views16:12

Нейронавт | Нейросети в творчестве

VIBE Local GUI (Windows)

Графический интерфейс на Gradio для локального запуска VIBE

Спасибо @p0lygon

#GUI #imageediting #windows

👍6❤4

2.34K views06:16

Нейронавт | Нейросети в творчестве

AI Toolkit поддерживает обучение лор FLUX.2 [klein] 9B и 4B

#lora #finetuning #flux2

🔥13👍2

2.42K views09:11

Нейронавт | Нейросети в творчестве

0:46

This media is not supported in your browser

VIEW IN TELEGRAM

NVIDIA PersonaPlex: Natural Conversational AI With Any Role and Voice

Диалоговая разговорная аудиомодель с полным дуплексом

— может вести диалог, слушая и говоря одновременно

— создаёт естественные паузы, перебивает, использует междометия вроде «ага» или «оу», чтобы показать, что слушает

— подстраивается под заданную роль через текстовый промпт — может быть учителем, сотрудником банка, астронавтом и кем угодно

А построили ее... на базе Moshi Неужели у Нвидиа кончились свои идеи? Видать, потому опенсорс

Гитхаб
HF

Спасибо @m_franz

#voicemode #dialog

👍9🔥3❤1😁1

2.45K views10:13

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

FrankenMotion: Part-level Human Motion Generation and Composition

Модель для генерации и комбинирования движений человека на уровне отдельных частей тела. Учитывает текстовые подсказки для каждой части тела отдельно, благодаря чему движения получаются более точными и контролируемыми

Гитхаб код ждем

#humananimation #animation

🔥7👍1

2.01K views11:14

Нейронавт | Нейросети в творчестве

3:41

Media is too big

VIEW IN TELEGRAM

Зацените дебютный клип ИИ-исполнительницы WU AI-HUA
Хороший продукт

Оригинал где-то тут, но Warner Music China блочит за пределами Китая

🔥27👎5👍2😁2

2.39K viewsedited 12:07

Нейронавт | Нейросети в творчестве

3:31

Media is too big

VIEW IN TELEGRAM

ObjSplat: Geometry-Aware Gaussian Surfels for Active Object Reconstruction

Система реконструкции объектов на гауссовых поверхностях. Создаёт детальные модели, которые можно использовать в физических симуляциях.

— самостоятельно выбирает точки обзора для сканирования

— постепенно создаёт модель объекта с реалистичной текстурой и точной геометрией

— определяет плохо отсканированные участки даже на сложных объектах

Код ждем

#scenereconstruction #imageto3d #gaussian #image2scene

🔥5❤1🤝1

1.94K views13:16

Нейронавт | Нейросети в творчестве

HeartMuLa_ComfyUI

Кастом ноды генератора музыки HeartMuLa

#alm #music #text2music #comfyui

👍11

2.45K views16:17

Нейронавт | Нейросети в творчестве

HeartMuLa_ComfyUI Кастом ноды генератора музыки HeartMuLa #alm #music #text2music #comfyui

ComfyUI_FL-HeartMuLa

И еще одна альтернатива

#alm #music #text2music #comfyui

👍9

2.19K views16:44

Нейронавт | Нейросети в творчестве

GLM-4.7 Flash

Облегченная версия GLM-4.7 на 30B параметров, с контекстным окном в 128К на архитектуре MoE.

Баланс между производительностью и эффективностью

Подходит для кода, креативного письма, перевода, задач с длинным контекстом и ролевых моделей

GLM-4.7-Flash: бесплатно (1 одновременный запрос)
GLM-4.7-FlashX: высокоскоростной и доступный по цене вариант

HF
Кванты
Демо
Демо 2
API

#assistant #coding

👍14❤1🔥1

1.91K viewsedited 06:13

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Waypoint-1

Генератор интерактивных игровых миров в реальном времени от Overworld, ориентированный на локальный запуск

Да, он легкий и быcтрый, но но совершенно не помнит что за спиной. Зато легкий и быстрый. Бесполезная штука

Есть модели small (12.5 ГБ) и medium - не отображается в репо

Гитхаб
HF
Попробовать

#world #text2world

👍8😁1

2.38K views07:11

Нейронавт | Нейросети в творчестве

1:14

This media is not supported in your browser

VIEW IN TELEGRAM

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

LTXStudio заколабились с Elevenlabs и сделали Audio-to-Video - оживление картинки по звуку

#audio2video

🔥12👍4🥴2😁1

2.29K views08:11

Нейронавт | Нейросети в творчестве

1:15

This media is not supported in your browser

VIEW IN TELEGRAM

Motive (MOTIon attribution for Video gEneration)

В NVIDIA придумали инструмент который помогает понять, какие обучающие клипы улучшают или ухудшают динамику движения в сгенерированных видео

Прикрутили к Wan 2.1

Код ждем

#optimization

❤6👍2

2.1K views09:12

Нейронавт | Нейросети в творчестве

CoDance: An Unbind-Rebind Paradigm for Robust Multi-Subject Animation

Оживлятор сразу нескольких персонажей на изображении по образцу движения

Ну это совершенно какая-то нишевая штука когда нужно чтоб все одинаково двигались

Код ждем

#characteranimation #image2video #pose2video

👍8🤔1

2.1K views10:13

Нейронавт | Нейросети в творчестве

Qwen-Image-Edit-2511-NVFP4

Реддит

NVFP4 квант #qie2511

👍15🌚2🔥1

2.45K views11:19

Нейронавт | Нейросети в творчестве

Совет на 2026 год — освойте вайб-маркетинг. ИИ уже создаёт стратегии, лендинги, креативы и тексты быстрее и качественнее любой команды

И те, кто освоит ИИ-маркетинг сейчас, будут зарабатывать в разы больше тех, кто всё ещё делает всё вручную

Разобраться в этом с нуля поможет канал SurgayGPT. Там простым языком объясняют, как работать с ИИ, какие связки реально дают результат, как запустить своё ИИ-агентство и где брать клиентов

Подписывайтесь и забирайте в закрепе бесплатный старт-пак в вайб-маркетинге: @Surgay_GPT

👎9🍌2❤1👍1😁1

1.87K views16:07

Нейронавт | Нейросети в творчестве

0:29

This media is not supported in your browser

VIEW IN TELEGRAM

Успешно внедрился в группу человеков. Приняли за своего, кажется ничего не подозревают.

#robot

😁28❤2👍2

1.93K views18:22

Нейронавт | Нейросети в творчестве

VibeVoice-ASR

Распознавалка речи от Microsoft

— обрабатывает аудио длиной до 60 минут за один раз, не нарезая на кусочки, поэтому лучше понимает общий смысл и не теряет контекст

— распознаёт, кто что сказал и когда, ставит временные метки

— учитывает специальные слова, которые ей даёт пользователь, например имена или технические термины, чтобы точнее работать с узкоспециализированным контентом

Гитхаб
HF
Демо1
Демо2

Спасибо @m_franz

#asr #stt #speech2text

👍16🔥7❤5

2.33K views06:09

About

Blog

Apps

Platform