Нейронавт | Нейросети в творчестве
11.1K subscribers
4.76K photos
4.11K videos
41 files
5.13K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6813108708
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
StereoSpace: Depth-Free Synthesis of Stereo Geometry via End-to-End Diffusion in a Canonical Space

Моделька превращает обычные изображения в стерео не используя явные данные о глубине

Гитхаб
Демо

#image2stereo #novelview #stereo
👍8😱1
Media is too big
VIEW IN TELEGRAM
Steer3D: Feedforward 3D Editing via Text-Steerable Image-to-3D

3D контролнет, с которым 3d-генерилки становятся 3d-редакторами

Гитхаб
HF

#3dediting #controlnet
🔥5👍2
Mistral OCR 3

Новая версия распознавалки текcтов документов от Mistral

Русский поддерживает

С недавно вышедшей HunyuanOCR почему-то себя не сравнивают

Playground
AI studio

#ocr #image2text #image2doc
👍8🤔1
Depth Any Panoramas: A Foundation Model for Panoramic Depth Estimation (DAP)

Модель для оценки глубины панорамных изображений.

За извлечение признаков отвечает DINOv3-Large

Гитхаб
Демо

#panorama2depth #image2depth
🔥8
SVG-T2I: Scaling up text-to-image latent diffusion model without variational autoencoder

Опенсорсная генерация картинок по тексту без VAE от Kling. Вместо этого используют Visual Foundation Model (VFM), что дает универсальность, преимущество на высоком разрешении, сохранение семантической структуры, одновременную работу с текстом и изображением.

Гитхаб
HF

#text2image #optimization
🔥7😁4
PersonaLive! : Expressive Portrait Image Animation for Live Streaming

Потоковый рилтаймовый аватар - оживлятор портретов от Dzine.ai

Под капотом #SD15 зато всего 12ГБ VRAM кушает и не ограничен хронометражом

Гитхаб
HF

#avatar #humanavatar #portraitaniimation
👍12
Scone: Bridging Composition and Distinction in Subject-Driven Image Generation via Unified Understanding-Generation Modeling

Модель для генерации изображений на базе BAGEL, умеет не только комбинировать несколько объектов, но и чётко выделять нужный объект среди нескольких кандидатов

HF
Гитхаб

#text2image
👍2🔥1
Reve V1.1

Обновился умный редактор картинок Reve

Обновлено качество портретов (можно попросить «сделай так, чтобы выглядело как DSLR, средний план») и вариации освещения

Твит

#imageediting #text2image
👍9
GPT-5.2-Codex

доступен в Codex для всех платных пользователей ChatGPT

#coding #agent
🔥5👍2