Нейронавт | Нейросети в творчестве

StereoSpace: Depth-Free Synthesis of Stereo Geometry via End-to-End Diffusion in a Canonical Space

Моделька превращает обычные изображения в стерео не используя явные данные о глубине

Гитхаб
Демо

#image2stereo #novelview #stereo

👍8😱1

1.88K views06:12

Нейронавт | Нейросети в творчестве

0:22

Media is too big

VIEW IN TELEGRAM

Steer3D: Feedforward 3D Editing via Text-Steerable Image-to-3D

3D контролнет, с которым 3d-генерилки становятся 3d-редакторами

Гитхаб
HF

#3dediting #controlnet

🔥5👍2

1.95K viewsedited 07:08

Нейронавт | Нейросети в творчестве

0:59

This media is not supported in your browser

VIEW IN TELEGRAM

Mistral OCR 3

Новая версия распознавалки ~~текcтов~~ документов от Mistral

Русский поддерживает

С недавно вышедшей HunyuanOCR почему-то себя не сравнивают

Playground
AI studio

#ocr #image2text #image2doc

👍8🤔1

2.1K views08:11

Нейронавт | Нейросети в творчестве

0:01

This media is not supported in your browser

VIEW IN TELEGRAM

Depth Any Panoramas: A Foundation Model for Panoramic Depth Estimation (DAP)

Модель для оценки глубины панорамных изображений.

За извлечение признаков отвечает DINOv3-Large

Гитхаб
Демо

#panorama2depth #image2depth

🔥8

2.1K views09:12

Нейронавт | Нейросети в творчестве

SVG-T2I: Scaling up text-to-image latent diffusion model without variational autoencoder

Опенсорсная генерация картинок по тексту без VAE от Kling. Вместо этого используют Visual Foundation Model (VFM), что дает универсальность, преимущество на высоком разрешении, сохранение семантической структуры, одновременную работу с текстом и изображением.

Гитхаб
HF

#text2image #optimization

🔥7😁4

1.87K views10:13

Нейронавт | Нейросети в творчестве

0:12

This media is not supported in your browser

VIEW IN TELEGRAM

0:20

This media is not supported in your browser

VIEW IN TELEGRAM

PersonaLive! : Expressive Portrait Image Animation for Live Streaming

Потоковый рилтаймовый аватар - оживлятор портретов от Dzine.ai

Под капотом #SD15 зато всего 12ГБ VRAM кушает и не ограничен хронометражом

Гитхаб
HF

#avatar #humanavatar #portraitaniimation

👍12

1.73K views11:14

Нейронавт | Нейросети в творчестве

Scone: Bridging Composition and Distinction in Subject-Driven Image Generation via Unified Understanding-Generation Modeling

Модель для генерации изображений на базе BAGEL, умеет не только комбинировать несколько объектов, но и чётко выделять нужный объект среди нескольких кандидатов

HF
Гитхаб

#text2image

👍2🔥1

1.82K views12:17

Нейронавт | Нейросети в творчестве

0:01

This media is not supported in your browser

VIEW IN TELEGRAM

Reve V1.1

Обновился умный редактор картинок Reve

Обновлено качество портретов (можно попросить «сделай так, чтобы выглядело как DSLR, средний план») и вариации освещения

Твит

#imageediting #text2image

👍9

1.98K views12:46

Нейронавт | Нейросети в творчестве

GPT-5.2-Codex

доступен в Codex для всех платных пользователей ChatGPT

#coding #agent

🔥5👍2

1.57K views13:17

About

Blog

Apps

Platform