This media is not supported in your browser
VIEW IN TELEGRAM
StereoSpace: Depth-Free Synthesis of Stereo Geometry via End-to-End Diffusion in a Canonical Space
Моделька превращает обычные изображения в стерео не используя явные данные о глубине
Гитхаб
Демо
#image2stereo #novelview #stereo
Моделька превращает обычные изображения в стерео не используя явные данные о глубине
Гитхаб
Демо
#image2stereo #novelview #stereo
👍8😱1
Media is too big
VIEW IN TELEGRAM
Steer3D: Feedforward 3D Editing via Text-Steerable Image-to-3D
3D контролнет, с которым 3d-генерилки становятся 3d-редакторами
Гитхаб
HF
#3dediting #controlnet
3D контролнет, с которым 3d-генерилки становятся 3d-редакторами
Гитхаб
HF
#3dediting #controlnet
🔥5👍2
Mistral OCR 3
Новая версия распознавалкитекcтов документов от Mistral
Русский поддерживает
С недавно вышедшей HunyuanOCR почему-то себя не сравнивают
Playground
AI studio
#ocr #image2text #image2doc
Новая версия распознавалки
Русский поддерживает
С недавно вышедшей HunyuanOCR почему-то себя не сравнивают
Playground
AI studio
#ocr #image2text #image2doc
👍8🤔1
Depth Any Panoramas: A Foundation Model for Panoramic Depth Estimation (DAP)
Модель для оценки глубины панорамных изображений.
За извлечение признаков отвечает DINOv3-Large
Гитхаб
Демо
#panorama2depth #image2depth
Модель для оценки глубины панорамных изображений.
За извлечение признаков отвечает DINOv3-Large
Гитхаб
Демо
#panorama2depth #image2depth
🔥8
SVG-T2I: Scaling up text-to-image latent diffusion model without variational autoencoder
Опенсорсная генерация картинок по тексту без VAE от Kling. Вместо этого используют Visual Foundation Model (VFM), что дает универсальность, преимущество на высоком разрешении, сохранение семантической структуры, одновременную работу с текстом и изображением.
Гитхаб
HF
#text2image #optimization
Опенсорсная генерация картинок по тексту без VAE от Kling. Вместо этого используют Visual Foundation Model (VFM), что дает универсальность, преимущество на высоком разрешении, сохранение семантической структуры, одновременную работу с текстом и изображением.
Гитхаб
HF
#text2image #optimization
🔥7😁4
PersonaLive! : Expressive Portrait Image Animation for Live Streaming
Потоковый рилтаймовый аватар - оживлятор портретов от Dzine.ai
Под капотом #SD15 зато всего 12ГБ VRAM кушает и не ограничен хронометражом
Гитхаб
HF
#avatar #humanavatar #portraitaniimation
Потоковый рилтаймовый аватар - оживлятор портретов от Dzine.ai
Под капотом #SD15 зато всего 12ГБ VRAM кушает и не ограничен хронометражом
Гитхаб
HF
#avatar #humanavatar #portraitaniimation
👍12
Scone: Bridging Composition and Distinction in Subject-Driven Image Generation via Unified Understanding-Generation Modeling
Модель для генерации изображений на базе BAGEL, умеет не только комбинировать несколько объектов, но и чётко выделять нужный объект среди нескольких кандидатов
HF
Гитхаб
#text2image
Модель для генерации изображений на базе BAGEL, умеет не только комбинировать несколько объектов, но и чётко выделять нужный объект среди нескольких кандидатов
HF
Гитхаб
#text2image
👍2🔥1
Reve V1.1
Обновился умный редактор картинок Reve
Обновлено качество портретов (можно попросить «сделай так, чтобы выглядело как DSLR, средний план») и вариации освещения
Твит
#imageediting #text2image
Обновился умный редактор картинок Reve
Обновлено качество портретов (можно попросить «сделай так, чтобы выглядело как DSLR, средний план») и вариации освещения
Твит
#imageediting #text2image
👍9
🔥5👍2