Depth Any Panoramas: A Foundation Model for Panoramic Depth Estimation (DAP)
Модель для оценки глубины панорамных изображений.
За извлечение признаков отвечает DINOv3-Large
Гитхаб
Демо
#panorama2depth #image2depth
Модель для оценки глубины панорамных изображений.
За извлечение признаков отвечает DINOv3-Large
Гитхаб
Демо
#panorama2depth #image2depth
🔥8
SVG-T2I: Scaling up text-to-image latent diffusion model without variational autoencoder
Опенсорсная генерация картинок по тексту без VAE от Kling. Вместо этого используют Visual Foundation Model (VFM), что дает универсальность, преимущество на высоком разрешении, сохранение семантической структуры, одновременную работу с текстом и изображением.
Гитхаб
HF
#text2image #optimization
Опенсорсная генерация картинок по тексту без VAE от Kling. Вместо этого используют Visual Foundation Model (VFM), что дает универсальность, преимущество на высоком разрешении, сохранение семантической структуры, одновременную работу с текстом и изображением.
Гитхаб
HF
#text2image #optimization
🔥7😁4
PersonaLive! : Expressive Portrait Image Animation for Live Streaming
Потоковый рилтаймовый аватар - оживлятор портретов от Dzine.ai
Под капотом #SD15 зато всего 12ГБ VRAM кушает и не ограничен хронометражом
Гитхаб
HF
#avatar #humanavatar #portraitaniimation
Потоковый рилтаймовый аватар - оживлятор портретов от Dzine.ai
Под капотом #SD15 зато всего 12ГБ VRAM кушает и не ограничен хронометражом
Гитхаб
HF
#avatar #humanavatar #portraitaniimation
👍12
Scone: Bridging Composition and Distinction in Subject-Driven Image Generation via Unified Understanding-Generation Modeling
Модель для генерации изображений на базе BAGEL, умеет не только комбинировать несколько объектов, но и чётко выделять нужный объект среди нескольких кандидатов
HF
Гитхаб
#text2image
Модель для генерации изображений на базе BAGEL, умеет не только комбинировать несколько объектов, но и чётко выделять нужный объект среди нескольких кандидатов
HF
Гитхаб
#text2image
👍2🔥1
Reve V1.1
Обновился умный редактор картинок Reve
Обновлено качество портретов (можно попросить «сделай так, чтобы выглядело как DSLR, средний план») и вариации освещения
Твит
#imageediting #text2image
Обновился умный редактор картинок Reve
Обновлено качество портретов (можно попросить «сделай так, чтобы выглядело как DSLR, средний план») и вариации освещения
Твит
#imageediting #text2image
👍9
🔥5👍2
Браузерное расширение Claude
вместо того чтобы пытаться создать свой ИИ-браузер, Anthropic решили влезть на поляну гугла, по крайней мере на начальном этапе
Расширение помогает управлять календарём, планировать встречи, составлять ответы на письма, обрабатывать отчёты о расходах и тестировать функции сайтов
Имеет систему защиты от атак с внедрением промтов (prompt injection attacks)
Что немаловажно, умеет работать с Claude Code: проверять код в терминале, верифицировать его в браузере, отлаживать, читая ошибки консоли и состояние DOM
Установить расширение
#browser #assistant
вместо того чтобы пытаться создать свой ИИ-браузер, Anthropic решили влезть на поляну гугла, по крайней мере на начальном этапе
Расширение помогает управлять календарём, планировать встречи, составлять ответы на письма, обрабатывать отчёты о расходах и тестировать функции сайтов
Имеет систему защиты от атак с внедрением промтов (prompt injection attacks)
Что немаловажно, умеет работать с Claude Code: проверять код в терминале, верифицировать его в браузере, отлаживать, читая ошибки консоли и состояние DOM
Установить расширение
#browser #assistant
❤6
Forwarded from Not Boring Tech
⚡️ МЕГАРОЗЫГРЫШ 150,000 токенов для 30+ лучших нейросетей — мы дарим 15 подписок Phygital+ на месяц с доступом к Nano Banana Pro, Veo 3 и 30 другим нейронкам.
Победители получат по 10,000 токенов для топовых ИИ:
Условия простые:
1. Подписаться на Not Boring Tech — канал про лучшие нейросети для работы и рутины.
2. Подписаться на Phygital+ — канал про ИИ-платформу для автоматизации визуального контента.
3. Нажать «Участвовать» под этим постом.
Бот выберет 15 победителей случайным образом уже 30 декабря. Всем удачи!
Победители получат по 10,000 токенов для топовых ИИ:
Генераторы картинок:
• Nano Banana Pro
• FLUX
• WAN Image
• Imagen
• Seedream
• Krea
• GPT Image
• QWEN
• Ideogram
• Runway Image
Генераторы видео:
• Kling 2.5/2.6
• VEO 3/3.1
• Sora 2
• Runway / Aleph
• WAN Video
• Omnihuman
• Hailuo
• Seedance
Редакторы и другие инструменты:
• ControlNet
• Inpainting / Outpainting
• Vectorizer
• Magnific Upscaler
• Remove background
Условия простые:
1. Подписаться на Not Boring Tech — канал про лучшие нейросети для работы и рутины.
2. Подписаться на Phygital+ — канал про ИИ-платформу для автоматизации визуального контента.
3. Нажать «Участвовать» под этим постом.
Бот выберет 15 победителей случайным образом уже 30 декабря. Всем удачи!
❤2👍1😎1
Qwen-Image-Layered
Редактор картинок от Qwen на базе #qwenimage
Hаскладывает изображения на несколько RGBA-слоёв. Это позволяет редактировать каждый слой отдельно, не трогая остальные части картинки
Может менять размер объектов без искажений
Может рекурсивно раскладывать слои — то есть любой слой можно разложить ещё на более мелкие слои
Гитхаб
HF
GGUF
Демо
спасибо @m_franz @stefanfalkok
#imageediting #image2rgba #rgba #gguf
Редактор картинок от Qwen на базе #qwenimage
Hаскладывает изображения на несколько RGBA-слоёв. Это позволяет редактировать каждый слой отдельно, не трогая остальные части картинки
Может менять размер объектов без искажений
Может рекурсивно раскладывать слои — то есть любой слой можно разложить ещё на более мелкие слои
Гитхаб
HF
GGUF
Демо
спасибо @m_franz @stefanfalkok
#imageediting #image2rgba #rgba #gguf
👍15🔥4❤1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
FlashPortrait: 6× Faster Infinite Portrait Animation with Adaptive Latent Prediction
Оживлятор портретов от Microsoft и WAN на базе Wan2.1-14B
Умеет делать бесконечную анимацию, сохраняя при этом черты лица человека.
Справляется с большими и сложными движениями лица, не теряя качества
Плавно соединяет фрагменты видео, чтобы переходы были незаметными
Вот тут забавно:
Но:
И кажется кто-то выложил все видео без звука
Гитхаб
HF
спасибо @m_franz
#portraitanimation
Оживлятор портретов от Microsoft и WAN на базе Wan2.1-14B
Умеет делать бесконечную анимацию, сохраняя при этом черты лица человека.
Работает в 6 раз быстрее аналогов.
Справляется с большими и сложными движениями лица, не теряя качества
Плавно соединяет фрагменты видео, чтобы переходы были незаметными
Вот тут забавно:
FlashPortrait поддерживает создание видеороликов бесконечной длины с разрешением 480x832, или 832x480, или 512x512, или 720x720, или 720x1280, или 1280x720
Но:
Если у вас возникнут проблемы с нехваткой памяти, вы можете соответствующим образом уменьшить количество анимированных кадров или разрешение выходных данных.
И кажется кто-то выложил все видео без звука
Гитхаб
HF
спасибо @m_franz
#portraitanimation
🔥13👍7