Нейронавт | Нейросети в творчестве

Mistral OCR 3

Новая версия распознавалки ~~текcтов~~ документов от Mistral

Русский поддерживает

С недавно вышедшей HunyuanOCR почему-то себя не сравнивают

Playground
AI studio

#ocr #image2text #image2doc

👍8🤔1

2.1K views08:11

Нейронавт | Нейросети в творчестве

0:01

This media is not supported in your browser

VIEW IN TELEGRAM

Depth Any Panoramas: A Foundation Model for Panoramic Depth Estimation (DAP)

Модель для оценки глубины панорамных изображений.

За извлечение признаков отвечает DINOv3-Large

Гитхаб
Демо

#panorama2depth #image2depth

🔥8

2.09K views09:12

Нейронавт | Нейросети в творчестве

SVG-T2I: Scaling up text-to-image latent diffusion model without variational autoencoder

Опенсорсная генерация картинок по тексту без VAE от Kling. Вместо этого используют Visual Foundation Model (VFM), что дает универсальность, преимущество на высоком разрешении, сохранение семантической структуры, одновременную работу с текстом и изображением.

Гитхаб
HF

#text2image #optimization

🔥7😁4

1.86K views10:13

Нейронавт | Нейросети в творчестве

0:12

This media is not supported in your browser

VIEW IN TELEGRAM

0:20

This media is not supported in your browser

VIEW IN TELEGRAM

PersonaLive! : Expressive Portrait Image Animation for Live Streaming

Потоковый рилтаймовый аватар - оживлятор портретов от Dzine.ai

Под капотом #SD15 зато всего 12ГБ VRAM кушает и не ограничен хронометражом

Гитхаб
HF

#avatar #humanavatar #portraitaniimation

👍12

1.72K views11:14

Нейронавт | Нейросети в творчестве

Scone: Bridging Composition and Distinction in Subject-Driven Image Generation via Unified Understanding-Generation Modeling

Модель для генерации изображений на базе BAGEL, умеет не только комбинировать несколько объектов, но и чётко выделять нужный объект среди нескольких кандидатов

HF
Гитхаб

#text2image

👍2🔥1

1.82K views12:17

Нейронавт | Нейросети в творчестве

0:01

This media is not supported in your browser

VIEW IN TELEGRAM

Reve V1.1

Обновился умный редактор картинок Reve

Обновлено качество портретов (можно попросить «сделай так, чтобы выглядело как DSLR, средний план») и вариации освещения

Твит

#imageediting #text2image

👍9

1.98K views12:46

Нейронавт | Нейросети в творчестве

GPT-5.2-Codex

доступен в Codex для всех платных пользователей ChatGPT

#coding #agent

🔥5👍2

1.57K views13:17

Нейронавт | Нейросети в творчестве

1:35

This media is not supported in your browser

VIEW IN TELEGRAM

0:37

This media is not supported in your browser

VIEW IN TELEGRAM

Браузерное расширение Claude

вместо того чтобы пытаться создать свой ИИ-браузер, Anthropic решили влезть на поляну гугла, по крайней мере на начальном этапе

Расширение помогает управлять календарём, планировать встречи, составлять ответы на письма, обрабатывать отчёты о расходах и тестировать функции сайтов

Имеет систему защиты от атак с внедрением промтов (prompt injection attacks)

Что немаловажно, умеет работать с Claude Code: проверять код в терминале, верифицировать его в браузере, отлаживать, читая ошибки консоли и состояние DOM

Установить расширение

#browser #assistant

❤6

1.96K views14:17

Нейронавт | Нейросети в творчестве

Forwarded from Not Boring Tech

⚡️ МЕГАРОЗЫГРЫШ 150,000 токенов для 30+ лучших нейросетей — мы дарим 15 подписок Phygital+ на месяц с доступом к Nano Banana Pro, Veo 3 и 30 другим нейронкам.

Победители получат по 10,000 токенов для топовых ИИ:

Генераторы картинок:
• Nano Banana Pro
• FLUX
• WAN Image
• Imagen
• Seedream
• Krea
• GPT Image
• QWEN
• Ideogram
• Runway Image

Генераторы видео:
• Kling 2.5/2.6
• VEO 3/3.1
• Sora 2
• Runway / Aleph
• WAN Video
• Omnihuman
• Hailuo
• Seedance

Редакторы и другие инструменты:
• ControlNet
• Inpainting / Outpainting
• Vectorizer
• Magnific Upscaler
• Remove background

Условия простые:

1. Подписаться на Not Boring Tech — канал про лучшие нейросети для работы и рутины.
2. Подписаться на Phygital+ — канал про ИИ-платформу для автоматизации визуального контента.
3. Нажать «Участвовать» под этим постом.

Бот выберет 15 победителей случайным образом уже 30 декабря. Всем удачи!

❤2👍1😎1

1.37K views15:06

Участвовать (211)

Нейронавт | Нейросети в творчестве

Qwen-Image-Layered

Редактор картинок от Qwen на базе #qwenimage
Hаскладывает изображения на несколько RGBA-слоёв. Это позволяет редактировать каждый слой отдельно, не трогая остальные части картинки

Может менять размер объектов без искажений

Может рекурсивно раскладывать слои — то есть любой слой можно разложить ещё на более мелкие слои

Гитхаб
HF
GGUF
Демо

спасибо @m_franz @stefanfalkok

#imageediting #image2rgba #rgba #gguf

👍15🔥4❤1

2.62K views17:12

About

Blog

Apps

Platform