GPT-5.2
OpenAI запустили GPT-5.2 — новый флагман для агентов и кода с актуальностью до 31 августа 2025.
В ChatGPT уже доступны режимы Instant, Thinking и Pro (для платных тарифов). Бесплатные пользователи получат доступ завтра. Модель доступна через API и Codex, дороже чем 5 и 5.1
GPT-5.1 останется в ChatGPT для платных пользователей ещё три месяца как legacy-версия.
#agent #coding
OpenAI запустили GPT-5.2 — новый флагман для агентов и кода с актуальностью до 31 августа 2025.
В ChatGPT уже доступны режимы Instant, Thinking и Pro (для платных тарифов). Бесплатные пользователи получат доступ завтра. Модель доступна через API и Codex, дороже чем 5 и 5.1
GPT-5.1 останется в ChatGPT для платных пользователей ещё три месяца как legacy-версия.
#agent #coding
👍7❤1🥴1🍌1
Qwen3-Omni-Flash-2025-12-01
Вслед за говорилкой обновили и омнимодальную модель
— лучше понимает видео и аудио в многоходовых диалогах, благодаря чему разговоры протекают естественно
— позволяет настраивать личность ИИ с помощью системных промтов, например для ролевых сценариев
— поддерживает 119 языков текста и 19 языков речи
— создаёт голоса, неотличимые от человеческих
Qwen Chat - нажмите VoiceChat and VideoChat
Демо
Демо MS
API рилтайм
API Offline
#assistant #tts #stt #multimodal #omnimodal #russian
Вслед за говорилкой обновили и омнимодальную модель
— лучше понимает видео и аудио в многоходовых диалогах, благодаря чему разговоры протекают естественно
— позволяет настраивать личность ИИ с помощью системных промтов, например для ролевых сценариев
— поддерживает 119 языков текста и 19 языков речи
— создаёт голоса, неотличимые от человеческих
Qwen Chat - нажмите VoiceChat and VideoChat
Демо
Демо MS
API рилтайм
API Offline
#assistant #tts #stt #multimodal #omnimodal #russian
👍10❤2
Нейронавт | Нейросети в творчестве
GPT-5.2 OpenAI запустили GPT-5.2 — новый флагман для агентов и кода с актуальностью до 31 августа 2025. В ChatGPT уже доступны режимы Instant, Thinking и Pro (для платных тарифов). Бесплатные пользователи получат доступ завтра. Модель доступна через API…
Gemini Deep Research API
Гугл наверняка держит за пазухой какой-нибудь релиз на случай релизов у конкурентов.
Вчера в пику GPT-5.2 выкатили в API прокачанный Gemini Deep Research
#agent #deepresearch
Гугл наверняка держит за пазухой какой-нибудь релиз на случай релизов у конкурентов.
Вчера в пику GPT-5.2 выкатили в API прокачанный Gemini Deep Research
#agent #deepresearch
👍5😱1
Z-Image-Turbo-Fun-Controlnet-Union-2.0
Обновился Контролнет 5-в-1 под #Zimage от alibaba-pai
Умеет делать инпейнтнг, аутпейнтинг
Рулька силы и количество шагов влияет на реалистичность и чёткость результатов
Спасибо @m_franz
#controlnet #conditioning #inpainting #outpainting
Обновился Контролнет 5-в-1 под #Zimage от alibaba-pai
Умеет делать инпейнтнг, аутпейнтинг
Рулька силы и количество шагов влияет на реалистичность и чёткость результатов
Спасибо @m_franz
#controlnet #conditioning #inpainting #outpainting
🔥19👍6😱1
Google Disco
ИИ-браузер от гугла превращает информацию в веб-приложение
Записаться в вейтлист - там требуют подтвердить что вы находитесь в США, так что палевные русские аккаунты наверно там светить не стоит
#browser
ИИ-браузер от гугла превращает информацию в веб-приложение
Записаться в вейтлист - там требуют подтвердить что вы находитесь в США, так что палевные русские аккаунты наверно там светить не стоит
#browser
❤4👍3👎1😁1
Media is too big
VIEW IN TELEGRAM
Visionary: The World Model Carrier Built on WebGPU-Powered Gaussian Splatting Platform
Китайская среда для рендера и работы с всевозможными гауссианами и 3D-мешами в браузере. Построена на базе WebGPU и ONNX Runtime
Есть three.js с API на TypeScript для интеграции в веб-приложения
Гитхаб
Попробовать
#3d #gaussian #nerf #3d #3dediting #rendering #onlone #realtime
Китайская среда для рендера и работы с всевозможными гауссианами и 3D-мешами в браузере. Построена на базе WebGPU и ONNX Runtime
Есть three.js с API на TypeScript для интеграции в веб-приложения
Гитхаб
Попробовать
#3d #gaussian #nerf #3d #3dediting #rendering #onlone #realtime
👍5❤1
Media is too big
VIEW IN TELEGRAM
Сервис для стилизации видео Mago Studio вышел в открытую бету
Обещают что попробовать можно бесплатно
Скидка 40% на первую покупку по промокоду
Пробуем здесь. Если сможем достучаться до сайта
#video2video #styletransfer #stylization
Обещают что попробовать можно бесплатно
Скидка 40% на первую покупку по промокоду
LAUNCHПробуем здесь. Если сможем достучаться до сайта
#video2video #styletransfer #stylization
👀5👍3❤1
relsim: Relational Visual Similarity
Adobe и Co придумали новый метод измерения визуальной схожести изображений — через реляционную схожесть, а не только через атрибуты.
В отличие от существующих методов (например, LPIPS, CLIP, DINO), которые фокусируются на внешних атрибутах изображений, relsim улавливает скрытые взаимоотношения между визуальными элементами
Гитхаб
#research #vlm
Adobe и Co придумали новый метод измерения визуальной схожести изображений — через реляционную схожесть, а не только через атрибуты.
В отличие от существующих методов (например, LPIPS, CLIP, DINO), которые фокусируются на внешних атрибутах изображений, relsim улавливает скрытые взаимоотношения между визуальными элементами
Гитхаб
#research #vlm
👍13🔥3