AI для Всех
14.9K subscribers
1.32K photos
181 videos
11 files
1.51K links
Канал, в котором мы говорим про искусственный интеллект простыми словами

Главный редактор и по рекламе: @crimeacs

Иногда пишут в канал: @GingerSpacetail, @innovationitsme
Download Telegram
В туалетах поставили мыло по 40$ бутылка
😐12👍7🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
В холле стоит телевизор с генерациями из Sora, по сравнению со всеми остальными платформами (типа RunWay) качество так себе
😁14
This media is not supported in your browser
VIEW IN TELEGRAM
Хвастаются своим GPT4о advanced voice mode
😐104🔥2
Опубликовали цены на realtime api

Input: text - 5$/1M audio - $0.06/ минута
Output: text $20/1M audio $0.24/ минута
🔥7
🎙️ Realtime API: Будущее мультимодальных AI-приложений

Сегодня OpenAI представила— Realtime API, которая позволяет создавать мультимодальные, разговорные интерфейсы с малой задержкой. Это API поддерживает взаимодействие с AI через голос и текст в режиме реального времени. Вот что важно знать:

🧠 Как это работает?
Realtime API работает через WebSocket, что позволяет поддерживать постоянное соединение. Поток взаимодействия следующий:
1 Пользователь говорит 🎤
2 Аудио передаётся в API для обработки
3 API возвращает текстовые или голосовые ответы
4 Возможна интеграция с функциями, например, запрос на получение данных или выполнение задач.

🔧 Почему это важно?
Раньше для голосового взаимодействия с AI приходилось использовать несколько инструментов: Whisper для распознавания речи, Chat Completions для создания ответов, и TTS для преобразования текста в голос. Теперь же, с Realtime API, всё это объединено в один интерфейс, что значительно сокращает задержку и делает взаимодействие более плавным.

💡 Возможности:
• Мультимодальный ввод и вывод: Поддержка как текста, так и голоса.
• Нативная обработка речи: AI может отвечать в режиме реального времени без промежуточного преобразования текста.
• Вызов функций: Мгновенные действия по голосовому запросу (например, узнать погоду или забронировать билет).
• Сохранение состояния: Поддержка непрерывного разговора в течение сессии.

🚀 Применение:
1 Голосовые ассистенты для умного дома или клиентской поддержки.
2 Интерактивные истории с возможностью управлять сюжетом через голос.
3 Здоровье и благополучие: Реальные голосовые советы в ответ на запросы пользователей.

Вывод:
Realtime API от OpenAI значительно сокращает задержку, упрощает голосовые интерфейсы и открывает новые возможности для разработки приложений с естественным голосовым взаимодействием. Это шаг вперёд в построении более интуитивных и отзывчивых AI-приложений.
🔥138👍4
Еще из прикольного, все объявления на мероприятии делает голос ChatGPT (ну типа, please join your sits, session will resume shortly)
🔥10
Показали цены на prompt caching
🔥3
1👍1