Долгожданная Advanced Voice от ChatGPT может появиться «на следующей неделе»

скриншот. два человека сидят за столом и разговаривают по мобильному телефону в расширенном голосовом режиме OpenAI
ОпенАИ

Генеральный директор и соучредитель OpenAI Сэм Альтман сообщил в четверг в X (ранее Twitter), что его функция Advanced Voice начнет внедряться «на следующей неделе», но только для нескольких избранных подписчиков ChatGPT-Plus.

Компания планирует «запустить альфа-версию с небольшой группой пользователей, чтобы собрать отзывы и расшириться на основе того, что мы узнаем».

Технология Advanced Voice, которая позволяет отказаться от текстовых подсказок и позволяет пользователям напрямую общаться с ИИ, как с человеком, была первоначально анонсирована в мае одновременно с выпуском GPT-4o во время мероприятия Spring Update. В отличие от существующих цифровых помощников, таких как Siri и Google Assistant, которые предоставляют только готовые ответы на запросы пользователей, Advanced Voice ChatGPT обеспечивает ответы, подобные человеческим, практически без задержек и на нескольких языках.

Модель GPT-4o способна реагировать на аудиовходы в среднем за 320 миллисекунд , что соответствует тому, как быстро люди реагируют на обычный разговор. Как вы можете видеть в демонстрационном видео ниже, модель может общаться с несколькими пользователями одновременно, импровизировать темы для разговора и задавать вопросы на английском и португальском языках, а также передавать им человеческие эмоции, включая « смех ».

Изучение нового языка с помощью расширенного голосового режима ChatGPT

Пока нет информации о том, как компания будет выбирать участников для альфа-тестирования, за исключением того, что они будут подписчиками уровня ChatGPT Plus за 20 долларов в месяц. Альфа-релиз изначально был запланирован на июнь, однако эта дата была перенесена, «чтобы достичь планки запуска» и улучшить способность обнаруживать и отклонять запрещенные формы контента, а также укрепить ИТ-инфраструктуру компании для размещения ожидаемой пользовательской нагрузки. увеличивать.

Как компания объявила в июне , полное внедрение этой функции произойдет не раньше этой осени, и ее точные сроки, опять же, будут зависеть от того, «соответствует ли она нашим высоким стандартам безопасности и надежности».

Предоставление ChatGPT возможности естественного общения со своими пользователями является огромным достижением. Устранение необходимости в контекстном окне снижает требования к пользовательскому оборудованию и расширяет потенциальную интеграцию и варианты использования ИИ (например, расширение доступа для пользователей с ограничениями подвижности тела или ловкости).

Это также может помочь ускорить внедрение технологии среди населения, уменьшив входной барьер для менее технически подкованных пользователей, которым удобно взаимодействовать со своими компьютерами с помощью «Привет, Siri», но они не видят перспектив быстрого проектирования.