Все дикие вещи, которые люди делают с новым голосовым режимом ChatGPT

Расширенный голосовой режим ChatGPT появился во вторник для нескольких избранных подписчиков OpenAI, выбранных для участия в альфа-выпуске долгожданной функции.

Впервые об этой функции было объявлено еще в мае . Он предназначен для того, чтобы отказаться от обычного текстового контекстного окна и вместо этого использовать естественные, произнесенные слова, передаваемые в реалистичной манере. Он работает с различными региональными акцентами и языками. Согласно OpenAI , Advanced Voice « предлагает более естественные разговоры в реальном времени, позволяет вам прерывать разговор в любое время, а также распознает ваши эмоции и реагирует на них». »

Существуют некоторые ограничения на то, что пользователи могут запрашивать в голосовом режиме. Система будет говорить одним из четырех предустановленных голосов и не способна имитировать голоса других людей — ни частных лиц, ни общественных деятелей.

Фактически, эта функция полностью блокирует выходы, которые отличаются от четырех предустановок. Более того, система не будет генерировать аудио, защищенное авторскими правами, или музыку. Поэтому, конечно, первое, что кто-то сделал, это запустил битбокс.

Продвинутый голос как би-бой

Пользователь Alpha Итан Сутин разместил в X (ранее Twitter) ветку, показывающую ряд ответов Advanced Voice, включая приведенный выше, где ИИ произносит короткий «рэп по случаю дня рождения», а затем переходит к битбоксу. Вы действительно можете услышать, как ИИ в цифровом режиме дышит между ударами.

Advanced Voice как рассказчик

Хотя Advanced Voice запрещено создавать песни оптом, он может создавать фоновые звуковые эффекты для сказок, которые он рассказывает на ночь.

В приведенном выше примере от Кеску ИИ добавляет своевременные падения и удары к своей истории о киборге-изгое после того, как его попросили: «Расскажите мне захватывающий боевик с элементами научной фантастики и создайте атмосферу, издавая соответствующие звуки из вещей». происходит (например: Громко завывает шторм)».

ИИ также способен создавать реалистичных персонажей на месте, как показывает приведенный выше пример Сутина.

Advanced Voice как эмоциональный динамик

Новая функция звучит так реалистично отчасти потому, что она способна выражать эмоции, как это делает человек. В приведенном выше примере Итан Сутин воссоздает знаменитую сцену из «Звездного пути 2» . В двух примерах ниже пользователь Криштиану Джардина заставляет ИИ говорить разными тонами и на разных языках.

Advanced Voice для любителя животных

Вокальные способности ИИ не ограничиваются человеческими языками. В приведенном выше примере Advanced Voice приказано издавать кошачьи звуки, и он делает это с безошибочной точностью.

Помимо того, что пользователи могут говорить как кошки, они могут задавать ИИ вопросами о своих биологических друзьях из семейства кошачьих и получать персональные советы и рекомендации в режиме реального времени.

Advanced Voice как переводчик в реальном времени

Advanced Voice также может использовать камеру вашего устройства для облегчения перевода. В приведенном выше примере пользователь Мануэль Сэнсили направляет свой телефон на GameBoy Advanced, на котором запущена японская версия игры Pokémon, и заставляет ИИ читать экранный диалог во время игры.

Компания отмечает, что видео и совместное использование экрана не будут частью альфа-версии, но будут доступны позже. OpenAI планирует распространить альфа-версию на дополнительных подписчиков Plus «в течение следующих нескольких недель» и предоставит ее всем пользователям Plus «осенью».