Все дикие вещи, которые люди делают с новым голосовым режимом ChatGPT
Расширенный голосовой режим ChatGPT появился во вторник для нескольких избранных подписчиков OpenAI, выбранных для участия в альфа-выпуске долгожданной функции.
Впервые об этой функции было объявлено еще в мае . Он предназначен для того, чтобы отказаться от обычного текстового контекстного окна и вместо этого использовать естественные, произнесенные слова, передаваемые в реалистичной манере. Он работает с различными региональными акцентами и языками. Согласно OpenAI , Advanced Voice « предлагает более естественные разговоры в реальном времени, позволяет вам прерывать разговор в любое время, а также распознает ваши эмоции и реагирует на них». »
Существуют некоторые ограничения на то, что пользователи могут запрашивать в голосовом режиме. Система будет говорить одним из четырех предустановленных голосов и не способна имитировать голоса других людей — ни частных лиц, ни общественных деятелей.
Фактически, эта функция полностью блокирует выходы, которые отличаются от четырех предустановок. Более того, система не будет генерировать аудио, защищенное авторскими правами, или музыку. Поэтому, конечно, первое, что кто-то сделал, это запустил битбокс.
Продвинутый голос как би-бой
Битбоксы Yo ChatGPT Advanced Voice pic.twitter.com/yYgXzHRhkS
— Итан Сутин (@EthanSutin) 30 июля 2024 г.
Пользователь Alpha Итан Сутин разместил в X (ранее Twitter) ветку, показывающую ряд ответов Advanced Voice, включая приведенный выше, где ИИ произносит короткий «рэп по случаю дня рождения», а затем переходит к битбоксу. Вы действительно можете услышать, как ИИ в цифровом режиме дышит между ударами.
Advanced Voice как рассказчик
Это потрясающе на самом деле
Я не ожидал зловещих звуков https://t.co/SgEPi5Bd3K pic.twitter.com/DnK8AVdWjV
— Кеску (@yoimnotkesku) 30 июля 2024 г.
Хотя Advanced Voice запрещено создавать песни оптом, он может создавать фоновые звуковые эффекты для сказок, которые он рассказывает на ночь.
В приведенном выше примере от Кеску ИИ добавляет своевременные падения и удары к своей истории о киборге-изгое после того, как его попросили: «Расскажите мне захватывающий боевик с элементами научной фантастики и создайте атмосферу, издавая соответствующие звуки из вещей». происходит (например: Громко завывает шторм)».
Посмотрите на работы OpenAI, вы, могучие и отчаявшиеся!
это самое дикое. Действительно можно почувствовать себя режиссером, руководящим шекспировским актером! pic.twitter.com/GUQ1z8rjIL
— Итан Сутин (@EthanSutin) 31 июля 2024 г.
ИИ также способен создавать реалистичных персонажей на месте, как показывает приведенный выше пример Сутина.
Advanced Voice как эмоциональный динамик
Хан!!!!!! pic.twitter.com/xQ8NdEojSX
— Итан Сутин (@EthanSutin) 30 июля 2024 г.
Новая функция звучит так реалистично отчасти потому, что она способна выражать эмоции, как это делает человек. В приведенном выше примере Итан Сутин воссоздает знаменитую сцену из «Звездного пути 2» . В двух примерах ниже пользователь Криштиану Джардина заставляет ИИ говорить разными тонами и на разных языках.
Расширенный голосовой режим ChatGPT, говорит по-японски (взволнованно) pic.twitter.com/YDL2olQSN8
— Криштиану Джардина (@CrisGiardina) 31 июля 2024 г.
ChatGPT Advanced Voice Mode говорит по-армянски (обычно, взволнованно, сердито) pic.twitter.com/SKm73lExdX
— Криштиану Джардина (@CrisGiardina) 31 июля 2024 г.
Advanced Voice для любителя животных
— Итан Сутин (@EthanSutin) 30 июля 2024 г.
Вокальные способности ИИ не ограничиваются человеческими языками. В приведенном выше примере Advanced Voice приказано издавать кошачьи звуки, и он делает это с безошибочной точностью.
Пробуем новый расширенный голосовой режим #ChatGPT , который только что был выпущен в альфа-версии. Это похоже на встречу с очень знающим другом, который в данном случае был очень полезен — успокоил нас с нашим новым котенком. Он может отвечать на вопросы в режиме реального времени, а также использовать камеру в качестве входного сигнала! pic.twitter.com/Xx0HCAc4To
— Мануэль Сансили (@ManuVision) 30 июля 2024 г.
Помимо того, что пользователи могут говорить как кошки, они могут задавать ИИ вопросами о своих биологических друзьях из семейства кошачьих и получать персональные советы и рекомендации в режиме реального времени.
Advanced Voice как переводчик в реальном времени
Японский перевод в реальном времени с использованием нового расширенного голосового режима #ChatGPT + Vision Alpha! Еще один полезный пример! pic.twitter.com/wDXrgYQkZE
— Мануэль Сансили (@ManuVision) 31 июля 2024 г.
Advanced Voice также может использовать камеру вашего устройства для облегчения перевода. В приведенном выше примере пользователь Мануэль Сэнсили направляет свой телефон на GameBoy Advanced, на котором запущена японская версия игры Pokémon, и заставляет ИИ читать экранный диалог во время игры.
Компания отмечает, что видео и совместное использование экрана не будут частью альфа-версии, но будут доступны позже. OpenAI планирует распространить альфа-версию на дополнительных подписчиков Plus «в течение следующих нескольких недель» и предоставит ее всем пользователям Plus «осенью».