Один из самых известных злодеев в истории кино в будущем «не будет говорить человеческими словами»

В научно-фантастическом боевике Энга Ли «Человек-близнец» правительственный агент Генри собирается уйти в отставку, когда обнаруживает, что за ним охотится клон на 23 года моложе.

Чтобы добиться этого эффекта, Энг Ли использовал специальные эффекты захвата движения, чтобы деликатно восстановить человеческое лицо, заставив Уилла Смита «омолодиться». Молодой человек с «идеальной 23-летней кожей» также предоставил свои данные клону.

Никто не вечно молод, а кто-то всегда молод.

Но «цифровые двойники» могут быть более жадными: помимо нестареющей кожи у них могут быть и нестареющие голоса.

Призвать машину времени

Дарт Вейдер из «Звездных войн», перешедший на темную сторону Силы из-за своего физического и психического разрушения, является злодеем номер один в оригинальной трилогии, а также самым противоречивым и трагичным персонажем в серии «Звездных войн». .

В 2003 году Американский институт киноискусства поставил Дарта Вейдера на третье место среди величайших кинозлодеев века после Ганнибала из «Молчания ягнят» и Нормана Бейтса из «Психо».

Джеймс Эрл Джонс был голосом Дарта Вейдера с тех пор, как Лукас выпустил первые «Звездные войны» в 1977 году, и его голос стал характерным для почти половины жизни человека звуком.

▲ Изображение из: screenrant

От мощного, но слегка приглушенного голоса Дарта Вейдера в сочетании со звуком глубокого дыхания по спине побежали мурашки.

Но люди со временем стареют, а Джонсу в этом году исполняется 91 год, и пора задуматься о завершении карьеры озвучки, и он решил передать лицензию на голос украинскому стартапу Respeecher.

Используя предыдущие записи и запатентованные алгоритмы искусственного интеллекта, Respeecher может создавать новые реплики из старых голосов.

▲ Respeecher.Изображение из: inverse

Последним достижением является спин-офф «Звездных войн» «Оби-Ван Кеноби» , который завершился в июне этого года.

В сериале Респичер воссоздает голос Джонса десятилетия назад, а не его настоящий голос, состарившийся с возрастом в «Звездных войнах: Скайуокер. Восход» 2019 года.

Для такого персонажа, как Дарт Вейдер, 50 строк могут потребовать почти 10 000 файлов для переключения туда и обратно, и большая часть работы тратится на изменения диалогов и тонкую настройку.

Интересная деталь заключается в том, что в эпизоде ​​​​3 «Оби-Ван Кеноби» Дарта Вейдера также упоминается Респичер .

▲ Изображение из: Lucasfilm

Это не первый раз, когда Respeecher объединяется с Lucasfilm, он также «озвучивает» младшую версию Люка Скайуокера в спин-оффах «Звездных войн» «Мандалорец» и «Книга Бобы Фетта».

Марку Хэмиллу, сыгравшему Люка Скайуокера в трилогии «Звездные войны», выходившей с 1977 по 1983 год, в этом году также исполняется 70 лет.

В последней серии второго сезона «Мандалорца» появился Люк Скайуокер, которому не исполнилось 20. Изображение было сделано компанией визуальных эффектов Lola VFXс использованием Deepfake и дублеров, а голос был «клонирован». Респичер.

▲ "Книга Бобы Фетта" Люк Скайуокер CGI.

▲ 1983 "Звездные войны VI" Люк Скайуокер.

Что Respeecher делает, так это вводит часы высококачественных записей и анализирует речь с помощью программного обеспечения для синтеза речи AI и алгоритмов сверхвысокого разрешения звука до тех пор, пока система не сможет «клонировать».

Точно так же, как для клонирования овцы требуется ДНК, а клонированный голос имеет вход перед выходом, такие детали, как стиль речи, взлеты и падения записи, очень важны.

Так что эта работа до сих пор очень актуальна для людей. «Технологии пока не могут создавать перформансы.» Без прошлых живых выступлений Respeecher был бы беспомощен.

С этой точки зрения ИИ Respeecher подобен звучащему устройству в машине времени — он воссоздает определенный момент в чьем-то прошлом .

▲ Люк Скайуокер в «Мандалорце».

Чтобы вернуть молодого Скайуокера к жизни, Respeecher собрал озвучку Марка Хэмилла, интервью, дополнения к диалогам, радиопередачи и многое другое примерно 1983 года.

Вот еще одна трудность: заставить почти 40-летние данные звучать так, как будто они были записаны вчера.

В конце концов, Люк Скайуокер сказал всего несколько строк в двух спин-оффах. Однако нет необходимости количественно определять короткое и длинное, гарантируя, что синтезированная речь неотличима от исходной речи, а аудитория совершенно не знает, настоящая она или нет, чего и хочет Respeecher.

Стартап, основанный в 2018 году, преследует простую цель: клонировать ничего не подозревающую человеческую речь.

Преодолев боль, жизнь и смерть

Люди рождаются ограниченными и не могут избежать старости, болезней и смерти, но технологии могут расширить границы физического тела.

Это не первый и не последний случай клонирования голоса знаменитости.

Выпущенный в 2022 году фильм «Лучший стрелок: Одинокий рейнджер» является продолжением «Лучшего стрелка» 1986 года, в котором 62-летний Вэл Килмер снова представил «Ледяного человека» Казанского.

Но вернуться было непросто, и Килмер навсегда потерял голос после того, как в 2014 году лечился от рака горла.

Поэтому сценарий «Лучший стрелок: Одинокий рейнджер» основан на реальной жизни Килмера, «Айсмен» тоже болен раком и общается с помощью набора текста , а в фильме произносит лишь короткую строчку.

▲ Изображение взято с сайта: pagesix

В реальной жизни голос Килмера был «восстановлен» искусственным интеллектом. В 2020 году Килмер начал работать с голосовой ИИ-компанией Sonantic .

Получив многочасовые старые кадры, Sonantic сначала удаляет фоновый шум, не разрушая речевой контент, затем генерирует сценарий из аудио, соединяя аудио и текст по частям, а речевой движок использует эти данные для обучения модели речи.

Сложность в том, что Килмер предоставил примерно в 10 раз меньше данных, чем их предыдущие проекты. С этой целью Sonantic работал над новыми алгоритмами, в конечном итоге сгенерировав более 40 различных моделей речи и передав лучшую из них Килмеру.

▲ Изображение взято с сайта vanityfair.com

Используя настраиваемую модель речи, Килмер и его команда вводят текст, выбирают подходящий режим и настраивают такие параметры, как высота тона, ритм и другие, для достижения реалистичного общения.

Это не просто технологическое достижение, это человеческое общение и связь. Сам Килмер упомянул в заявлении:

Как человеческие существа, способность общаться лежит в основе нашего существования, и последствия рака горла затруднили понимание меня другими людьми. Это был особенный подарок — иметь возможность рассказать свою историю аутентичным и знакомым голосом.

Есть и такие примеры в стране. В 2021 году компания Himalaya использовала технологию синтеза речи, чтобы позволить покойному мастеру Шань Тяньфану «снова заговорить»; в 2018 году в документальном фильме «Инновационный Китай» искусственный интеллект использовался для восстановления голоса мастера дубляжа Ли И.

Так что, когда ты оставил след в мире, ты не можешь легко «раздеться и спрятать свои заслуги и славу».

Для знаменитостей, которым еще предстоит зарабатывать на жизнь, клонированные голоса могут стать «путью в небо». Если ИИ-модель Deepfake, меняющая лицо, позволяет знаменитостям «арендовать» свои лица, это может принести много денег, а голосовые модели сопоставимы.

У Sonantic, «восстанавливающего» голос Килмера, другое дело: создание звуковых моделей для актеров с нормальными голосами.

▲ Изображение взято: the Verge

Платформа сначала предоставляет сценарии настройки, актеры записывают выполнение этих сценариев, а затем вводят записанный звук в речевой движок и используют движок для обучения модели ИИ. В конце концов, когда синтетический звук коммерциализируется, актеры могут получать долю прибыли, лежа, не делая этого самостоятельно и не беспокоясь о том, что потеряют дееспособность.

В мае 2021 года американская компания Veritone, занимающаяся технологиями искусственного интеллекта, также запустила аналогичную платформу Marvel.AI . Компания считает, что «для спортсменов, актеров и влиятельных лиц голос является огромным преимуществом для их личного бренда».

▲ Изображение предоставлено Veritone.

Но лень неизбежна: если знаменитости не хотят рекламировать себя, почему потребители должны за них платить? Veritone рекомендует создавать отраслевые стандарты, например заранее информировать слушателей о том, что это синтетическая речь, то есть «кто-то готов бороться, а кто-то готов страдать».

Благодаря технологиям и платформам клонирование знаменитостей и арендованные голоса могут стать отраслевой цепочкой, что также является проявлением технологии, преодолевающей физические и пространственно-временные ограничения.

Далеко ли будущее для всех, у кого есть «заместитель голоса»?

Конечно, в клонировании голоса нет ничего нового, но оно по-прежнему требует все более реального и простого процесса, и это далеко не конец.

Голосовые клоны становятся все более и более популярными в углах, которые мы видим или не видим, а не просто игра для нескольких людей, таких как знаменитости, звезды и т. д.

В 2017 году канадский стартап Lyrebird, занимающийся искусственным интеллектом, разработал технологию синтеза речи, утверждая, что их алгоритм может клонировать чей-либо голос с помощью 1-минутного образца звука.

▲ Лирохвост.

1 минута – удивительное число. Adobe Project VoCo в то время требовал не менее 20 минут аудио-образца.

В примере, приведенном Lyrebird, Хиллари, Клинтон и Трамп разговаривали и смеялись вместе, желая Lyrebird светлого будущего вместе. Их голоса и интонации все же несколько отличаются от реальных людей, а механическое чутье тяжеловато, но этого достаточно, чтобы у людей заблестели глаза.

Lyrebird говорит, что создание голосовых отпечатков требует значительных вычислительных мощностей, но как только это будет сделано, произношение речи станет простым, создавая тысячу предложений менее чем за полсекунды.

Это как пророчество: переступи порог реальности и машин, и тогда все будет гладко.

В дополнение к тому, что требуется меньше образцов аудио, клонирование голоса уже встроено в творческие инструменты, которые у вас под рукой.

▲Описание.

Descript, американская компания по редактированию аудио и видео, разработала функцию редактирования подкаста «Overdu», которая может клонировать голос создателя, а создатель может вводить слова, необходимые для создания нового звука с исходным голосом, что удобно для быстрого изменение подкастов.

Но и он далек от совершенства. Репортер из The Verge обнаружил, что, с одной стороны, для обучения ИИ нужно предварительно записать много аудио, с другой — в сгенерированном аудио отсутствуют эмоции и ритм, но он звучит как он сам. что странно и необъяснимо знакомо.

В то время как стартапы появляются повсюду, крупные технологические компании накопили немало.

На конференции Amazon re:MARS в июне главный научный сотрудник Amazon Рохит Прасад заявил, что Amazon разрабатывает технологию, которая позволит ее умному помощнику Alexa имитировать чей-либо голос менее чем за минуту .

▲ Изображение взято с сайта techcrunch.

К кому, конечно, относятся умершие родственники. Amazon также провел связанную демонстрацию: ребенок сказал Алексе послушать сказку на ночь «Волшебник страны Оз», и звук, исходящий из динамика, был не обычным механическим звуком, а голосом покойной бабушки.

Amazon не раскрывает более подробной информации о новых функциях Alexa, но основная технология существует уже несколько лет.

Можно предвидеть, что, хотя голосовые клоны не могут по-настоящему заменить человеческие голоса, они будут широко использоваться, например, в аудиокнигах, голосовых помощниках, видеоиграх и т. д.

Sonantic однажды сказал : «То, что CGI (компьютерное изображение) делает для зрения, то же, что Sonantic делает для звука.» У каждого есть свой «голосовой двойник», и он может быть под рукой.

С другой стороны медали, мы с осторожностью относимся к «голосовым двойникам».

▲ Изображение взято с сайта Face2Face.

Ведь политическая ложь и порнография Deepfake вызвали массу негативных последствий, поэтому нетрудно представить, для чего будет использоваться голосовая модель. Если не остановить, у нас будет будущее, в котором фотографии могут быть подделаны, а аудиозаписи ненадежны.

Несколько месяцев назад Microsoft выпустила новые правила этики ИИ, которые будут строго ограничивать круг лиц, которые могут создавать синтетические голоса, способы их использования, а также накладывать на искусственные голоса «водяной знак», предотвращающий злоупотребления.

Respeecher, посвященный "Звездным войнам", однажды выпустил короткометражный фильм "1969" , в котором президент объявил о масштабной катастрофе на Луне. Звучит очень "по-настоящему", но все фейк.

Клип завершается напоминанием: «В этом проекте используется ряд технологий, включая замену видеодиалогов, системы озвучивания и более традиционное редактирование видео, чтобы показать, как может выглядеть дезинформация. Пожалуйста, проверьте свои источники».

Таким образом, Respeecher не пытается доказать, что новостями и историей можно манипулировать.

Наоборот, они хотят, чтобы люди знали о существовании и полезности технологий, а также о их ограничениях и вредоносности. Теперь, когда колесо покатили вперед и увидели больше, его можно лучше регулировать и использовать.

Ли Ruoqiuhuang, чтобы изгнать зло. Рабочий адрес электронной почты: [email protected]

#Добро пожаловать на официальную учетную запись Айфанер в WeChat: Айфанер (WeChat: ifanr), в ближайшее время вам будет представлен более интересный контент.

Love Faner | Исходная ссылка · Просмотреть комментарии · Sina Weibo