Отец спорной игровой технологии искусственного интеллекта от Nvidia хочет прояснить ситуацию

Персонаж, созданный искусственным интеллектом, разговаривает с другим в технической демонстрации Convai.
Конвай

Ранее в этом месяце я стал свидетелем цифрового чуда. На пресс-брифинге перед CES компания Nvidia продемонстрировала демо-версию своего микросервиса Ace — набора искусственного интеллекта, способного генерировать полностью озвученные персонажи с искусственным интеллектом. Я с трепетом наблюдал, как демоист разговаривал с внутриигровым NPC через микрофон, а цифровой персонаж отвечал в реальном времени. Это был настоящий научно-фантастический подвиг, но оставался один вопрос: как он научился это делать?

Nvidia дала неоднозначный ответ, заявив, что « простого ответа не существует». Это заявление вызвало бурю эмоций, поскольку пользователи социальных сетей предполагали худшее. Возникли предположения, что Ace обучался работе с контентом, на который у Nvidia не было прав. Позже Nvidia заявила, что использует только те данные, на использование которых ей разрешено , но напряженность по-прежнему оставалась высокой. Гора этических и художественных проблем вызвала у геймеров скептицизм.

Среди зрителей, наблюдавших за всем этим со стороны, был Пурненду Мукерджи. Инженер-программист не был еще одним лицом в толпе; он создал технологию искусственного интеллекта в центре дебатов, которые не начинал. Мукерджи — основатель Convai , компании по генеративному искусственному интеллекту, лежащей в основе Nvidia Ace. Вместо того, чтобы сидеть сложа руки и смотреть, как кто-то другой пытается объяснить его инструмент, он стремился внести ясность.

В интервью Digital Trends Мукерджи ответил на некоторые этические вопросы в обширном интервью об инструментах искусственного интеллекта, подобных его. Он высказал свои мысли обо всем: от опасений по поводу безработицы до опасений, что ИИ лишит человечество возможности искусства. По мнению Мукерджи, это далеко от истины. Основатель Convai видит оптимистичное будущее, в котором художники будут работать рука об руку с искусственным интеллектом, чтобы полностью реализовать свои творческие замыслы. Но когда дело доходит до горячей темы использования данных, его объяснение может вызвать больше вопросов, чем ответов.

Могут ли ИИ и художники сосуществовать?

В детстве Мукерджи всегда интересовался человеческим разумом и тем, как он работает. Он начал изучать искусственный интеллект еще в старшей школе, но его оттолкнули более жесткие системы, основанные на правилах того времени. Его интерес возник гораздо позже, в 2015 году, когда он изучал глубокое обучение в лаборатории в Индии. Переехав в США, поступив в аспирантуру и некоторое время поработав в Nvidia, Мукерджи в конце концов в апреле 2022 года отделился и основал Convai. В течение 10 месяцев он создавал компанию из своего кармана.

Мукерджи в душе геймер. Он вырос, играя в соревновательные игры, такие как Counter-Strike, в местном интернет-кафе. Именно там он начал представлять, как ИИ может улучшить игры, шутя по поводу безмозглых ботов шутера. Эта мысль теперь переросла в успешную технологическую инновацию, которая использует несколько процессов искусственного интеллекта для создания полностью озвученных NPC, которые могут реагировать на подсказки игроков в реальном времени. Его цель? Чтобы сделать игры более интересными. Основатель Convai Пурненду Мукерджи стоит на фоне горизонта.

«Возьмите Baldur’s Gate 3 или The Witcher », — говорит Мукерджи Digital Trends. «У них такие невероятные истории. С такой любовью и страстью написаны истории. Но вы, как игрок, не можете проникнуть в глубину этого, потому что есть лишь несколько сюжетных линий, которые вы можете изучить от NPC. Учитывая технологии, доступные сегодня, эти NPC могут жить собственной жизнью и взаимодействовать с вами, оставаясь при этом персонажем, и давать вам больше информации, если вы хотите глубже проникнуть в сознание дизайнера повествования».

Это заявление положило начало длинному интервью, в котором Мукерджи опровергает ряд взаимосвязанных опасений по поводу ИИ. Когда я спросил, станет ли Baldur's Gate 3 любимой игрой без ее преднамеренного написания, мы зашли в кроличью нору, раскрывая отношения между машинами и художниками. Он явно подошел к разговору подготовленным, как будто неделю изучал скептические посты в социальных сетях. Он быстро подчеркивает, что ИИ не заменит художников; они ему нужны.

«Я вижу только, что у нарративных дизайнеров больше требований, а не меньше», — объясняет он, рассказывая, как ИИ может создать больше рабочих мест для художников. «Сценаристы пишут не только для того, чтобы создать предысторию и повествование. Они также пишут для тестовых целей. Чтобы чувствовать себя уверенно, внедряя генеративного NPC на основе искусственного интеллекта в свою многомиллионную игру, вам нужен надежный набор тестов. Вам нужны сотни, если не тысячи двусторонних взаимодействий, в идеале исходящих от одного и того же автора повествования… Если вы попробуете нашу платформу, вам потребуется написать предысторию и загрузить кучу письменных документов от самого писателя, который пишет разум персонажа. По сути, это требует в десять раз больше написания, чем то, что делается сегодня».

Этот ход мыслей становится общей нитью в нашем разговоре. Мукерджи часто подчеркивает, что, по его мнению, инструменты генеративного искусственного интеллекта потребуют столько же, если не больше, художников для надлежащего обучения этой технологии. В какой-то момент он утверждает, что отличный ИИ сделает игры лучше, что, в свою очередь, приведет к увеличению продаж, убедив студии платить актерам озвучки больше, поскольку их работа по обучению этим инструментам очень важна для создания высококачественных игр с последующим развитием. уровень взаимодействия. Это оптимистичная перспектива, учитывая, что индустрия видеоигр в настоящее время переживает волну массовых увольнений , в результате которой тысячи людей остались без работы.

Мукерджи не закрывает глаза на эту реальность и не отрицает, что развитие генеративного искусственного интеллекта может повлиять на количество рабочих мест. Он описывает это как более естественный сдвиг, который не сильно отличается от всего, что мы видели в предыдущих технологических достижениях, подобных этому. Людям придется адаптироваться и научиться работать с ИИ, чтобы создавать свои работы.

Копаю дальше. Он обсуждает влияние ИИ с точки зрения того, как он повлияет на рабочие места, но как насчет художников, которые делают игры, потому что хотят создавать продуманный, созданный вручную контент? Конечно, это не так просто, как предложить художникам стать инженерами искусственного интеллекта. Мукерджи не верит, что это решение; скорее, он считает, что это скорее вопрос понимания того, где пересекаются искусство и технологии.

«ИИ — это то же самое, что Adobe Photoshop или Unreal Engine», — говорит Мукерджи. «Да, игры создавались до того, как появился Unreal Engine. Люди до сих пор изготавливают его вручную. Но разве вы не можете выразить себя с помощью лучшего искусства в Unreal Engine? Ты можешь. Возьмите любую программу для редактирования 3D-видео. У вас все еще есть это искусство, потому что вам все еще приходится прорабатывать мелкие детали с той же кропотливостью. Что касается вещей, созданных ИИ, все это правда. Аспект ручной работы все еще присутствует. У вас просто есть инструмент, обладающий большей выразительной силой, но вы по-прежнему являетесь его создателем, мастером и контролером».

Лестница данных

Понятно, что Мукерджи рассматривает ИИ как полезный инструмент, который может поддерживать художников, а не заменять их. Во время нашего разговора он возвращается к нескольким ключевым моментам о том, как ИИ нуждается в людях, тщательно решая общие проблемы. Однако все становится сложнее, когда упоминается одно слово, которого, похоже, боятся компании, занимающиеся искусственным интеллектом: данные. В то время как создатели утверждают, что модели ИИ, обученные на их творениях, являются воровством, некоторые ключевые разработчики ИИ утверждают, что они не могут обучать модели без массивного ввода данных, включая работы, защищенные авторским правом. Мукерджи выдвигает идею о том, что людям следует платить, когда их данные используются для обучения моделей ИИ.

«Я думаю, что должен быть способ, позволяющий людям, внесшим значительный вклад в наборы данных, получать хорошую компенсацию», — говорит он. «Будь то New York Times или Reddit, источник должен быть лицензирован. Это не простой способ, но, по моему мнению, именно к этому и приведет. И то, что сделано наиболее правильно, особенно когда мы используем это на коммерческом уровне, мы, конечно, выберем то».

Диаграмма технологии искусственного интеллекта Convai объясняет, как NPC взаимодействуют с окружающей средой.
Конвай

Говоря о собственном наборе данных Convai, Мукерджи утверждает, что компания использует только те данные, на которые у нее есть права. Он отмечает, что невозможно даже случайным образом получить те данные, которые нужны инструменту, учитывая, что он открывает новую территорию. Это логичное объяснение, хотя он быстро его опровергает.

«Мы используем базовые модели либо от OpenAI, либо лицензированные модели с открытым исходным кодом», — говорит он. «Они должны иметь коммерческую лицензию и быть получены с соблюдением этических норм. Мы очень осторожны в таких вещах. А когда дело доходит до преобразования текста в речь, мы очень близки к тому, чтобы тесно сотрудничать с актерами озвучивания. В нашем случае требуется больше актеров озвучки, а не меньше!»

Название OpenAI вызывает удивление. В настоящее время у компании проблемы с законом, поскольку The New York Times подала на нее в суд за «незаконное использование» ее текстов для обучения таких ботов, как ChatGPT . OpenAI не оспаривает обвинение. В ответ на запрос Специального комитета по коммуникациям и цифровым технологиям Палаты лордов Великобритании компания пишет: «Было бы невозможно обучить современные ведущие модели ИИ без использования материалов, защищенных авторским правом». может ли он гарантировать, что не будут использованы авторские материалы?

Мукерджи проводит тонкое различие: Convai не использует данные OpenAI, а только модели, обученные на них. Это своего рода лингвистическая лазейка. Мукерджи, судя по всему, считает, что, поскольку Convai не использует данные напрямую, компания по-прежнему остается на высоте, когда дело доходит до споров об авторских правах. Когда требуется внести ясность в то, чем использование моделей отличается от использования данных, на которые у него нет прав, ситуация становится еще более туманной.

«Непонятно, какая модель имеет какие данные», — уточняет он. «Мы не знаем, потому что для нас это неясно. Допустим, OpenAI предоставляет пять моделей, Nvidia — четыре модели, Meta — три модели. Мы используем тот вариант, который лучше всего подходит для нашего варианта использования. Мы не знаем, какая модель какой набор данных использует».

Аргумент Мукерджи, похоже, заключается в том, что Convai не несет ответственности за то, как другие модели обрабатывают данные. Он не имеет над этим контроля. Все, что он может сделать, — это убедиться, что использование собственных данных является этичным, и надеяться, что модели, на которых он строит, такие же. Но его более раннее заявление о том, что Convai «конечно» будет строить на самой этичной модели ИИ, на самом деле не подтверждается, учитывая, что в настоящее время он использует модель, которая находится в центре иска об авторских правах. Другая строка в этом новом контексте читается по-другому: «Мы очень близки к тому, чтобы очень тесно сотрудничать с актерами озвучивания». Чрезвычайно близкое значение означает, что Convai на самом деле еще не существует.

Подобные сложные разговоры могут объяснить, почему Nvidia вообще отказалась отвечать на мой вопрос об использовании данных. Правда в том, что все эти инструменты построены друг на друге. Ace использует Convai, который использует OpenAI. Есть лестница данных; чем дальше поднимаешься, тем труднее увидеть, кто внизу. Заявление Nvidia о том, что на вопрос об использовании данных «нет простого ответа», верно, но есть более честный ответ: она просто не знает. Nvidia, скорее всего, не придется отвечать на вопросы в суде, но если OpenAI проиграет битву, вся лестница может упасть.

Изменение на уровне цивилизации

Пока мы распутывали этот беспорядок, я поднял идею регулирования. Должно ли правительство вмешаться и установить некоторые ограничения в отношении этой технологии? Мукерджи считает, что кое-что необходимо, хотя и считает, что делать это нужно осторожно. Его беспокоит то, что слишком сильное регулирование может задушить инновации. И, в конце концов, он искренне верит, что любые риски, которые представляет собой ИИ, не сводят на нет потенциальную мощь этой технологии.

«Что такое ИИ сегодня? Сегодня ИИ похож на автомобиль», — говорит он. «Машины не опасны? Конечно, они есть! Вы можете полностью убить человека машиной, но мы все время ездим на машинах. Это очень рискованно, но в целом это положительный результат. Я рассматриваю ИИ как то же самое. Нам понадобятся правила о том, как можно и нельзя водить автомобиль. Если вы водите их незаконно, вы будете наказаны. В конечном итоге то же самое произойдет и с ИИ».

Это немного мрачное сравнение, но на протяжении всего нашего разговора у Мукерджи не было ничего, кроме оптимизма по поводу ИИ. Он искренне верит, что в долгосрочной перспективе это принесет пользу обществу, если компании будут помнить о том, что в центре их внимания должна быть человечность. Он надеется увидеть мир, в котором такие инструменты, как Nvidia Ace, будут поддерживать художников, а не отнимать у них рабочие места. Он не видит впереди нас конца света, когда все потеряют работу из-за машин, но он признает, что это заставит людей адаптироваться.

«Перемены произойдут, и перемены вредят людям», — говорит Мукерджи. «Это одно и то же изменение всякий раз, когда происходит новый вид технологического сдвига. Это изменение на уровне цивилизации. Будет создано множество новых рабочих мест и множество старых, более традиционных рабочих мест, которые будут пользоваться меньшим спросом. Скажем, когда мы перешли от конных повозок к автомобилям. Людям, у которых был конный бизнес, определенно нужно было найти что-то другое… Генеративный ИИ создаст совершенно новый набор возможностей. Это будет иметь значительный положительный эффект для человечества в целом, но потребует определенной смены работы».

В конце интервью Мукерджи поблагодарил меня за то, что я поговорил с ним и дал ему шанс внести ясность. Он отмечает, что многие СМИ, освещавшие анонс Nvidia Ace, даже не упомянули, что Convai разработала эту технологию под нее. Кажется, он слегка разочарован тем, что его компания не получает того признания, которого заслуживает. Я подчеркиваю иронию этого чувства, отмечая, что именно так сейчас чувствуют себя художники, наблюдая, как инструменты искусственного интеллекта очищают их работу и выдают ее обратно как свою собственную.

«Это отличный момент!» – говорит он с большим смехом и, возможно, с некоторой вновь обретенной ясностью.