GPT-4o играет «Черный миф о Вуконге»! ИИ «Ма Мен» может управлять Боссом со сверхчеловеческой вероятностью выигрыша.
Игра «Чёрный миф: Вуконг» — всего лишь один монстр?
Признаюсь, когда мой друг задал мне такой вопрос, я в тот момент сломал бдительность.
Мне потребовалось всего меньше полдня от осознания того, что Ян Цзянь должен быть схвачен, до смерти Тигрового Авангарда. Если мы хотим развеять «Черный миф», можем ли мы рассчитывать на ИИ?
Перекатывайтесь и уклоняйтесь, соблюдайте дистанцию и четко наблюдайте за движениями монстра.
Когда пришло время, человек судьбы внезапно взмахнул своей тяжелой палкой.
С помощью силы ИИ был выполнен набор шелковистых комбо, и босс был побежден без возможности дать отпор, не знаю, сколько геймеров плачут.
Исследовательская группа Alibaba недавно предложила структуру агента VARP. И эту «лошадь» ИИ сделали они.
Можно сказать, что это не плагин, но это лучше плагина.
GPT, столкнувшиеся с Великим Мудрецом, на самом деле были не хуже людей.
ИИ, сражающийся с Великим Мудрецом, на самом деле не так уж и сложен.
Традиционно игровой ИИ полагается на игровые API для получения информации об окружающей среде и данных о исполняемых действиях. Но проблема в том, что не каждая игра готова предоставить открытый API, а даже если он и предоставляется, некоторым API не хватает рук и ног, что затрудняет удовлетворение реальных потребностей.
Более того, традиционные методы всегда создают впечатление, будто чего-то не хватает, и не могут полностью имитировать реальный игровой опыт игроков-людей.
На основании этого исследовательская группа Alibaba предложила новую структуру агентов VARP (Vision Action Role-Playing).
После получения входных скриншотов игры структура агента VARP выполняет логический вывод с использованием набора VLM и, наконец, генерирует код в форме Python для управления игровым персонажем, включая комбинацию ряда атомарных команд, таких как легкая атака, уклонение, тяжелая атака. , и восстановления здоровья подождите.
VARP содержит три базы знаний: базу ситуаций, базу действий и базу руководства человека, а также две системы: систему планирования действий и систему траектории управления человеком.
Проще говоря, система планирования действий эквивалентна библиотекарю, ответственному за поиск наиболее подходящих материалов из библиотеки ситуаций и обновляемой библиотеки действий.
На основе входных игровых скриншотов система выбирает или генерирует действия, соответствующие текущей ситуации, а затем эти действия и ситуации сохраняются или обновляются в этих двух библиотеках.
Система траектории, управляемая человеком, использует наборы данных об операциях человека для повышения производительности VARP в сложных задачах, таких как задачи поиска пути и сложные боевые задачи.
В библиотеке действий «def new_func_a()» представляет новое действие, сгенерированное системой планирования действий, а «def new_func_h()» представляет новое действие, сгенерированное системой траектории, управляемой человеком. «def pre_func()» представляет собой предопределенное действие.
В упомянутой выше игре «Black Myth Wukong» исследовательская группа поставила 12 задач, 75% из которых были связаны с боем, и провела бенчмарк-тесты с использованием VLM, включая GPT-4o, Claude 3.5 Sonnet и Gemini 1.5 pro.
Результаты показывают, что VARP имеет процент побед до 90% в базовых задачах и битвах простой и средней сложности. Однако при решении сложных задач производительность VARP легко падает, и его общий уровень по-прежнему не так хорош, как у игроков-людей.
Кроме того, когда агент VARP обрабатывает решения в игре, он не может анализировать каждый игровой кадр (т. е. игровой экран) в реальном времени, поскольку он полагается на скорость вывода модели визуального языка (VLM).
Другими словами, он не может реагировать на все происходящее на экране почти мгновенно, как это может сделать игрок-человек. Вместо этого он может обрабатывать игровые кадры только каждые несколько секунд, выбирая некоторые важные кадры (ключевые кадры) для анализа и принятия решений.
Когда был запущен «Черный миф: Вуконг», его критиковали за отсутствие четкой карты и большое количество «воздушных стен». Поэтому без помощи исследователей ИИ был бы подобен обезглавленной мухе, которую невозможно найти. босс.
Генеративный ИИ зажег огонь перемен в мире, и до того, как он проник в общественное сознание, более интуитивная связь обычных людей с ИИ, возможно, возникла в основном из игр.
ИИ гораздо важнее в истории видеоигр, чем мы думали
Многие люди, возможно, не думали, что одной из первых игр, в которых появится поезд ИИ, станет классическая аркадная игра «Pac-Man».
Обязательным условием победы игрока является съедание всех бобов в лабиринте, а у, казалось бы, глупых красочных призраков разные алгоритмы преследования, и они будут преследовать игрока разными путями и способами.
Алгоритмические движения каждого призрака чрезвычайно просты и лишены какой-либо способности к обучению. Как только игрок поймет эти правила, сложность игры резко упадет.
«Metal Gear Solid», выпущенная в 1987 году, стала еще одной важной вехой в развитии игрового ИИ.
ИИ-персонажи в игре стали демонстрировать более сложные модели поведения, и впервые был введен механизм враждебного реагирования на игроков. В этой игре, если игрок обнаружен врагом, противник активирует систему сигнализации, вызовет подкрепление, изменит маршруты патрулирования и даже установит ловушки.
Далее, если кратко перечислить процесс разработки ИИ и игр в ряду знаковых событий, то он выглядит примерно следующим образом:
- В 1997 году IBM «Deep Blue» победила чемпиона мира среди людей в шахматном матче, что стало крупным прорывом в области искусственного интеллекта в шахматных играх.
- В 2004 году вышла Half-Life 2. ИИ-персонажи в игре смогли принимать более сложные решения и взаимодействия, улучшая погружение в игру.
- В 2011 году IBM «Watson» победил чемпиона среди людей в викторине «Jeopardy!», демонстрируя прогресс ИИ в обработке естественного языка и рассуждениях.
- В 2016 году AlphaGo победила Ли Седоля в игре Го, что стало крупным прорывом в области искусственного интеллекта в сложных стратегических играх.
- В 2018 году была выпущена Red Dead Redemption 2. Уровень взаимодействия между ИИ-персонажами игры и окружающей средой был значительно улучшен, что обеспечило очень реалистичный игровой процесс.
- В 2020 году NVIDIA запустила технологию DLSS, которая использует искусственный интеллект для ускорения рендеринга графики, повышения производительности игр и качества изображения.
Глядя на текущую игровую среду, игра по-прежнему ориентирована на общение, а ИИ действует как усилитель, усиливающий это общение в бесчисленное количество раз.
На выставке CES в этом году Nvidia использовала Avatar Cloud Engine (ACE), чтобы «оживить» игровых NPC, и стала популярной в отрасли.
В демо-версии под названием Kairos игроки могли взаимодействовать с Джином, владельцем магазина рамэн. Хотя Джин — всего лишь NPC, он отвечает на вопросы, как настоящий человек, с помощью генеративного ИИ.
Сочетание искусственного интеллекта и игр всегда было сочетанием любви и ненависти.
Возьмем, к примеру, соревновательные игры. Раньше метод заключался в простом жестком регулировании сложности, но теперь он заключается в имитации действий человека, чтобы сделать игровой процесс более реалистичным.
Сторонники полагают, что когда искусственный интеллект, имитирующий человека, становится противником или товарищем по команде, это, в свою очередь, может повысить соревновательный дух игры из-за отсутствия реальных игроков.
Это также является недостатком. Уровень удержания игроков был улучшен, но под контролем системы игроки не могут избежать вихря манипуляций со стороны ИИ.
На ранней стадии были смелые слова, на средней — ерунда, а на поздней — тишина.
Когда мы не спим всю ночь только для того, чтобы выиграть еще одну игру, трудно сказать, играем ли мы в игру или игра играет нами. Особенно когда вы понимаете, что ваши товарищи по команде могут быть искусственным интеллектом, чувство бессилия похоже на удар кулаком по хлопку.
Мое сердце было мягким и не сосредоточивалось.
Старый Пророк Хуан! Будут ли будущие игры создаваться с помощью ИИ?
Даже новичок в программировании может использовать ИИ для игр.
Несколько лет назад такое, вероятно, можно было представить только в мечтах, но появление генеративного искусственного интеллекта дало всему этому реальное пространство для реализации.
В меньшем масштабе это похоже на создание GPT и рассказывание историй. В большем масштабе это небольшая программная игра, созданная с помощью искусственного интеллекта. Хотя интерактивность не так уж интересна, она лучше, чем красивая и насыщенная графика.
Если пойти еще дальше, то в будущем даже игры уровня шедевров 3A можно будет создавать непосредственно посредством ИИ-рендеринга.
В прошлом году основатель Nvidia Дженсен Хуанг предсказал, что каждый пиксель в будущих играх будет генерироваться, а не отображаться. Когда об этом говорилось тогда, все еще могли колебаться, но сейчас все больше и больше результатов исследований обнаруживают возможность такой реализации.
Обычно создание окружения для небольшой игры может занять неделю, а для студийного проекта — больше, в зависимости от сложности дизайна.
В прошлом месяце Google DeepMind анонсировала свой первый игровой движок с искусственным интеллектом GameNGen.
Он может имитировать классическую игру-стрелялку «Doom» в реальном времени со скоростью более 20 кадров в секунду на одном чипе TPU. Он работает с использованием модели диффузии для прогнозирования каждого кадра в реальном времени. Это означает, что каждый момент в игре генерируется в реальном времени на основе сложного взаимодействия действий игрока и окружающей среды.
В то время старший научный сотрудник NVIDIA Джим Фан не мог не вздохнуть, что «Doom», который хакеры бешено запускали в разных местах, на самом деле был реализован в чистой диффузионной модели, и каждый пиксель генерировался.
Позже появляются более похожие результаты.
Не так давно Tencent также сделала большой шаг и запустила большую модель специально для ААА-игр с открытым миром — GameGen-O.
GameGen-O не прост: он может моделировать персонажей, динамическую среду и сложные действия в различных играх ААА-класса, таких как «Ведьмак 3», «Киберпанк 2077», «Кредо убийцы» и «Черный миф: Вуконг». Качество игровых сцен также очень высокое.
Чтобы создать набор данных, компания Tencent, которая потратила много денег, собрала более 32 000 игровых видеороликов, каждое видео длилось от нескольких минут до нескольких часов, а затем отобрала 15 000 доступных видео с помощью ручных данных. аннотация.
Эти тщательно подобранные видео разрезаются на сегменты посредством определения сцены, а затем строго сортируются и фильтруются на основе эстетики, анализа оптического потока и семантического содержания.
Electronic Arts, американский разработчик игр, недавно продемонстрировал индустрии светлое будущее искусственного интеллекта в разработке игр посредством видеоролика «От воображения к созданию».
В видео игроки могут использовать инструменты искусственного интеллекта для создания игровых сцен, персонажей и другого контента с помощью простых инструкций.
Генеральный директор Эндрю Уилсон заявил, что генеративный искусственный интеллект может улучшить более половины процессов разработки компании в будущем и, как ожидается, позволит спроектировать и создать более крупные и захватывающие игровые миры в течение трех-пяти лет.
ИИ может не только повысить эффективность разработки существующих игр, но и потенциально создать новый игровой опыт.
Возможно, вы скажете, что какие бы передовые технологии ни использовались в игре, в конечном итоге главное — веселье.
Но поскольку GTA 6 неоднократно откладывалась и не оставалось никаких следов, у нас также может возникнуть идея сделать это самостоятельно и иметь достаточно еды и одежды.
В конце концов, было бы здорово, если бы я мог лично создать «Город грехов» в будущем.
# Добро пожаловать на официальную общедоступную учетную запись WeChat Aifaner: Aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.
Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo