Бесплатная игра Square Enix с искусственным интеллектом не убедила меня в силе технологии

На конференции разработчиков игр в этом году ИИ попал в заголовки. Несколько разговоров были посвящены развивающейся технологии, и разработчики обсуждали, как ее можно интегрировать в игры. Это была спорная тема во время шоу, но одна презентация, похоже, поразила посетителей. Square Enix провела 30-минутную живую демонстрацию загадочной игры с ИИ, которая показала, как технология может быть силой добра, давая игрокам больше контроля над тем, что они говорят, и имея NPC, которые соответствующим образом реагируют на подсказки.

Месяц спустя Square бесплатно выпустила эту демоверсию. Если вы зайдете в Steam прямо сейчас, то сможете скачать The Portopia Serial Murder Case и попробовать сами. На самом деле, многие игроки на ПК уже сделали это… и реакция была не слишком приятной. На момент написания техническая демонстрация имеет рейтинг «Очень отрицательный» с более чем 250 отзывами пользователей. Хотя некоторые из них могут быть реакционными обзорными бомбами от недоброжелателей технологии, многие кажутся законными критическими замечаниями, призывающими к невероятно ограниченному опыту.

«За кулисами может скрываться какая-то интересная технология, но конечным пользователям она кажется просто языковым движком конца 90-х», — говорится в одном обзоре. «Он отвечает только на гиперспецифические запросы и не кажется даже наполовину таким гибким, как они притворяются».

Они не ошибаются. Образовательный проект — не совсем удачный первый взгляд на потенциальный союз игр и ИИ. Дело о серийном убийстве в Портопии — это странная техническая демонстрация, которая, кажется, делает проблемы, которые она призвана решить, намного хуже. Несмотря на это, я не готов полностью списывать усилия Square Enix на основе эксперимента, поскольку вижу некоторые области, в которых технология может быть полезна в долгосрочной перспективе.

Обработка неестественного языка

Дело Portopia Serial Murder Case представляет собой современный римейк старой японской визуальной новеллы, впервые выпущенной в 1983 году. Цель здесь кажется очевидной: показать, как далеко продвинулись технологии видеоигр, противопоставив ограничительную старую приключенческую игру новой версии, поддерживаемой ИИ. . В руководстве, прилагаемом к загрузке , Square Enix дает некоторый контекст относительно того, что проект пытается показать.

«Во время первоначального выпуска игры в большинстве приключенческих игр использовалась система «командного ввода», когда игрока просили ввести текст, чтобы определить действия своего персонажа», — говорится в нем. «Подобные бесплатные системы ввода текста позволили игрокам почувствовать большую свободу. Тем не менее, у них был один общий источник разочарования: игроки знали, какое действие они хотели выполнить, но не могли этого сделать, потому что не могли найти правильную формулировку».

Далее во введении объясняется, что эти ограничения сводились к обработке естественного языка (NLP), которая в то время была ограничена. Новый проект служит демонстрацией того, насколько он изменился за 40 лет, поскольку Square Enix демонстрирует улучшенный NLP, с которым он работает в настоящее время. К сожалению, техническая демонстрация в настоящее время не впечатляет так, как должна была.

Игрок разговаривает с NPC в деле о серийном убийстве в Портопии.

Когда я открываю игру, меня бросает в простую визуальную новеллу. Я детектив, расследующий различные места по всей Японии, пытающийся раскрыть убийство, находя улики и допрашивая подозреваемых. Мое предположение заключалось в том, что я смогу ввести что угодно в текстовое поле и получить соответствующий ответ. Я сразу понял, что это не так. Вместо того, чтобы работать как ChatGPT , создается впечатление, что я пытаюсь поддерживать разговор с Siri. Все, что игра считает случайным, вызывает у меня шаблонную фразу на тему «Давай не будем говорить об этом прямо сейчас». Вместо этого мне нужно выяснить довольно специфический набор команд, чтобы что-то произошло. Если я хочу спросить информацию у незнакомцев на оживленной улице, мне нужно написать «расспрашивать». Если я попытаюсь пойти не по сценарию, я не получу желаемого ответа. Я сталкиваюсь с похожей проблемой на допросах, когда забывание включить «the» в команду может привести к путанице в игре.

Через 30 минут я почти никуда не продвинулся. Ничто из того, что я печатал, не заканчивалось ответом, и я в основном повторял одни и те же несколько фраз снова и снова, чтобы продвигать историю. Я начал продвигать историю по мере того, как узнавал об известных шаблонах фраз, таких как «посмотри на…», но я стал сомневаться в том, что Square Enix действительно решила проблему, которую она намеревалась решить. Мое расследование казалось таким же неестественным и разочаровывающим, как классические текстовые приключенческие игры.

Часть путаницы, с которой я столкнулся, по-видимому, сводится к большому техническому упущению. Square Enix отметила, что на данный момент ей пришлось удалить инструмент генерации естественного языка из демоверсии, сославшись на текущий риск «неэтичных ответов». Именно этот аспект сделал демо такой впечатляющей демонстрацией на GDC, поэтому его отсутствие здесь немного сбивает с толку. Что именно видят здесь пользователи, чего еще не было в таких играх, как AI Dungeon много лет назад?

Преобразование речи в текст

Все стало бы немного интереснее, если бы я включил голосовые команды в главном меню. Одним нажатием кнопки я мог произносить подсказки в свой микрофон и видеть, как они мгновенно преобразовывались в текст и отвечал на них соответствующим образом. В этот момент тайна начала раскрываться немного более естественно, когда я скакал по городу, подбирая блестящие подсказки и звоня по телефонным номерам, читая их вслух. Несомненно, впечатляет четкое распознавание произносимых слов в игре, идущее дальше, чем недавняя интеграция Alexa в Dead Island 2 .

Тем не менее, эта часть демонстрации сама по себе разочаровывает. Некоторые имена искажались инструментом преобразования текста в речь, когда я пытался их произнести, заставляя меня повторять их снова и снова, пока компьютер не записывал их сразу. Это вернуло меня в те дни, когда я играл в Brain Age на своей Nintendo DS и изо всех сил пытался зарегистрировать слово «синий».

Хотя он позиционируется как образовательный инструмент и часть обучения работе с программным обеспечением, я не совсем уверен, что я должен вынести из дела о серийном убийстве в Портопии . Упрощенные языковые команды и повторяющиеся шаблонные ответы от NPC на самом деле не доказывают, как можно использовать модели обработки или понимания естественного языка Square Enix для улучшения такой игры. Непонятно даже, как здесь используется искусственный интеллект — это ясно из отзывов пользователей Steam, сбитых с толку о том, как успешно взаимодействовать с игрой.

Тем не менее, приятно видеть, что Square Enix настолько прозрачна в своих технических экспериментах и ​​дает любому возможность поиграть с ее незавершенными инструментами. Эта реализация далеко не впечатляет, но мне любопытно, что издатель пытается решить. Я хотел бы сыграть в загадочную игру, в которой я могу сказать в микрофон все, что захочу, и чтобы NPC не только понимали это, но и реагировали соответствующим образом (пока строки сценария оставляются людям-писателям). Это явно не то, что кто-либо испытывает здесь, но, надеюсь, это необходимый первый шаг к осуществлению этой мечты.