ИИ может многое, но пока не умеет создавать игры и даже играть в них.

12 апреля, 2025 Дядя Влад

По мере совершенствования инструментов искусственного интеллекта нас постоянно поощряют перекладывать на них все более и более сложные задачи. LLM могут писать для нас электронные письма, создавать презентации, разрабатывать приложения, создавать видеоролики, осуществлять поиск в Интернете, обобщать результаты и многое другое. Однако одна вещь, с которой они все еще действительно борются, — это видеоигры.

В этом году две крупнейшие компании в области искусственного интеллекта (Microsoft и Anthropic) попытались заставить свои модели создавать игры или играть в них, и результаты, вероятно, гораздо более ограничены, чем многие ожидают.

Это делает их идеальной демонстрацией того, где сейчас находится генеративный ИИ — короче говоря: он может делать гораздо больше, чем раньше, но не может делать все.

Microsoft создает Quake II

Создание видеоигр имеет те же проблемы, что и создание видео: движение странное и морфообразное, а ИИ начинает терять связь с «реальностью» через определенное время. Последняя попытка Microsoft, которую может опробовать каждый , — это сгенерированная искусственным интеллектом версия Quake II.

Я играл в нее несколько раз, и это действительно захватывающий опыт: странные, размытые враги появляются из ниоткуда, а окружающая среда меняется вокруг вас по мере вашего движения. Несколько раз, когда я входил в новую комнату, вход исчезал, когда я поворачивался к нему лицом, а когда я снова смотрел вперед, стены сдвигались.

Игра длится всего несколько минут, прежде чем она отключится и предложит вам начать новую игру — но если вам не повезет, она может перестать правильно реагировать на ваши действия еще до этого.

Однако это отличный эксперимент, и я думаю, что его будет полезно увидеть большему количеству людей. Он позволяет вам на собственном опыте убедиться в том, в чем хорош ИИ поколения и каковы его текущие ограничения. Каким бы впечатляющим ни было то, что мы вообще можем создавать интерактивные видеоигры, трудно представить, чтобы кто-то мог сыграть в эту техническую демо-версию и думать, что следующаяAssassin's Creed будет создана искусственным интеллектом.

Однако подобные мысли и предположения существуют, и во многом потому, что люди не могут не услышать об ИИ прямо сейчас. Даже если вас меньше всего волнует искусственный интеллект, его все равно будут бросать вам в лицо, куда бы вы ни пошли. Проблема в том, что информация, которую получает среднестатистический человек, почти полностью состоит из комментариев крупного технологического маркетинга и комментариев генеральных директоров, которые подхватываются новостными изданиями.

Это означает, что они слышат преувеличенные и противоречивые утверждения, подобные этим:

У него есть потенциал для решения некоторых крупнейших мировых проблем, таких как изменение климата, бедность и болезни. ( Билл Гейтс )

Вероятно, в 2025 году у нас в Meta, а также у других компаний, которые в основном над этим работают, будет ИИ, который сможет эффективно выполнять функции своего рода инженера среднего звена в вашей компании, который сможет писать код. ( Марк Цукерберг )

Эффективное использование искусственного интеллекта теперь является фундаментальным ожиданием каждого в Shopify. Сегодня это универсальный инструмент, и его значение будет только возрастать. Честно говоря, я не думаю, что возможно отказаться от обучения навыкам применения ИИ в своем ремесле. ( Тоби Лутке , генеральный директор Shopify)

Теперь мы уверены, что знаем, как создать AGI в традиционном его понимании. Мы полагаем, что в 2025 году мы сможем увидеть, как первые агенты ИИ «присоединятся к рабочей силе» и существенно изменят объемы производства компаний. ( Сэм Альтман , генеральный директор OpenAI)

ИИ более опасен, чем, скажем, неправильное проектирование или техническое обслуживание самолетов или плохое производство автомобилей, в том смысле, что у него есть потенциал — какой бы малой можно было считать эту вероятность, но она нетривиальна — у него есть потенциал разрушения цивилизации. ( Илон Маск )

Это все довольно экстремально, не так ли? Он одновременно нас спасет и уничтожит, это одновременно универсальный инструмент для профессионалов и инструмент, который заменит профессионалов — и, судя по всему, мы сможем получить ОИИ научно-фантастического уровня уже в этом году. Когда это все, что люди слышат, они начинают ожидать от этих инструментов удивительных вещей и верить, что все офисные работники проводят свои дни, разговаривая со своими компьютерами, как персонажи «Звездного пути».

Однако реальность выглядит не так. Реальность выглядит как триповый, размытый Quake II с непонятными для врагов формами. LLM на уровне ChatGPT действительно стали захватывающим прорывом в 2022 году и доставили массу удовольствия всем, с кем можно было поиграть, но для большинства применений, к которым нас сейчас подталкивают большие технологии, ИИ просто недостаточно способен. Уровни точности слишком низки, способности следовать инструкциям слишком низки, контекстные окна слишком малы, и их просто обучают интернет-ерунде, а не реальным знаниям.

Но создание видеоигры — довольно сложная задача: в конце концов, на создание таких вещей у целых команд людей уходят годы. Как насчет того, чтобы вместо этого поиграть в видеоигры?

Клод «играет» в Pokémon Red

Оказывается, люди и с этим экспериментируют. Новейшая модель Anthropic, Клод 3.7 Sonnet , играет в Pokémon Red на Twitch уже около двух месяцев, и он делает лучшую работу, которую когда-либо делал LLM, играя в покемонов. Однако есть одно небольшое предостережение: он все еще намного отстает от среднего 10-летнего человека.

Одна из проблем — скорость: Клоду приходится совершать тысячи действий в течение нескольких дней, чтобы, например, пройти через Виридианский лес.

Почему это занимает так много времени? Это не потому, что он не может понять, как стратегически выигрывать битвы с покемонами — на самом деле это то, в чем он лучше всего. С другой стороны, перемещаться по окружающей среде и избегать деревьев и зданий — не так уж и хорошо. Клода никогда не учили играть в покемонов, и ему нелегко понять пиксельную графику и то, что она собой представляет.

Пробираться через такие лабиринты, как гора Мун, ему особенно сложно, так как он изо всех сил пытается составить карту местности и не повторять свои шаги. Однажды он настолько застрял в углу, что пришел к выводу, что игра сломана, и подал официальный запрос на перезагрузку игры.

Эти ранние попытки также не обошлись без легкомысленных моментов.
Однажды Клод застрял в углу и, убежденный, что что-то сломалось, напечатал официальный запрос на перезагрузку игры. pic.twitter.com/5RIiCJdxCM
– Антропный (@AnthropicAI) 25 февраля 2025 г.

Он также не очень хорошо помнит, каковы его цели, что он уже пробовал или в каких местах уже был.

Для этого есть довольно простая причина: у LLM есть конечное «контекстное окно», которое действует как их память. Он может хранить ограниченное количество информации, и как только Клод достигает предела, он конденсирует то, что у него есть, чтобы освободить место для большего. Таким образом, часть информации типа «Посетил Виридиан-Сити, вошел в каждое здание и поговорил с каждым NPC» может быть сокращен до просто «Посетил Виридиан-Сити», что побудит Клода вернуться и проверить, есть ли еще чем заняться в городе.

Подводя итог: Клод не может понять, куда он идет, он врезается в стены, принимает случайные объекты за неигровых персонажей, забывает, где он был и что пытается сделать, и каждое принимаемое им решение требует абзацев и абзацев рассуждений. Это не критика — это оба захватывающие эксперименты, которые продвигают LLM настолько далеко, насколько это возможно.

Но, несмотря на всю шумиху вокруг ИИ, людям кажется важным увидеть подобные демонстрации и составить собственное мнение об ИИ. Некоторые деятели пытаются продвигать идею о том, что мы вот-вот достигнем пика — что через годы ИИ превзойдет даже самых умных людей — но я не думаю, что они искренни, они просто продавцы. Мы еще далеки от пика, все это только начинается.