Я видел футуристический проект Google Project Astra, и он был потрясающим.
Если что-то из Google I/O 2024 действительно привлекло мое внимание, так это Google Project Astra. Короче говоря, Astra — это новый ИИ-помощник с возможностями речи, зрения, текста и памяти. Вы можете поговорить с ним, как если бы это был другой человек в комнате, попросить его описать вещи, которые он видит, и даже попросить его запомнить информацию об этих вещах.
Во время основного доклада I/O, анонсирующего Astra , произошел один из самых впечатляющих моментов, когда человек запускал Astra на телефоне и просил ее описать вещи в комнате. Когда человек спросил Астру, где его очки, Астра быстро указала, где они находятся в комнате, даже без подсказок о них ранее в видео.
Но действительно ли Проект Астра работает так в реальном мире? Мне удалось увидеть это в действии во время быстрой 10-минутной демонстрации на I/O, и знаете что? Я очень впечатлен.
«Хорошая фигурка!»
Google показал нам несколько демо-версий Astra: «Аллитерация», «Иллюстрация», «Рассказывание историй» и «Свободная форма». Все они сделали то, что и следовало ожидать, и все они были одинаково впечатляющими. В некотором смысле, в демо-версии Astra, которую Google показал во время своего выступления по вводу/выводу, ИИ работал на телефоне. В демонстрации, которую я видел (которую мне не разрешили фотографировать или снимать видео), Astra работала на ноутбуке и была подключена к камере и сенсорному дисплею.
В демо-версии «Аллитерации» члены команды Project Astra заставляли ее «смотреть» на случайные объекты (камера была направлена на демонстрационный стол). Он точно определял, на что смотрит — мягкую игрушку, игрушечное яблоко и игрушечный хот-дог — и говорил аллитерациями все время, пока описывал то, что видел. Все это было немного глупо, но Астра знала все, на что смотрела, и это вызвало у меня улыбку.
Еще один забавный момент произошел во время демонстрации Pictionary. Кто-то из команды Astra использовал подключенный сенсорный экран, чтобы нарисовать фигурку. Объясняя, что сначала она рисует фигурку, Астра – без подсказки – воскликнула: «Это хорошая фигурка!» с большим энтузиазмом.
Это был тонкий момент, но он действительно показал, насколько Astra отличается, скажем, от Google Assistant. Никому не нужно было спрашивать: «Эй, Астра, что ты думаешь об этой фигурке?» Он увидел фигурку, услышал, как о ней говорит гуглер, и предоставил обратную связь самостоятельно. Это было просто потрясающе. Оттуда член команды Астры поместил смайлик черепа на вытянутую руку фигурки. На вопрос, какую пьесу должен был изображать рисунок, Астра сразу угадала Гамлета .
У сторителлинга и свободной формы тоже были свои моменты. В демо-версии Storytelling Астре показали игрушечного краба и попросили рассказать о нем историю. Астра начала подробно рассказывать историю о крабе, идущем по пляжу. Затем на стол положили спиннер, и Астру попросили включить его в историю. Он сделал это, не пропуская ни секунды.
Как следует из названия, демо-версия Free Form позволила Astra сделать все, что от нее просили. Ему показали три чучела животных и назвали их имена. Затем кто-то попросил Астру вспомнить названия различных животных, и два из трех ответов были правильными. Как и мы с вами, Астра запоминает все, что видит и слышит. Google все еще выясняет, сколько Astra должна помнить и как долго она должна хранить эту информацию, и это важные детали, которые необходимо устранить. Но тот факт, что это вообще происходит, является не чем иным, как волшебством.
Слышать значит верить
Возможно, во время демонстрации меня больше всего поразило то, насколько естественно ощущалась Астра. Членам команды Astra никогда не приходилось говорить «Привет, Астра» или «ОК, Астра», чтобы привлечь ее внимание к голосовым командам. Как только Astra была запущена и заработала, она смогла постоянно слушать вопросы/команды/комментарии и отвечать на них, как если бы это был другой человек в комнате.
Качество ответов было столь же впечатляющим. Слушая Astra, я ни разу не почувствовал, что слышу, как со мной разговаривает виртуальный помощник. Интенсивность голоса и естественная манера речи Астры были действительно чем-то особенным. Если бы я закрыл глаза, я мог бы обмануть себя, думая, что слушаю кого-то еще в комнате со мной, а не компьютер.
Если мы когда-нибудь доберемся до того момента, когда ИИ будет чувствовать себя дружелюбным, полезным и представительным помощником , он должен чувствовать, что вы разговариваете с другом. Кажется, что Astra очень близка к этому, и это намного интереснее, чем драгоценные камни, токены или любой другой жаргон искусственного интеллекта, о котором Google потратил два часа во время своего выступления.
Действительно ли Астра — ИИ будущего?
Как следует из названия «Проект Астра», работа над Astra все еще находится в стадии разработки, и Google не готова выпустить ее в ближайшее время. Сможет ли Astra в конечном итоге заменить Google Assistant на моем телефоне Android? Нужен ли мне вообще телефон, если я смогу иметь просто пару умных очков со встроенной в них Astra? Возможно, что еще важнее, насколько мы близки к тому, чтобы Astra была готова к нормальному повседневному использованию?
Это очень важные вопросы, на которые Google еще предстоит ответить, и я думаю, пройдет некоторое время, прежде чем мы получим ответы на любой из них. Но после того, как я испытал Астру на себе и поразмыслил о времени, проведенном с ней, я не могу не испытывать восторга от ее потенциала.
Очень легко чувствовать себя плохо по поводу ИИ, и это справедливо. Когда Google посвятил часть основного доклада I/O хвастовствуя о создании изображений с помощью ИИ, использовании ИИ для создания фильмов или о том, что ИИ суммирует результаты поиска Google — что вполне может убить современный Интернет в том виде, в каком мы его знаем, — я не мог не бояться будущее, пронизанное искусственным интеллектом, к которому мы стремительно несемся. Но умный, дружелюбный, запоминающийся и простой в общении ИИ-помощник, который на самом деле напоминает персонаж из научно-фантастического фильма? Есть о чем поговорить.
Я не знаю, будет ли Астра когда-нибудь такой крутой и всеобъемлющей, как я мечтаю. Но на самом деле кажется, что такое будущее может быть, и я надеюсь, что именно к этому будущему искусственного интеллекта Google прилагает свои усилия.