Google внедряет сверхспособности искусственного интеллекта в камеру вашего смартфона, и это выглядит смешно
Кажется, что ИИ-помощники устарели, или Google хочет, чтобы вы в это верили, поскольку мы живем в эпоху ИИ-агентов — и Google I/O 2024 быстро доказал это. Поприветствуйте Project Astra, генеративный ИИ-агент с видением. , текстовые и речевые возможности, а также некоторые возможности памяти и пространственного восприятия.
Думайте об этом как о глазах вашего телефона, но которые придают смысл окружающему миру. Наведите его на математическое уравнение, и он решит его. Направить камеру на кошку? Астра подскажет подходящее имя для кошачьего мяу-стера. Спросите его, где вы оставили наушники, и если датчик камеры это заметил, он скажет что-то вроде «Вы оставили его на диване».
Astra может понимать код, появляющийся на экране, идентифицировать объекты и объяснять, что они делают, идентифицировать здания и многое другое. Думайте об этом как о Google Lens, но для всего мира он может поместиться в поле зрения объектива камеры и иметь смысл.
В отличие от Google Assistant, вам не нужно запрашивать его. Просто наведите камеру на что-нибудь, произнесите аудиозапрос, и Астра ответит на естественном языке. Google сообщает, что Project Astra будет запущен через приложение Gemini позднее в этом году.
Всевидящий ИИ-агент?
Если Project Astra звучит знакомо, то это потому, что OpenAI продемонстрировала аналогичную функцию для ChatGPT , основанную на новой модели GPT-4o, всего день назад. Инструмент OpenAI в настоящее время находится на стадии красной команды для тестирования безопасности и будет выпускаться поэтапно, начиная с подписчиков ChatGPT Plus.
Google не сообщает, будет ли у Astra ценник. Но, учитывая почти спонтанность ответов, тип обработки визуальных данных и генеративные возможности, необходимые для предоставления осмысленного ответа, маловероятно, что Astra будет служить бесплатным бонусом из-за требований к вычислительным ресурсам.
Лучшим примером может служить подписка Google One AI Premium, которая уже скрывает некоторые новые возможности Gemini за платным доступом. Но на данный момент Astra выглядит как самая удивительная инновация в области искусственного интеллекта, которую Google продемонстрировал с тех пор, как несколько лет назад он поразил мир возможностями Duplex.