Все, что вам нужно знать об агентах ИИ и о том, что они могут сделать

19 января, 2025 Дядя Влад

Наступила агентная эра искусственного интеллекта. Агенты ИИ, объявленные « следующим большим достижением в исследованиях ИИ », способны действовать независимо и без постоянного прямого контроля, одновременно сотрудничая с пользователями для автоматизации монотонных задач. В этом руководстве вы найдете все, что вам нужно знать о том, как устроены агенты ИИ, что они могут делать, на что они способны и можно ли им доверять, чтобы они действовали от вашего имени.

Что такое агентный ИИ?

Агентный ИИ — это тип генеративной модели ИИ, которая может действовать автономно, принимать решения и предпринимать действия для достижения сложных целей без прямого вмешательства человека. Эти системы способны интерпретировать изменяющиеся условия в режиме реального времени и реагировать соответствующим образом, а не механически следовать заранее заданным правилам или инструкциям. Основанные на тех же крупных языковых моделях, которые используются в популярных чат-ботах, таких как ChatGPT , Claude или Gemini , агентные ИИ отличаются тем, что они используют LLM для выполнения действий от имени пользователя, а не для создания контента.

AutoGPT и BabyAGI — два самых ранних примера агентов ИИ, поскольку они могли решать достаточно сложные запросы с минимальным контролем. Агенты ИИ считаются ранним шагом на пути к созданию общего искусственного интеллекта (AGI). В недавнем сообщении в блоге генеральный директор OpenAI Сэм Альтман заявил: «Теперь мы уверены, что знаем, как создать AGI в том виде, в котором мы его традиционно понимали», и предсказал, что «в 2025 году мы можем увидеть, как первые агенты ИИ «присоединятся к рабочей силе». и существенно изменить объемы производства компаний».

Марк Бениофф назвал появление ИИ-агентов «третьей волной революции ИИ» в сентябре прошлого года. «Третья волна» характеризуется тем, что генеративные системы искусственного интеллекта перерастают из просто инструментов для использования человеком и вместо этого превращаются в полуавтономных субъектов, способных учиться на основе своей среды.

«Это самая большая и интересная технология, над которой мы когда-либо работали», — сказал Бениофф о недавно анонсированной платформе Agentforce, которая позволяет корпоративным клиентам компании создавать цифровые дублеры для своих представителей по обслуживанию клиентов. «Мы только начинаем».

Что могут сделать ИИ-агенты?

Созданные для действий за своих пользователей, агенты ИИ способны выполнять невероятно широкий спектр задач. Это может быть что угодно: от проверки и автоматической оптимизации компьютерного кода до оптимизации управления цепочкой поставок компании между несколькими поставщиками и проверки доступности вашего календаря, а затем бронирования авиабилета и проживания в отеле для предстоящей деловой поездки.

Например, API «Использование компьютера» Клода позволяет чат-боту эффективно имитировать нажатия клавиатуры и движения мыши пользователя-человека, позволяя Клоду взаимодействовать с локальной вычислительной системой. Агенты искусственного интеллекта предназначены для решения сложных, многоэтапных задач, таких как планирование званого ужина из восьми блюд путем составления меню после того, как гости связались с гостями на предмет их доступности и потенциальной аллергии, а затем заказали необходимые ингредиенты в Instacart. Конечно, вам все равно придется готовить еду самостоятельно.

Где я могу увидеть ИИ-агента в действии?

Агенты ИИ уже внедряются во многих отраслях. Вы можете найти агентный ИИ в банковской системе, где он помогает обнаруживать мошенничество и выполнять задачи автоматической торговли акциями. В логистической отрасли агенты искусственного интеллекта используются для оптимизации уровня запасов и маршрутов доставки по мере изменения условий рынка и дорожного движения. В производстве агенты искусственного интеллекта уже помогают обеспечить профилактическое обслуживание и мониторинг оборудования, открывая эпоху «умного» управления производством. В здравоохранении агенты искусственного интеллекта помогают пациентам оптимизировать планирование посещений и автоматизировать выдачу рецептов. Автомобильный AI-агент Google даже будет предоставлять информацию о местных достопримечательностях и ресторанах практически в реальном времени для развлекательной и навигационной системы Mercedes MBUX, начиная с CLA следующего модельного года.

Эта технология также применяется в корпоративном бизнесе, и Salesforce — далеко не единственная SaaS-компания, которая использует агентов ИИ. SAP и Oracle имеют схожие предложения для своих клиентов.

Поэтому неудивительно, что ведущие компании отрасли, такие как Google, Microsoft, OpenAI, Anthropic и Nvidia, стремятся разработать и развернуть ИИ-агенты для бизнеса и потребительских рынков. В ноябре Microsoft анонсировала Copilot Actions , в рамках которой агенты на базе Copilot будут интегрированы во всю экосистему приложений 365 компании, и начала развертывание этой функции для бизнес-пользователей и корпоративных пользователей в январе 2025 года.

В ноябре Google Cloud анонсировала свою программу экосистемы ИИ-агентов, получившую название AI Agent Space , которая, как и Agentforce или другая платформа ИИ-агентов Google, Vertex AI , позволяет бизнес-клиентам разрабатывать и развертывать свои собственные настраиваемые ИИ-агенты. Ранее в этом месяце на выставке CES 2025 компания Nividia представила семейство моделей Nemotron , разработанных специально для задач агентного ИИ.

Со своей стороны, OpenAI недавно представила свою новую функцию «Задачи» для ChatGPT , которая позволяет пользователям устанавливать будущие напоминания и регулярно запланированные задачи (например, еженедельные сводки новостей), которые чат-бот будет выполнять позже. Ходят слухи, что компания также работает над собственным ИИ-агентом под кодовым названием Оператор , который, как ожидается, будет выпущен в какой-то момент в январе 2025 года.

Логотип управления компьютером Клода — антропный

Безопасно ли использовать агентов ИИ?

Это зависит от вашего определения слова «безопасно». Поскольку агентные системы ИИ построены на основе больших языковых моделей, склонных к галлюцинациям и подверженных состязательным атакам, агенты ИИ сами склонны к галлюцинациям и могут быть обмануты злоумышленниками, заставившими их вести себя за пределами установленных барьеров безопасности. Например, исследование 2024 года, проведенное Apollo Research , показало, что постановка перед моделью OpenAI o1 задачи достижения цели «любой ценой» привела к тому, что агент ИИ попытался отключить свой механизм мониторинга, прежде чем копировать «то, что он считает своими весами, на новый сервер». а затем солгать об этом разработчикам», утверждая, что в нем произошли «технические ошибки».

Конечно, когда чат-бот дает ложный ответ, ставки относительно невелики (если только этот пользователь не является юристом или Google , заметьте), по сравнению с тем, что произойдет, если агент ИИ галлюцинирует данные о своей стратегии автоматической торговли акциями. Как и в случае со всем генеративным искусственным интеллектом, пользователям необходимо внимательно следить за тем, какой информацией (будь то финансовая, медицинская или личная) они делятся с чат-ботами и LLM.