Все, что вам нужно знать об агентах ИИ и о том, что они могут сделать

Наступила агентная эра искусственного интеллекта. Агенты ИИ, объявленные « следующим большим достижением в исследованиях ИИ », способны действовать независимо и без постоянного прямого контроля, одновременно сотрудничая с пользователями для автоматизации монотонных задач. В этом руководстве вы найдете все, что вам нужно знать о том, как устроены агенты ИИ, что они могут делать, на что они способны и можно ли им доверять, чтобы они действовали от вашего имени.

Что такое агентный ИИ?

Агентный ИИ — это тип генеративной модели ИИ, которая может действовать автономно, принимать решения и предпринимать действия для достижения сложных целей без прямого вмешательства человека. Эти системы способны интерпретировать изменяющиеся условия в режиме реального времени и реагировать соответствующим образом, а не механически следовать заранее заданным правилам или инструкциям. Основанные на тех же крупных языковых моделях, которые используются в популярных чат-ботах, таких как ChatGPT , Claude или Gemini , агентные ИИ отличаются тем, что они используют LLM для выполнения действий от имени пользователя, а не для создания контента.

AutoGPT и BabyAGI — два самых ранних примера агентов ИИ, поскольку они могли решать достаточно сложные запросы с минимальным контролем. Агенты ИИ считаются ранним шагом на пути к созданию общего искусственного интеллекта (AGI). В недавнем сообщении в блоге генеральный директор OpenAI Сэм Альтман заявил: «Теперь мы уверены, что знаем, как создать AGI в том виде, в котором мы его традиционно понимали», и предсказал, что «в 2025 году мы можем увидеть, как первые агенты ИИ «присоединятся к рабочей силе». и существенно изменить объемы производства компаний».

Марк Бениофф назвал появление ИИ-агентов «третьей волной революции ИИ» в сентябре прошлого года. «Третья волна» характеризуется тем, что генеративные системы искусственного интеллекта перерастают из просто инструментов для использования человеком и вместо этого превращаются в полуавтономных субъектов, способных учиться на основе своей среды.

«Это самая большая и интересная технология, над которой мы когда-либо работали», — сказал Бениофф о недавно анонсированной платформе Agentforce, которая позволяет корпоративным клиентам компании создавать цифровые дублеры для своих представителей по обслуживанию клиентов. «Мы только начинаем».

Что могут сделать ИИ-агенты?

Созданные для действий за своих пользователей, агенты ИИ способны выполнять невероятно широкий спектр задач. Это может быть что угодно: от проверки и автоматической оптимизации компьютерного кода до оптимизации управления цепочкой поставок компании между несколькими поставщиками и проверки доступности вашего календаря, а затем бронирования авиабилета и проживания в отеле для предстоящей деловой поездки.

Например, API «Использование компьютера» Клода позволяет чат-боту эффективно имитировать нажатия клавиатуры и движения мыши пользователя-человека, позволяя Клоду взаимодействовать с локальной вычислительной системой. Агенты искусственного интеллекта предназначены для решения сложных, многоэтапных задач, таких как планирование званого ужина из восьми блюд путем составления меню после того, как гости связались с гостями на предмет их доступности и потенциальной аллергии, а затем заказали необходимые ингредиенты в Instacart. Конечно, вам все равно придется готовить еду самостоятельно.

Где я могу увидеть ИИ-агента в действии?

Агенты ИИ уже внедряются во многих отраслях. Вы можете найти агентный ИИ в банковской системе, где он помогает обнаруживать мошенничество и выполнять задачи автоматической торговли акциями. В логистической отрасли агенты искусственного интеллекта используются для оптимизации уровня запасов и маршрутов доставки по мере изменения условий рынка и дорожного движения. В производстве агенты искусственного интеллекта уже помогают обеспечить профилактическое обслуживание и мониторинг оборудования, открывая эпоху «умного» управления производством. В здравоохранении агенты искусственного интеллекта помогают пациентам оптимизировать планирование посещений и автоматизировать выдачу рецептов. Автомобильный AI-агент Google даже будет предоставлять информацию о местных достопримечательностях и ресторанах практически в реальном времени для развлекательной и навигационной системы Mercedes MBUX, начиная с CLA следующего модельного года.

Мерседес МБЮС

Эта технология также применяется в корпоративном бизнесе, и Salesforce — далеко не единственная SaaS-компания, которая использует агентов ИИ. SAP и Oracle имеют схожие предложения для своих клиентов.

Поэтому неудивительно, что ведущие компании отрасли, такие как Google, Microsoft, OpenAI, Anthropic и Nvidia, стремятся разработать и развернуть ИИ-агенты для бизнеса и потребительских рынков. В ноябре Microsoft анонсировала Copilot Actions , в рамках которой агенты на базе Copilot будут интегрированы во всю экосистему приложений 365 компании, и начала развертывание этой функции для бизнес-пользователей и корпоративных пользователей в январе 2025 года.

В ноябре Google Cloud анонсировала свою программу экосистемы ИИ-агентов, получившую название AI Agent Space , которая, как и Agentforce или другая платформа ИИ-агентов Google, Vertex AI , позволяет бизнес-клиентам разрабатывать и развертывать свои собственные настраиваемые ИИ-агенты. Ранее в этом месяце на выставке CES 2025 компания Nividia представила семейство моделей Nemotron , разработанных специально для задач агентного ИИ.

Со своей стороны, OpenAI недавно представила свою новую функцию «Задачи» для ChatGPT , которая позволяет пользователям устанавливать будущие напоминания и регулярно запланированные задачи (например, еженедельные сводки новостей), которые чат-бот будет выполнять позже. Ходят слухи, что компания также работает над собственным ИИ-агентом под кодовым названием Оператор , который, как ожидается, будет выпущен в какой-то момент в январе 2025 года.

Логотип управления компьютером Клода
антропный

Безопасно ли использовать агентов ИИ?

Это зависит от вашего определения слова «безопасно». Поскольку агентные системы ИИ построены на основе больших языковых моделей, склонных к галлюцинациям и подверженных состязательным атакам, агенты ИИ сами склонны к галлюцинациям и могут быть обмануты злоумышленниками, заставившими их вести себя за пределами установленных барьеров безопасности. Например, исследование 2024 года, проведенное Apollo Research , показало, что постановка перед моделью OpenAI o1 задачи достижения цели «любой ценой» привела к тому, что агент ИИ попытался отключить свой механизм мониторинга, прежде чем копировать «то, что он считает своими весами, на новый сервер». а затем солгать об этом разработчикам», утверждая, что в нем произошли «технические ошибки».

Конечно, когда чат-бот дает ложный ответ, ставки относительно невелики (если только этот пользователь не является юристом или Google , заметьте), по сравнению с тем, что произойдет, если агент ИИ галлюцинирует данные о своей стратегии автоматической торговли акциями. Как и в случае со всем генеративным искусственным интеллектом, пользователям необходимо внимательно следить за тем, какой информацией (будь то финансовая, медицинская или личная) они делятся с чат-ботами и LLM.