Выяснилось, что на этой неделе OpenAI выпустила важную функцию агента, а Byte объявила о запуске плана AGI. Это может быть самый захватывающий год для ИИ.

23 января, 2025 Дядя Влад

Версия «Jarvis» для ChatGPT действительно скоро появится.

В декабре прошлого года генеральный директор OpenAI Сэм Альтман опубликовал интересный опрос. Среди технологических прорывов, которых пользователи сети больше всего ждут в 2025 году, первое место в списке занимает AGI, за ним следуют интеллектуальные агенты. Теперь это ожидание, похоже, частично сбывается.

Теперь, как сообщает зарубежное издание The Information со ссылкой на людей, знакомых с ситуацией, OpenAI на этой неделе готовится запустить новую функцию ChatGPT под названием «Оператор», которая сможет автоматически выполнять сложные задачи, такие как бронирование столиков в ресторане или планирование поездок в веб-браузере.

Функциональный дизайн оператора весьма удобен для пользователя. В частности, он предоставляет пользователям различные категории задач, такие как питание и мероприятия, доставка, покупки и путешествия, причем каждая категория снабжена соответствующими предложениями.

Когда пользователь вводит требования, в интерфейсе чата появляется небольшое окно браузера, отображающее процесс работы агента Оператора в режиме реального времени. При выполнении задачи он по мере необходимости запрашивает подробную информацию, например, конкретное время и количество людей, бронирующих столик в ресторане.

Стоит отметить, что пользователи могут не только вручную управлять этим интерфейсом, но также сохранять задачи и делиться ими с другими. Хотя Оператор в настоящее время не поддерживает операции с Gmail, пользователи могут входить на другие веб-сайты, и статус входа будет сохраняться в течение нескольких сеансов.

Однако ранее сообщалось, что содержимое скриншота, используемое Оператором при выполнении задач, может быть использовано злонамеренно, что приводит к «атакам с быстрым внедрением», что представляет серьезную угрозу безопасности.

Поэтому, даже если официально об этом будет объявлено на этой неделе, он может быть запущен не сразу, надеюсь, это не будет очередным «фьючерсом». OpenAI пока не ответила на запрос о комментариях.

Фактически, этот тип функции искусственного интеллекта, который может управлять пользовательским оборудованием и помогать в выполнении сложных операций, становится следующей тенденцией, за которой гонятся отечественные и зарубежные компании, занимающиеся искусственным интеллектом.

В октябре прошлого года Anthropic выпустила функцию работы с компьютером под названием «Использование компьютера».

Эта функция позволяет разработчикам направлять Клода через API, чтобы он мог управлять компьютером как человек, включая просмотр экрана, перемещение курсора, нажатие кнопок и ввод текста. Это знаменует собой важный шаг в способности ИИ моделировать взаимодействие человека и компьютера.

Всего два месяца спустя Google также запустил проект под названием Project Mariner, разработанный Google DeepMind и основанный на модели Gemini 2.0, который может выполнять задачи для пользователей в браузере Google Chrome.

Перемещая свои горизонты в Китай, Zhipu также выпустила веб-версию своей функции автономного вождения под названием AutoGLM-Web.

С помощью плагина Zhipu Qingyan пользователи могут позволить ИИ автоматически извлекать, генерировать контент и взаимодействовать на нескольких платформах, таких как Baidu, Weibo, Zhihu, Github и т. д., и даже поддерживать межсайтовые операции, предоставляя пользователям «полностью автоматический» онлайн-опыт.

В пятиуровневой дорожной карте AGI OpenAI агент находится на уровне L3, для которого характерно не только мышление, но и действия от имени пользователя и выполнение сложных задач.

Инсайдеры отрасли считают, что интеллектуальные агенты — единственный способ достичь общего искусственного интеллекта (AGI). Создавая интеллектуальных агентов, которые могут принимать решения и выполнять задачи автономно, мы можем постепенно достичь общего интеллекта, приближающегося к человеческому уровню.

В этой гонке за AGI китайские технологические компании также ускоряют разработку.

23 января APPSO стало известно, что команда крупных моделей Byte Beanbao создала внутреннюю долгосрочную исследовательскую группу AGI под кодовым названием «Seed Edge», чтобы побудить участников проекта исследовать долгосрочные, неопределенные и смелые темы исследований AGI.

Инсайдер, близкий к Byte, рассказал, что целью Seed Edge является исследование новых методов AGI. Кодовое название Seed — это название команды крупных моделей Beanbao, а Edge представляет собой наиболее передовые исследования AGI.

На данный момент Seed Edge изначально определила пять основных направлений исследований, в том числе:

Исследуйте границы способности рассуждать
Исследуйте границы восприятия
Изучите дизайн моделей нового поколения, объединяющий аппаратное и программное обеспечение.
Изучите парадигмы обучения ИИ нового поколения
Откройте для себя следующее направление масштабирования

Кроме того, согласно информации, полученной позже внутри компании Byte, основатель Byte Чжан Имин придает большое значение и подчеркивает увеличение инвестиций в исследования в области ИИ. Он не только лично изучает статьи и уделяет внимание техническим деталям, но также тесно общается с ведущими исследователями ИИ. призывает исследовательскую группу Byte в области искусственного интеллекта исследовать и исследовать основные темы.

В Сингапуре он даже сформировал специальную исследовательскую группу, в которую вошли Фэн Цзяши, бывший профессор Национального университета Сингапура и нынешний исследователь Byte, который с 2023 года является его техническим консультантом.

Среди китайских технологических гигантов Byte должна быть компанией с большим объемом ресурсов и самой быстрой в действиях, а также потенциально иметь потенциал стать «всем в искусственном интеллекте». В этой гонке за AGI победитель, возможно, еще не известен, но изменения потихоньку начались.

# Добро пожаловать на официальную общедоступную учетную запись WeChat Aifaner: Aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.

Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo