Начните работу с Button Space: стажером с искусственным интеллектом, который будет активно «подстраиваться» под вас.

Агент (интеллектуальный) и MCP (Model Context Protocol) — самые горячие тенденции в сфере ИИ в первой половине 2025 года.

Несколько дней назад продукт Byte Agent «Button Space» также официально начал внутреннее тестирование.

Среди множества продуктов-агентов Kouzi Space впервые предоставляет «режим планирования» — возможность агента, которая может шаг за шагом сотрудничать с пользователями, приостанавливать и подтверждать ключевые этапы, а также позволяет пользователям корректировать маршруты в режиме реального времени.

Команда Button официально полагает, что сотрудничество между людьми и агентами создаст более плавную рабочую модель.

Внутреннее бета-приложение Button Space

Официальный сайт

Ай Фанер также сразу же получил код приглашения на место для кнопок и опробовал несколько немного творческих задач.

Мы выступили в роли директора по связям с общественностью проекта «Здравствуйте, учитель, меня зовут одноклассник Хе» и попросили стажеров проанализировать недавние события общественного мнения, составить отчет об общественном мнении, дополнительно предоставить контрмеры и предложения, а затем написать ответное заявление:

Подсказка: я директор по связям с общественностью команды «Здравствуйте, учитель, меня зовут мистер Хе». Недавно наш бренд столкнулся с инцидентом, связанным с общественным мнением. Пожалуйста, соберите информацию, оцените влияние инцидента, поймите содержание жалоб пользователей сети, а также проанализируйте и извлеките ошибки, которые, по мнению пользователей сети, мы допустили, и направления для улучшения. Вы можете искать информацию, используя веб-сайты и интернет-платформы, которые считаете подходящими. Затем для меня был составлен отчет об общественном мнении, в котором подробно отражены сроки, контекст развития, реакции и жалобы пользователей сети, а также стратегии реагирования на этот инцидент с общественным мнением. Отчет должен быть немного более подробным, особенно для того, чтобы представить различные точки зрения на стратегии реагирования. Кроме того, мне также нужно, чтобы вы подготовили ответное заявление, основанное на вашей стратегии реагирования, которое было бы искренним, не уклонялось от ответственности и содержало практические меры по улучшению. Вам необходимо создать отчет об общественном мнении в виде веб-страницы и PDF-файла, а ответное заявление — в обычном документе.

Эта задача кажется относительно простой. Основными действиями являются поиск и генерация текста, но это также требует от составителя отчета профессиональных знаний в области анализа общественного мнения и умения дорабатывать и форматировать сообщения в СМИ и сообщения в социальных сетях в серьезные отчеты. Это возможности агентского продукта с точки зрения больших моделей.

В дополнение к возможностям крупномасштабной модели эта задача также позволяет Button Space «проверить свои возможности» с точки зрения использования браузера/компьютера, кода, MCP и других возможностей.

и стандарты работы. Это часть анализа данных отчета общественного мнения, созданного впервые:

Это стратегия выживания, написанная стажером по искусственному интеллекту:

Будучи «первым проектом», этот документ соответствует стандартам с точки зрения уровня детализации отчета общественного мнения, логической структуры, профессионализма анализа и формата ответного заявления. Конкретные детали не обязательно применимы к реальному сценарию, но, по крайней мере, полученные результаты дают рекомендации, которые можно использовать для следующих шагов.

Стоит отметить, что, поскольку при вводе задачи упоминалось понятие «временная шкала», сгенерированные результаты, похоже, больше ориентированы на события предварительного заказа, такие как «плагиат проектов с открытым исходным кодом» и «клавиатура, которая может печатать сама по себе». И это не цель нашей миссии.

Очевидно, что согласование целей между коллегами по-прежнему важно на рабочем месте.

Мы можем просто использовать модель планирования Button Space, чтобы соответствовать этому стажеру ИИ:

После выравнивания не только цель контента является правильной, но и часть данных отчета об общественном мнении напрямую отображает сравнение количества поклонников, «трех последовательных показателей» и уровня завершения. Объяснительная сила и репрезентативность данных были улучшены:

Вы также можете перейти по этой ссылке , чтобы просмотреть полный повтор миссии.

Остановитесь и замедлите ход: партнеры по работе с ИИ должны научиться «выравниваться»

Судя по результатам тестирования Aifaner, самая большая разница между Button Space и традиционными продуктами интеллектуального агента/MCP заключается в этом режиме планирования, который может «остановиться и замедлиться».

Проще говоря, после того, как MCP получает задачу, он автоматически разбивает задачу на указанный план, а затем начинает выполнять задачу и, наконец, генерирует результаты. Но неизбежно, что «один неверный шаг приведет к неправильному шагу».

После того, как пространство кнопок включает режим планирования, оно может «останавливаться» и согласовываться с пользователями на ключевых узлах при выполнении сложных задач, позволяя пользователям исправлять ошибки и отклонения в реальном времени и оптимизировать логику выполнения.

Этот способ особенно подойдет начинающим пользователям, не имеющим возможности подсказать инженерные решения. Отправляя задачу впервые, просто кратко и лаконично изложите свои намерения.

Существует два условия запуска «Режима планирования»:

  • Одна из них — агент не может выполнить текущий шаг по разным причинам (например, он не может найти нужную информацию или не может точно понять намерение пользователя), либо уверенность в результате недостаточно высока — он остановится сам. Когда задача приостанавливается, в пространстве кнопок появляется уведомление, напоминающее пользователю о необходимости выполнить следующий шаг.

  • Во-вторых, пользователь может активно нажимать «кнопку паузы»: во время пошагового выполнения задачи агентом пошаговые результаты будут записываться в документ .md, который используется для построения базы знаний и помощи на следующем этапе выполнения. То же самое относится и к пространству кнопок. Если пользователи обнаруживают ошибки или отклонения в пошаговом документе, они могут сами приостановить исправление.

Такой совместный рабочий процесс агента позволяет агенту избежать отклонения от поставленной цели по различным причинам, таким как «неправильный анализ в начале» и галлюцинации, вызванные мышлением и постоянным выводом токенов.

Это можно понять так: если традиционная крупная модель/агент — это «автономное вождение», то пространство кнопок фактически позволяет пользователям играть «вторым пилотом» (вторым пилотом) ИИ. Как только пользователь заметит отклонение, он может немедленно затормозить и вручную скорректировать рулевое колесо.

Если использовать аналогию со стажером, Button Space — это стажер с искусственным интеллектом, который может «задавать вопросы в любое время, если вы чего-то не понимаете», а затем гибко корректировать направление работы на основе обратной связи в реальном времени.

На самом деле существует не один стажер по ИИ, но их может быть много:

  • Для рутинных задач, таких как обработка текста, построение диаграмм, простой анализ и т. д., Button Space сам по себе является обычным помощником. Его можно рассматривать как «маленького шестиугольного воина» с относительно широкими возможностями, но без акцента на специализированных областях;
  • Что касается задач в углубленных профессиональных областях, таких как исследования пользователей, исследования финансовой отрасли и т. д., требуются агенты-эксперты в предметной области.

Будь то универсальный или экспертный агент, его можно запланировать за одну остановку с помощью «Пробела кнопок».

Мало того, если существующих экспертных агентов недостаточно, разработчики также могут в полной мере использовать платформу разработки Kouzi (разработка агентов с нуля), Kouzi Compass (инструмент настройки агентов DevOps) и Eino (среда разработки агентов на языке Go), одновременно запущенные командой Kouzi для быстрой разработки и вывода на рынок собственных экспертных агентов.

У стажера по искусственному интеллекту наконец-то появился мозг

Конечно, в большинстве тестов Айфаньера Button Space смог точнее понять намерение и выдать качественный результат.

Тарифная война в последнее время была очень оживленной, поэтому мы также позволили ему решить эту сложную задачу: отслеживание уровней тарифов США на основные категории импорта в Китай.

Подсказка: Тарифная политика правительства США в последнее время меняется день ото дня. Мне нужно, чтобы вы создали онлайн-форму, которую можно будет обновлять в режиме реального времени, чтобы отслеживать изменения тарифов с 1 апреля. Вам необходимо отслеживать налоговые ставки на основные товары, экспортируемые из Китая в США, такие как бытовое электронное оборудование, шприцы, игрушки и т. д. Проверьте конкретные товары самостоятельно. Если вы не можете узнать, остановитесь и спросите меня в любое время. Обратите внимание, что некоторые категории тарифов были добавлены недавно, но некоторые категории тарифов существовали до 2025 года. Вам необходимо показать, как в таблице складываются различные категории тарифов. Если вы не понимаете, не стесняйтесь спрашивать меня.

Давайте сначала посмотрим на сгенерированные результаты:

Ай Фанер наблюдал за мыслительным процессом и обнаружил, что он полностью понимает сложные понятия, такие как «тарифы», и это может быть связано с используемой в его основе большой моделью.

За последний месяц или около того мы фактически использовали множество инструментов агентов/MCP, особенно некоторые продукты с глубокими исследовательскими возможностями, которые утверждают, что способны выполнять сложные задачи от имени пользователей. При выполнении одной и той же задачи им приходится выполнять десятки раундов поиска. Кажется, что они очень стараются понять, что говорит пользователь, создавая у людей ощущение применения слишком большой силы, но результаты не идеальны.

В Button Space было всего шесть раундов размышлений, из которых только четыре фактически использовались для поиска и понимания типов тарифов (остальные два раунда были планированием и распределением в начале задачи и созданием веб-страницы в конце задачи).

Полученные результаты по-прежнему очень убедительны с визуальной точки зрения.

И видно, что этот стажер по искусственному интеллекту не просто указал, куда нужно ударить, но в некоторой степени задействовал свой мозг и провел некоторый анализ данных, который не входил в первоначальные требования задачи, но который, по его мнению, был бы полезен. Например, график повышения и снижения тарифов в этом году указан:

Был проведен анализ воздействия в краткосрочной, среднесрочной и долгосрочной перспективе:

Существует также метод структурированного представления, сочетающий диаграммы и текст:

И что меня больше всего поражает: он отражает различия и суперпозицию различных статей тарифов, таких как базовый уровень, «день свободы» и «эквивалентность» 25 лет назад.

Но ошибки также очень легко обнаружить, например, налоговые ставки по большинству категорий рассчитываются совершенно неправильно. Что касается причины ошибки, насколько я понимаю, стажер использовал чистый метод поиска новостей и легко был предвзятым из-за неправильной и несвоевременной информации вместо того, чтобы напрямую получать данные с веб-сайта правительства США.

Конечно, даже настоящий стажер, вероятно, сделал бы это. Только специалисты по импорту и экспорту и эксперты по тарифам знают, как получить наиболее своевременные и точные значения. Эта задача требует профессиональных знаний и опыта, далеко выходящих за рамки уровня стажера.

Но это не означает, что Button Space не может решить эту проблему: после включения «режима планирования» мы можем дать ему четкое определение источника данных при исправлении ошибок и позволить ему активно вызывать Python/MySQL или другие возможности кодирования для сканирования наиболее точных и реальных данных; или мы также можем вручную загрузить отчеты с неоптимизированным форматом и содержимым из авторитетных источников, а затем использовать официально поддерживаемый плагин расширения многомерных таблиц для создания базы знаний, необходимой для выполнения задачи.

Kouzi Space поддерживает вызов внешних инструментов MCP (официальная версия) и в настоящее время поддерживает более десяти внутренних и внешних расширений MCP ByteDance (таких как Moji Weather, Amap и т. д.). Таким образом, теоретически профессиональные поставщики баз данных в сфере импорта и экспорта также могут разрабатывать свои собственные расширения MCP и интегрировать их в пространство кнопок. Каким бы сложным и бессмысленным ни было развитие тарифов, стажеров это не может беспокоить.

Посмотреть повтор тарифного задания онлайн

Вот еще одна небольшая задача чистого кода, которая может быть немного излишней. Пусть пространство кнопок создаст принтер hello world и изменит требования на полпути.

Руководителям, которые не умеют программировать, не нужно беспокоиться о том, что их сотрудники сбегут: вы также можете попросить стажеров по искусственному интеллекту научить вас программировать.

Просмотр повтора задачи по написанию кода онлайн

Все предыдущие тесты основывались на «универсальном стажере», активированном по умолчанию в пространстве кнопок.

На главной странице также есть вход в «Эксперт-Агент». В настоящее время на стадии бета-тестирования открыты два доступных эксперта, а именно эксперт по исследованию пользователей (официально разработанный Kouzi) и помощник по наблюдению Huatai A-share (совместная разработка Huatai Securities и Kouzi).

В качестве примера возьмем A-share Observation Assistant. Его входной интерфейс немного отличается от интерфейса обычного стажера. Он позволяет пользователям настраивать ежедневные отчеты на основе выбранных ими акций и секторов. Он также поддерживает функции индивидуальных консультаций, превращая агента в аналитика ценных бумаг, которым может пользоваться исключительно пользователь.

Эти два экспертных агента также являются прямым отражением возможностей расширения пространства кнопок MCP. Он может объединить большую модель Button и возможности большой модели сторонних поставщиков услуг для достижения «сотрудничества» между серверами MCP.

Когда ИИ превращается из «инструмента» в «партнера»: люди и машины не разделяют труд, а развиваются симбиотически

Потолок мощности традиционных продуктов и инструментов для крупных моделей определяет, что их основная цель — выполнять транзакционную работу и заменять повторяющийся труд (например: генерация текста, сортировка и форматирование данных, базовое планирование и т. д.); и, как упоминалось ранее, агенты/MCP объединяют в себе способность глубокого мышления, разборки и планирования задач, а также пошаговое автоматическое выполнение задач, но этот «полностью автоматизированный» подход все еще имеет недостатки.

По сравнению с первыми двумя, Kouzi Space предлагает новую идею: в среде, где весь процесс контролируется в режиме реального времени реальными пользователями, ИИ может быть глубоко вовлечен в полный рабочий процесс решения проблем и реализовать органичную совместную работу человека и интеллектуальных агентов.

«Стажер по искусственному интеллекту» — действительно интересная аналогия. Работая с вами, он учится у вас, постепенно знакомится с вашими рабочими привычками и требованиями, а также осваивает вашу целевую мотивацию и логику мышления. Каждый превосходный наставник надеется, что его стажеры смогут вырасти в штатных сотрудников, отвечающих за свои дела, а такого роста можно достичь только постепенно за счет разумных методов работы и постоянного достижения результатов.

Инструменты постоянно внедряются, и то, как мы работаем, становится крутым благодаря ИИ. Но, в конечном счете, эффективное и стабильное достижение результатов — это правильный путь.

С другой стороны, когда возможности и послушание инструментов искусственного интеллекта одновременно улучшаются, каждый работник на рабочем месте может в любое время вызвать своего собственного стажера по искусственному интеллекту, и все более сложные и трудные задачи могут быть легко решены. Куда пойдут сами рабочие?

Возможно, это одновременно тревожный сигнал и возможность, напоминающая нам о том, что мы должны направить нашу энергию и время на следующие два аспекта: во-первых, улучшение нашей способности контролировать инструменты ИИ; во-вторых, сосредоточить внимание на творческой и мыслительной работе, которую никогда не сможет заменить ИИ.

Ведь на рабочем месте не хватает не умения что-то делать, а оригинального мышления.

Конечно, для реализации этого будущего потребуется время. Возможно, вы захотите подать заявку на получение квалификации Kouzi Space уже сейчас, и пусть ваш стажер по искусственному интеллекту или партнер по цифровым рабочим местам сначала попробует это сделать.

Возможно, то, как вы работаете, и качество вашей жизни на рабочем месте претерпят огромные изменения.

# Добро пожаловать на официальную общедоступную учетную запись WeChat aifaner: aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.

Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo