Этот китайский продукт искусственного интеллекта появился на экранах в одночасье! Весь интернет просит пригласительные коды, что может стать самым большим сюрпризом после DeepSeek
Почти в то же время, когда вчера вечером Apple выпустила новые продукты, весь технологический круг был сметен продуктом под названием Manus.
По сравнению с такими агентами, как Claude's Computer Use, которые также могут выполнять многозадачность или помогать вам заказывать еду на вынос и бронировать отель, Manus может охватывать больше областей и достигать более высокого качества исполнения.
Manus установил новый рекорд в авторитетном тесте производительности GAIA, и его производительность намного превосходит аналогичные продукты OpenAI.
Имя Манус происходит от латинского Mens et Manus, что означает ум и рука, то есть использование и рук, и мозга. Это также девиз Массачусетского технологического института, который призывает студентов превращать свои идеи в практические результаты.
За несколько часов до выхода «Мануса» основатель Сяо Хун опубликовал на мгновенной платформе пост «Кульминация приближается» и поделился отрывком из книги Шекспира:
Трудно сейчас определить, что рождение Мануса является важной вехой для AGI, но весьма вероятно, что оно действительно подведет эру Агентов (разумных) к «кульминационному моменту».
Ссылка на приложение Manus Experience :
https://manus.im/invitation
Проверка резюме, выбор недвижимости и торговля акциями: действительно ли Манус хорошо «работает»?
Чиновники утверждают, что Манус — это не просто диалоговый инструмент искусственного интеллекта, который может только общаться, а по-настоящему автономный агент.
В то время как другие ИИ могут перестать генерировать идеи, Манус способен думать и действовать самостоятельно. Чиновники рассматривают это как новую парадигму сотрудничества человека и машины и могут даже стать окном в AGI.
Одновременно с «Манусом» есть и четырехминутная демоверсия. В этих случаях Манус завершал весь процесс от планирования до реализации полностью автономно, демонстрируя возможности реального агента, а не простые функции помощника.
Например, начните с обычной задачи отдела кадров — проверки резюме.
Демонстрация началась с большого трюка. Чиновник отправил Манусу сжатый файл, содержащий 10 резюме. Манус мог работать так же эффективно, как профессиональный рекрутер.
Сначала он разархивирует файл, затем просматривает каждое резюме страницу за страницей и записывает важную информацию. Manus также может обрабатывать файлы асинхронно, что означает, что вы можете выключить компьютер в любое время, и он уведомит вас о завершении задачи.
Конечно, вы также можете дать ему новые инструкции в любой момент этого процесса.
Далее приступайте к загрузке 5 резюме в Манус. Внимательно прочитав все 15 резюме, Манус дал рекомендации по ранжированию и предоставил для справки профили кандидатов и критерии оценки.
Это еще не все, мы также можем попросить Мануса создать электронную таблицу.
Благодаря знаниям и возможностям памяти Мануса, в следующий раз, когда будет выполняться подобная задача, он предоставит результаты непосредственно в форме электронной таблицы.
В другом демонстрационном случае Манусу предлагается проверить безопасное сообщество в Нью-Йорке с низким уровнем преступности на основе доходов семьи и требований к школьному образованию детей, а также приобрести недвижимость, соответствующую критериям.
Столкнувшись с такими сложными задачами, Манус методично разбивает их на несколько этапов и создает подробные списки дел.
- Ищите и читайте статьи о самых безопасных районах Нью-Йорка.
- Исследуйте средние школы Нью-Йорка.
- Напишите программу на Python для расчета бюджета.
- В зависимости от вашего бюджета просмотрите подходящие объявления на сайтах недвижимости.
- Интегрируйте всю информацию, пишите подробные отчеты и систематизируйте соответствующие материалы.
Переходя к третьему случаю, Манус превратился в профессионального биржевого аналитика.
Пусть он проанализирует корреляцию между ценами акций Nvidia, Marvell Technology и TSMC за последние три года. Манус может получить доступ к авторитетным источникам данных через API. После проверки данных начинается написание кода для анализа и визуализации данных.
После завершения анализа и визуализации данных Манус также может создать веб-сайт на основе данных. С разрешения пользователя веб-сайт может быть развернут в Интернете и предоставлена ссылка для общего доступа.
Официальные лица заявили, что представленный выше контент — это лишь верхушка айсберга способностей Мануса.
В тесте GAIA, который используется для оценки способности ИИ-помощников общего назначения решать реальные проблемы, Манус достиг производительности SOTA на всех трех уровнях сложности.
Чтобы обеспечить воспроизводимость результатов, Manus оценивался с использованием той же конфигурации, что и его официальная версия.
Помимо бенчмаркинга, Манус решает реальные проблемы на таких платформах, как Upwork и Fiverr, и доказал свое мастерство в соревнованиях Kaggle.
Все это неотделимо от превосходного сообщества открытого исходного кода, поэтому чиновник также надеется внести свой вклад в сообщество.
Manus использует систему мультиподписей (мультиподписей), основанную на нескольких независимых моделях. Позже в этом году чиновники планируют открыть исходный код некоторых из этих моделей, особенно логической части Мануса.
Китайская команда, два хитовых продукта, миллионы пользователей
Так кто же стоит за этим потрясающим отрасль продуктом?
Сообщается, что Сяо Хун, основатель Manus AI, в 2015 году окончил факультет разработки программного обеспечения Хуачжунского университета науки и технологий.
После окончания университета он продолжил заниматься бизнесом. В 2015 году он основал Nightingale Technology, запустил «Yiban Assistant» и «Weiban Assistant», обслуживал более 2 миллионов B-конечных пользователей и получил инвестиции от Tencent, ZhenFund и других.
Есть также более характерный продукт искусственного интеллекта, который остался у Сяо Хун — Моника.
Это ИИ-помощник, известный как All-in-One, изначально запущенный как плагин для браузера.
Интегрируя основные крупные модели (такие как Claude 3.5, DeepSeek и т. д.), Monica предоставляет такие функции, как чат, перевод, обработка копирайтинга и т. д. Пользователи могут создавать собственные инструменты на естественном языке и делиться ими на Tool Plaza.
На заре своего существования Monica также сосредоточилась на зарубежных рынках: база пользователей превысила один миллион и стала ведущим продуктом в области плагинов для искусственного интеллекта.
В феврале этого года китайская версия Monica (monica.cn) начала внутреннее тестирование и в настоящее время доступна для отечественных пользователей бесплатно. Эта версия основана на моделях DeepSeek R1 и V3, обладает глубокими способностями к рассуждению и мышлению, а также поддерживает функции памяти и поиск в Интернете в реальном времени.
Техническая философия Мануса: меньше структуры, больше интеллекта
Техническая философия, которой придерживается Манус, также несколько отличается от общепринятой. Это «меньше структуры, больше интеллекта».
Они считают, что, когда данные высокого качества, модель достаточно мощная, архитектура достаточно гибкая, а проектирование достаточно надежное, такие возможности, как использование компьютеров, глубокие исследования и агенты кодирования, появятся естественным образом, не будучи спроектированными как конкретные функции продукта.
Как один из представителей стремления к чудесам, GPT-4-Turbo имеет средний балл в публичном рейтинге GAIA менее 7%, а даже решения, использующие сложные мультиагентные системы, достигают только 40%. Можно сказать, что игру Мануса «намного опережают».
В недавнем интервью Чжан Сяоцзюню основатель Сяо Хун также заранее рассказал о неизданном на тот момент продукте Agent Manus.
«Похоже, что это действительно должен быть чат-бот. Это соответствует воображению каждого, но в то же время очень сложно со стороны приложения. В отличие от Моники, просто использовать разные модели довольно сложно».
Сяо Хун также разделил текущие приложения ИИ на две категории: одна предназначена для заполнения пробелов в основных прикладных продуктах, а другая — для предоставления уникальных решений для конкретных сценариев. Например, Perplexity (обеспечивающая функцию сетевого поиска) и Monica (форма плагина для браузера) попадают в эту категорию и заполняют пробелы, оставленные существующими продуктами.
Такие приложения, как новые сцены на основе моделей, в основном появляются в области изображений и видео и напрямую обусловлены развитием модельных технологий. Такие продукты, как Pika и Runway, используют возможности моделей для создания новых сценариев применения.
Некоторые пользователи высмеивали Мануса, называя его «совершенной оболочкой потрясающе». На самом деле Сяо Хун не стесняется сообщать пользователям, что в его продуктах используются модели других людей. Еще в прошлом году он сравнил Монику с бытовой электроникой и разместил логотип ChatGPT на официальном сайте.
Наступила новая эра взаимодействия человека и компьютера, но не спешите возлагать Мануса на алтарь AGI.
APPSO сделала прогноз в начале 2024 года: крупные модели станут новой операционной системой для смартфонов, а естественный пользовательский интерфейс (NUI) постепенно заменит существующий графический пользовательский интерфейс (GUI).
Важным входом для реализации этого нового взаимодействия является Агент.
Мы видели подобные случаи при выпуске многих мобильных телефонов в прошлом году. На пресс-конференции Vivo были показаны «Phone GPT», который может заказывать еду с помощью искусственного интеллекта, Xiaoyi и Intent Framework от Huawei Hongmeng, умное тело YOYO от Honor и AutoGLM от Zhipu. Ядро одно и то же:
Пусть ИИ имитирует человеческий цикл «Планируй-Делай-Проверяй-Действуй» (Планируй-Делай-Проверяй-Действуй), чтобы управлять оборудованием, как люди.
Генеральный директор Zhipu AI Чжан Пэн ранее упоминал, что текущие возможности агента больше похожи на добавление интеллектуального уровня планирования между пользователями и приложениями для связи всех приложений и даже всех устройств.
Это можно рассматривать как прототип большой модели общей операционной системы LLM-OS, которая окажет большое влияние на форму взаимодействия человека с компьютером. Член-основатель OpenAI и гуру технологий искусственного интеллекта Андрей Карпати также много раз говорил об операционной системе с большой языковой моделью (LLM OS).
Он считает, что большая модель — это в какой-то степени новый компьютер и операционная система, которая может соединять различное программное и аппаратное обеспечение, а также периферийные устройства, состоящие из всей модальной информации, и выполнять различные задачи посредством вызовов функций.
В традиционной операционной системе вокруг ЦП необходимо построить множество периферийных устройств, таких как мышь и клавиатура, дисковое хранилище и кэш-память.
В LLM OS сама большая модель является центральным процессором. Периферийные устройства ввода-вывода больше не представляют собой мышь и клавиатуру, поскольку LLM может быть совместим с большим количеством режимов ввода и вывода данных. В то же время внешние инструменты, вызываемые большими моделями, также будут обновлены с традиционного программного обеспечения до инструментов интеллектуального агента.
Среди них межприложенная работа является очень важным звеном, а это означает, что агент может выполнять более сложные автономные и согласованные операции, а также может двигаться к реальной коммерциализации. Что касается возможности объединения услуг, предоставляемых различными интернет-компаниями, то это может стать самым большим препятствием для реализации такого рода взаимодействия в будущем.
Однако многие ИИ-помощники теперь реализуют прокси-операции, фактически вызывая специальные возможности телефона для управления щелчками по экрану.
Появление Мануса означает, что ИИ в режиме Агента может понимать требования и работать независимо, пока задача не будет выполнена. Это, несомненно, большой шаг в области взаимодействия человека и компьютера, и он позволяет нам увидеть потенциал превращения ИИ из инструмента в партнера.
Но пока еще слишком рано говорить, что мы одной ногой стоим на пороге AGI. Сам Сяо Хун также упомянул, что ранний Агент был больше похож на «функциональную машину» и требовал постоянных доработок и улучшений. Текущему агенту по-прежнему необходимо полагаться на улучшение возможностей модели и более полную поддержку виртуальной среды, чтобы действительно быть способным выполнять различные долгосрочные задачи.
По сравнению с интеллектуальным вождением это, вероятно, эквивалентно переходу с уровня L2 на уровень L3 с системой помощи при вождении. Хотя Манус показал хорошие результаты в тесте GAIA, это не означает, что он обладает всеми характеристиками обычного искусственного интеллекта. Путь к AGI все еще долог и требует решения множества проблем, таких как возможности моделей, автономное обучение и обобщение задач.
Но благодаря прорыву Мануса в области автономности и универсальности, есть еще одна звезда, которая освещает нас в великом путешествии к AGI.
# Добро пожаловать на официальную общедоступную учетную запись WeChat Aifaner: Aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.
Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo