Большие модели «уменьшаются» до мобильных телефонов, настенные интеллектуальные запуски MiniCPM, высокопроизводительной маленькой стальной пушки

1 февраля, 2024 Дядя Влад

Большие модели открывают новую эру, и они должны быть созданы для искусственного интеллекта.

Ли Дахай, соучредитель и генеральный директор Face Wall Intelligence, однажды сказал то же самое. По его мнению, эпоха больших моделей требует использования искусственного интеллекта, а аппаратное обеспечение больших моделей, работающее на стороне устройства, является собственным оборудованием.

Сегодня днем компания Wall-facing Intelligence официально выпустила флагманскую большую модель MiniCPM с торцевой стороны 2B, обращенную к стене, и на поле битвы с торцевой большой моделью появится новый игрок.

Обладая малой и большой мощностью, маленькая стальная пушка 2B находится «на автомате».

Ранее мы сообщали, что Mistral AI, «европейская версия OpenAI», выпустила короткую и компактную небольшую модель Mistral-7B. Хотя ее размер всего 7B, ее производительность и энергопотребление получили высокую оценку.

MiniCPM, размер которого составляет всего 2B, превзошел Mistral-7B по средним баллам на китайском и английском языках во многих основных оценочных списках. MiniCPM обладает более широкими возможностями, и его результаты превзошли звездную модель Microsoft Phi-2 в таких тестах производительности, как CEval, CMMLU и MMLU.

По среднему баллу в английском списке MiniCPM значительно превзошёл модели такого же или даже большего масштаба и даже сравним с моделями масштаба 13B, 30B и 40B. В оценочном наборе MT-Bench, наиболее близком к человеческой оценке, MiniCPM может даже конкурировать с Claude 2, что делает его пушкой производительности 2B.

Итак, как интеллект, стоящий лицом к стене, достигает цели: использовать маленькие вещи для достижения больших целей?

Вычислительная мощность: эффективная инфраструктура на протяжении всего процесса, 10-кратное ускорение вывода, снижение затрат на 90 %;
Алгоритм: аэродинамическая труба модели, обращенной к стене, маленькая и большая, и обнаружено, что эффективные конфигурации обучения модели позволяют быстро сформировать возможности модели;
Данные: с точки зрения современной фабрики данных, она формирует версию модели с замкнутым контуром для быстрого перехода от управления данными к многомерной оценке;

MiniCPM также является хорошим игроком в базовых возможностях, таких как создание больших моделей. Ли Дахай, соучредитель и генеральный директор Face Wall Intelligence, на презентации представил, что MiniCPM не только точно знает высоту гор Хуаншань и Тай, вычисляет разницу, но даже может писать код для самостоятельной разработки и оптимизации.

Поскольку в 2024 году конкуренция за большие модели становится все более жесткой, добавление мультимодальных возможностей подталкивает искусственный интеллект в эпоху «синестезии». -модальность на мобильных телефонах.Он может точно идентифицировать опасных существ, таких как ядовитые грибы и ядовитые змеи в дикой природе.

Ли Дахай продемонстрировал эффект MiniCPM на практике на месте. Когда включен режим полета и задаются вопросы о мерах самоспасания в случае, если вы случайно съели ядовитые грибы или заблудились в дикой природе, ответы MiniCPM кажутся более практичными, чем пустые «клише». Если вы столкнулись с плохими условиями сигнала в дикой природе, эти рекомендации MiniCPM в автономном режиме могут вам очень помочь.

В технологической конкуренции с растущим масштабом стоимость является невидимой конкурентоспособностью больших моделей.Помимо высокой производительности, стоимость вывода MiniCPM составляет всего 1% от Mistral-Medium.

Будучи крупномасштабной моделью на стороне терминала, MiniCPM успешно работает с основными международными брендами мобильных телефонов и чипами процессоров терминалов. Даже старые мобильные телефоны могут работать нормально. Однако с точки зрения пропускной способности операция все еще работает, и фактическая возможно, потребуется улучшить производительность.

Основываясь на накопленных данных в области крупных моделей, Ли Дахай также официально объявил на пресс-конференции, что в дальнейшем будет открыт исходный код, «позволяя крупным моделям проникать в тысячи домов». Адрес открытого исходного кода (включая технический отчет) выглядит следующим образом:
MiniCPM GitHub: https://github.com/OpenBMB/MiniCPM
OmniLMM GitHub: https://github.com/OpenBMB/OmniLMM

В конце пресс-конференции Ли Дахай также продемонстрировал возможности мультимодального взаимодействия в реальном времени модели mniLMM-12B. Подобно предыдущей идее большой модели Google Gemini, демонстрирующей мультимодальные возможности, они также попросили MiniCPM сыграть в «угадайку» камня, ножниц, бумаги.Результаты показали, что плавность, точность и задержка все его ответы находились в пределах допустимого уровня.

Способность к логическому рассуждению также является важным моментом. После загрузки изображения без текстового описания он может точно определить значение изображения на основе мелких деталей, таких как одежда, солнцезащитные очки и трости-проводники, полностью демонстрируя свою всеобъемлющую способность «видеть и думать».

Интернет Агентов

«Если возможности агентов используются в конечных моделях, они могут лучше служить конкретным сценариям и создавать большую ценность. Я думаю, что эти два направления могут поддерживать друг друга и вызывать замечательные химические реакции».

Цзэн Гоян, технический директор Wall-Facing Intelligence, рассказал об отношениях между большой моделью на стороне терминала и Агентом. На этой пресс-конференции Ли Дахай также подтвердил стратегию двух двигателей: большая модель + агент. По его мнению, выпуск MiniCPM по-прежнему соответствует стратегии двух двигателей.

Фактически, когда крупные модели стремятся интегрировать в сценарии посадки, ключевым подходом становится AI Agent. Wall-Facing Intelligence — одна из первых компаний, предложивших концепцию агента. Чиновники разведки, стоящей лицом к стене, даже утверждали, что мир будущего будет миром агентов, и все будет агентами.

Представьте, что когда вы готовы приготовить кашу, вам нужно всего лишь положить ингредиенты в рисоварку, подождать немного, и из нее выйдет дымящаяся кастрюля с кашей. Во время этого процесса рисоварка использует встроенную технологию Agent. для автоматической регулировки температуры и нагрева. Приготовление можно завершить без ручного вмешательства.

На прошлогодней конференции Yunqi Ли Дахай сказал: «Большая модель + агент принесет новый виток великих технологических изменений».

Тогда он сравнил большие модели с двигателем автомобиля, который обеспечивает мощность автомобиля. Однако, чтобы построить полноценную машину, вам также понадобится рулевое управление, шасси и все остальное.

Точно так же он считает, что на основе движка больших моделей необходимо наложить ряд технологий верхнего уровня, таких как возможности памяти и возможность использования инструментов, чтобы расширить более широкие перспективы применения и воображение. AI-агент — это объект, обладающий этими техническими возможностями.

С момента своего создания Wallface Intelligence приступила к планированию технического маршрута и направления реализации «большой модели + агента» и последовательно запустила «тройку» ИИ-агентов — XAgent, AgentVerse и ChatDev.

Все эти три продукта основаны на больших моделях и представляют собой передовые инновации и результаты применения AI Agent. Они направлены на объединение больших моделей с реальной средой. Среди них XAgent — это крупная платформа приложений AI-агента, управляемая моделями, и AgentVerse — это универсальная платформа для агентов, а ChatDev — это платформа для совместной разработки нескольких агентов.

Ожидается, что в зависимости от направления реализации ToB AI Agent будет играть несколько ролей внутри предприятия и изменять операционные процессы и организационную структуру предприятия. Эти ИИ-агенты могут выполнять различные задачи, подобно традиционным сотрудникам предприятия, тем самым снижая затраты и повышая эффективность.

Для потребительских приложений (ToC) AI Agent может выступать в виде интеллектуального помощника, предоставляющего пользователям персонализированные и удобные сервисы. Эти интеллектуальные помощники могут понимать и прогнозировать потребности пользователей, а также предоставлять помощь и предложения в режиме реального времени, тем самым улучшая пользовательский опыт и качество жизни.

Так каким же должно быть будущее AI Agent?

Видение и концепция Wall-Facing Intelligence — это «Интернет агентов», который должен позволить агентам ИИ соединять все в мире и реализовать переход от «Всеобщего Интернета» к «Всеобщему интеллекту».

Эту концепцию предложил Лю Чжиюань, постоянный доцент кафедры компьютерных наук Университета Цинхуа и основатель Wall-Facing Intelligence, он также уверенно заявил в публичном выступлении:

В будущем все больше людей, устройств и объектов можно будет подключать через крупные интеллектуальные платформы, управляемые моделями, что будет способствовать превращению Интернета всего в интеллектуальный Интернет всего и вступлению в новую эру интеллектуального Интернета вещей (LOA) человека и компьютера. Мы ознаменуем второе появление искусственного интеллекта.

В воображении этого ведущего эксперта, десятилетиями работающего в компьютерной области, второе появление искусственного интеллекта заключается в том, чтобы связать отдельных агентов с их собственными сильными сторонами для формирования сложного группового интеллекта, демонстрируя тем самым более мощное эмерджентное поведение.

В недавнем онлайн-интервью Ли Дахая и Кевина Келли, автора книги «Из-под контроля», Кевин Келли также выразил аналогичные взгляды. Он считает, что сотрудничество между ИИ имеет огромный потенциал, и в будущем будет сформирована экосистема, состоящая из сотен или даже тысяч различных ИИ, высвобождающих удивительную мощь.

Фактически, роевой интеллект, как явление, обычно встречающееся в природе и обществе, относится к способности группы, состоящей из множества простых особей, демонстрировать высокий уровень разумного поведения. В природе это разумное поведение проявляется в различных формах, например, в коллективных действиях муравьиных колоний, пчелиных роев и рыбьих косяков.

Когда муравьи ищут источники пищи или возвращаются в свои гнезда, они выделяют феромоны, которые помогают своим собратьям-муравьям найти кратчайший путь. При миграции косяки рыб формируют защитную схему плавания, тесно координируя свои позиции и действия, что позволяет всей группе эффективно избегать хищников и экономить энергию.

Ли Дахай также позаимствовал знаменитые высказывания из «Задачи трех тел», чтобы установить новогодний флаг – чтобы заставить AGI развиваться «быстрее», перекликаясь с видением Стенной разведывательной компании «уметь все сущее».

Красота жизни – это одержимость чем-то. Жизнь слишком коротка, не делайте легкомысленных поступков.

# Добро пожаловать на официальную общедоступную учетную запись WeChat Aifaner: Aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.

Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo