Нам нужно больше специалистов по применению ИИ, которые не создают большие модели
Всё в ИИ, к 2024 году этот узел станет чуть ли не главной темой технологических интернет-компаний.
Кажется, что весь мир впал в AI Fomo (ИИ-фобия упускать из виду).Технологические компании начали масштабную гонку вооружений, чтобы догнать OpenAI.Обычные люди обеспокоены тем, что их заменит ИИ, поэтому ИИ за 199 юаней Курс приобрел большое количество поклонников.
В «Битве сотен моделей», бушующей в Китае, Kingsoft Office считается аутсайдером. Эта компания, обладающая крупнейшей долей внутреннего рынка офисного программного обеспечения и обильным денежным потоком, не инвестировала в конкуренцию крупным моделям, однако она первой в Китае запустила интеллектуального офисного помощника WPS AI на основе больших языковых моделей.
На вчерашней конференции по продуктивности Kingsoft Office генеральный директор Чжан Цинъюань еще раз подчеркнул, что Kingsoft Office является аппликатором больших моделей и в настоящее время подключен практически ко всем основным крупным моделям в Китае.
Таким образом, Kingsoft Office, который представляет собой All in AI, переживает третий важный узел после перехода от эпохи ПК к эпохе мобильного Интернета за последние 36 лет.Первые два узла повлияли на тенденцию китайского рынка офисного программного обеспечения. .
В 1980-х годах Цю Боцзюнь заперся в номере 501 отеля Caiwuwei в Шэньчжэне на 14 месяцев, используя компьютер 386 для набора 120 000 строк ассемблерного кода. В 1988 году родился WPS 1.0.
В 2002 году сотрудник Kingsoft №6 Лэй Цзюнь возглавил более 100 инженеров, которые потратили три года на переписывание более 5 миллионов строк кода WPS и запустили WPS 2005, полностью совместимую с Microsoft Office.
▲ Лэй Цзюнь (слева) и Цю Боцзюнь
Теперь появление крупных моделей начало менять способы использования и разработки программных приложений.Чжан Цинъюань считает, что даже слово UI (пользовательский интерфейс) исчезнет в будущем. Kingsoft также приостановила деятельность всех предприятий, не связанных с искусственным интеллектом, с прошлого года и приступила к комплексной трансформации.
В начале года Ифанер предсказал в ifanRank, что мы движемся к «эре больших приложений», универсализации и индустриализации.
Область больших моделей постепенно становится насыщенной, и нам, очевидно, нужно больше компаний, которые сосредоточатся на внедрении продуктов искусственного интеллекта, чтобы превратить возможности больших моделей в производительность и креативность отрасли.
Миф о продуктивности ИИ
Оглядываясь назад на популярные инструменты искусственного интеллекта прошлого года, будь то Microsoft Copilot или Sora, которые начали появляться на экранах во время Весеннего фестиваля, часто можно увидеть два часто встречающихся слова, которые появляются вместе с ними — подрывная деятельность и замена.
Хотя эти инструменты искусственного интеллекта предназначены для повышения производительности, по сравнению с повышением эффективности, которое они могут принести, вопрос о том, сколько рабочих мест можно заменить и какие отрасли будут разрушены, всегда является наиболее обсуждаемой темой.Многие организации даже готовы подсчитать точный процент.
Какова природа инструмента? Помогите нам легче достичь того, чего мы хотим. Есть два способа повысить производительность: либо повысить эффективность отдельного шага, либо уменьшить количество шагов, необходимых в процессе выполнения задачи, либо добиться того и другого одновременно.
Ряд инструментов искусственного интеллекта, основанных на больших моделях, значительно сократили процесс от предложения требований до реализации идей.
Вы просто произносите одно предложение, позволяете ИИ обрисовать его в общих чертах за несколько секунд, а затем генерируете более 20 страниц PPT.
Некоторые видеоролики, которые раньше требовали съемки и постобработки, теперь превращаются в команду быстрой обработки.
Даже если это обычная фотография, сделанная на мобильный телефон, прохожих или мусор можно убрать, обведя ее пальцем.
Чжан Цинъюань предсказал в интервью в прошлом году, что примерно через год люди смогут использовать «100 юаней в месяц, чтобы нанять универсального офисного помощника», чтобы получить новый контроль над офисным программным обеспечением, включая любые сложные формы, таблицы и вычисления. Панели инструментов исчезнут из офисного программного обеспечения. Этот метод «подписки» фундаментально изменит бизнес-модель офисного программного обеспечения.
На самом деле за этим стоит тот факт, что ИИ ускорил процесс демократизации вычислительных мощностей.
Фу Цзыхао, менеджер по продукту WPS AI, не так давно сделал наблюдение в обмене: «Появление крупных моделей нельзя сравнивать с появлением мобильного Интернета. Это больше похоже на эпоху зарождения ПК и рождения облака.
Поскольку потребности и сценарии, возникающие в человеческом обществе, становятся все более сложными, вычислительных мощностей мозга уже не хватает, и мы начинаем расширять вычислительные мощности с помощью компьютеров. Но порог для полного раскрытия вычислительной мощности компьютера не так уж низок. Возможно, вам придется знать языки программирования. Даже широко используемые таблицы Excel и PS не так просты в использовании.
AIGC решает проблему порога вычислительной мощности: пока вы используете естественный язык, компьютер может понимать логику вашего мышления и генерировать результаты, значительно сокращая цепочку от идеи к результату.
Если вы понимаете эту логику, ваш ответ на недавнее интервью Сэма Альтмана о том, сколько рабочих мест заменит ИИ, может оказаться более резонансным. То, как Альтман думает об этом, заключается не в том, какой процент работы будет выполнять ИИ, а в том, какой процент задач ИИ выполнит за определенный период времени.
Я думаю, что это более интересный, влиятельный и важный вопрос, чем то, сколько работы может выполнить ИИ, потому что это инструмент, который может работать на все более сложных уровнях и во все более длительных временных масштабах. Выполнять все больше и больше задач внутри и позволять людям работать. более гибким способом. Так что, возможно, люди будут более продуктивными.
Такое мышление ценно не только для пользователей, но и для разработчиков инструментов искусственного интеллекта. Потому что на самом деле пользователям нужны не модели со все более большими параметрами, а инструменты, которые облегчат им реализацию их идей, как в классическом ответе Стива Джобса:
Мы должны начать с пользовательского опыта, а затем вернуться к разработке технологий, вместо того, чтобы начинать с технологий, а затем попытаться придумать, как можно увидеть, где эту технологию можно использовать?
Взаимодействие второго пилота
В статье «Первый год большой модели, операционная система человеческой цивилизации претерпевает серьезное обновление» мы упоминали, что следующим поколением революционного режима взаимодействия человека и компьютера может стать естественный пользовательский интерфейс (NUI).
Основной принцип NUI — простота превыше всего. Сложность — враг естественных пользовательских интерфейсов. Каждое взаимодействие должно быть понятным и не требовать никаких инструкций.
Copilot — это идеальная форма инструмента искусственного интеллекта с интерактивной логикой NUI. Слово «второй пилот» происходит от авиационного термина и относится к второму пилоту, который помогает основному пилоту управлять самолетом. Когда основному пилоту необходимо отдохнуть или выполнить другие задачи, второй пилот берет на себя управление. несет ответственность за безопасный полет воздушного судна.
Я думаю, что это также наиболее подходящее описание взаимодействия человека и ИИ. Microsoft определяет Copilot как: приложение или компонент, который использует технологию обработки естественного языка или большие языковые модели, чтобы помочь людям выполнять сложные или когнитивные задачи.
WPS AI также рассматривает взаимодействие человека и компьютера как одно из трех своих стратегических направлений.Он также называет Copilot — естественное взаимодействие, основанное на множественных раундах вопросов и ответов на естественном языке, которое может быть глубоко встроено в различные сценарии документов и совместной работы.
Например, выпущенная вчера версия WPS AI Enterprise Edition может предоставлять цифровые услуги для сотрудников «как гуманитарных, так и естественных наук», такие как помощники по чтению, помощники по рисованию, помощники по посещаемости, анализ продаж, анализ контрактов и т. д., охватывая различные тонкие офисные сценарии.
Среди них Copilot Pro может помочь операторам использовать естественный язык для управления продуктами BI для анализа данных, а также может вызывать WPS 365 API и корпоративный API для решения задач автоматизации офиса.
Данные GitHub показывают, что 88% разработчиков, использующих GitHub Copilot, говорят, что они более продуктивны, 74% говорят, что могут сосредоточиться на более приятной работе, а 77% говорят, что это помогает им сократить время, которое они тратят на поиск информации или примеров.
У Чжан Цинъюаня очень подходящее описание.Взаимодействие на естественном языке значительно снижает затраты на взаимодействие с пользователем, а это означает, что Photoshop может напрямую выйти на рынок таких инструментов, как «Meitu Xiu Xiu».
Пользователи могут реализовать сложные функции в Photoshop с помощью интерактивного управления Meitu Xiuxiu. Такая ситуация наблюдается во все большем количестве типов продуктов искусственного интеллекта. Если вы обратите внимание на обновления WPS AI в прошлом году, вы также обнаружите, что пользовательский интерфейс постоянно упрощается, а ввод на естественном языке начинает заменять функции некоторых оригинальных кнопок.
Видно, что текущий пакет обработки офисных документов превратился в универсальный офис с искусственным интеллектом, состоящий из «офиса + совместной работы + искусственного интеллекта». Продукт может эффективно выполнять все больше и больше задач, но интегрирует все меньше и меньше функциональных модулей.Это также будет тенденцией инструментов искусственного интеллекта.
Инновации в технологии – это, по сути, эволюция взаимодействия человека и компьютера. Когда Copilot разовьется до определенной степени, весь интерактивный интерфейс может даже стать суперприложением. Не только функциональные кнопки будут отменены, но и многие приложения сами по себе больше не будут нуждаться в использовании. существовать в одиночестве.
Нам нужно больше компаний, занимающихся искусственным интеллектом, которые не создают большие модели
Многие люди считают большие модели или AIGC четвертой промышленной революцией. люди образ жизни.
Будь то пар, электричество или Интернет, нет сомнений, что он соответствует этим характеристикам, но как насчет большой модели? По крайней мере, на данном этапе достичь такого уровня точно невозможно. Нам нужно использовать возможности больших моделей с помощью приложений искусственного интеллекта, чтобы влиять на работу и жизнь людей.
▲ Нг Энда
Ученый-компьютерщик Эндрю Нг также считает, что как новое поколение технологий общего назначения ИИ имеет больше возможностей для крупномасштабного применения .
Вот почему я с самого начала сказал, что нам нужно больше компаний, занимающихся искусственным интеллектом, которые не производят модели. Большие модели незаменимы в качестве базовой технологии, но компаниям, занимающимся искусственным интеллектом, которые фокусируются на удовлетворении различных потребностей потребителей и различных коммерческих транзакциях, определенно нужно больше, чтобы искусственный интеллект действительно прорывался на социальном уровне.
Как и технология мультитач, зрелые приложения существовали более 20 лет назад, когда был выпущен оригинальный iPhone, но только Apple сделала эту технологию интерактивным решением практически для всех последующих смартфонов.
На этой волне искусственного интеллекта есть также исследователи, которые не создают большие модели, но полны решимости стать их пользователями. Kingsoft Office — один из лучших.
Стратегия Kingsoft Office очень прагматична и ориентирована на сценарии реализации. Компания достигла углубленного сотрудничества практически со всеми крупными отечественными компаниями, занимающимися крупными моделями искусственного интеллекта, включая MiniMax, Zhipu AI, SenseTime, Wenxinyyan, Tongyi Large Model и т. д. Сосредоточьтесь на сцене приземления. .
Kingsoft играет роль сортировочной станции, отвечающей за определение всех проблем пользователя и сценариев, которые необходимо решить, а затем вызывает наиболее подходящую модель для выполнения задачи. Некоторые нишевые сценарии дополняются небольшими моделями Kingsoft Office, разработанными самостоятельно для удовлетворения потребностей.
Например, SenseTime отлично подходит для анализа данных, а WPS AI использует его для обработки сценариев, требующих научного мышления. Такие сцены, как текст и PPT, дополняются с помощью таких моделей, как Zhipu AI.
Преимущество этого прикладного метода разделения большой модели на части заключается в том, что он позволяет в полной мере раскрыть сильные стороны каждой модели и достичь дополнительных преимуществ, не ограничиваясь возможностями определенной модели. Даже GPT-4 имеет недостатки в некоторых сценариях.
На вчерашней пресс-конференции WPS Чжан Цинъюань упомянул момент, который меня глубоко впечатлил. Он сказал, что все функции, которые он увидел сегодня, могут быть опробованы немедленно и должны быть реализованы в реальных сценариях применения клиентов.
Помимо непрерывной инволюции обработки длинных текстов в чатах, какие еще более творческие приложения существуют для ИИ? Это стоит изучить большему количеству людей.
# Добро пожаловать на официальную общедоступную учетную запись aifaner в WeChat: aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.
Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo