Диалог с генеральным директором Zhipu AI Чжан Пэном: Технологическая революция уже происходит достаточно быстро, не сосредотачивайтесь только на результатах «суперприложений»

8 июля, 2024 Дядя Влад

На Всемирной конференции по искусственному интеллекту 2024 года, проходившей на берегу реки Хуанпу, предприниматели, разработчики и энтузиасты технологий вызвали энтузиазм, который был даже более горячим, чем 38-градусная жара в Шанхае. Мнения о революционности больших моделей и несовместимости практических приложений. также столкнулись.

Как конвертировать вычислительную мощность больших моделей в производительность?

Когда крупные модели, чипы, облачные вычисления, воплощенный интеллект, автономное вождение и другие производители объединяют последние достижения, образуя миниатюрный ландшафт китайского ландшафта искусственного интеллекта, каждый, кто приезжает сюда, надеется найти какие-то низовые корни, ведущие к Змеиной серой линии.

«Эта компания очень похожа на OpenAI». Я находился перед стендом Zhipu AI и слышал, как посетитель выставки представлял его своим товарищам. Вероятно, таково мнение многих практикующих.

Этот китайский ИИ-единорог имеет большие модели разных размеров. Недавно он выпустил модель GLM-4-9B, превосходящую модель Llama 3 8b. Мультимодальная модель GLM-4V-9B обладает теми же возможностями, что и GPT-4V, с количеством параметров 13B. Вчера компания Zhipu AI также представила на WAIC модель кода CodeGeeX 4-го поколения CodeGeeX4-ALL-9B.

Темпы коммерциализации Zhipu AI также опережают большинство конкурентов. Сегодня в приложении Qingyan APP доступно для использования более 300 000 агентов. Открытая платформа крупной модели Zhipu AI в настоящее время насчитывает более 400 000 зарегистрированных пользователей, а средний ежедневный объем вызовов достигает 60 миллиардов токенов.

Чжан Пэн, генеральный директор Zhipu AI, считает, что нынешнее увлечение искусственным интеллектом, вызванное большими моделями, отличается от того, что было раньше. В прошлом технология искусственного интеллекта решала некоторые практические проблемы, но сегодняшняя разработка больших моделей принесла более важные когнитивные способности, подобные человеческим. .

Большие модели могут обеспечивать возможности обобщения одной модели для решения разнообразных потребностей ряда сценариев и приложений, тем самым решая проблему баланса затрат и выгод. Это ее основная особенность.

Чжан Пэн также принял интервью с APPSO и другими средствами массовой информации на месте, рассказывая о таких темах, как реализация больших моделей, суперприложения и будущее технологий, охватывая некоторые ключевые вопросы, от исследования больших моделей до коммерциализации.

Ниже приводится стенограмма разговора. Вы можете увидеть некоторые описания того, как китайские компании, занимающиеся искусственным интеллектом, реализовали большие модели.

Реализуются большие модели, не сосредотачивайтесь только на суперприложениях

Вопрос: Что касается TPF (Technology-Problem Fit) для больших моделей, как Zhipu объединяет технологии с продуктами, а затем реализует их? В отрасли еще не пришли к единому мнению по этому поводу.

Чжан Пэн: Я никогда не думаю, что этот вопрос должен вызывать споры. Внедрение любой новой технологии требует цикла. Это естественный закон, но этот цикл может быть длинным или коротким, и когда внедряется революционная технология, такая как большая модель. В ходе этого процесса, безусловно, возникнут более серьезные проблемы и проблемы, которые нам придется решить.

С объективной исторической точки зрения реализация этой технологической революции произошла достаточно быстро, но именно потому, что она такая быстрая, понимание этого вопроса у всех все еще несколько неравномерно, и дисперсия распределения относительно велика.

Технологию по-прежнему необходимо быстро совершенствовать и обновлять, но с точки зрения применения мы не можем ждать, пока она станет полностью зрелой, прежде чем внедрять ее .

Вопрос: Можете ли вы поделиться опытом реализации больших моделей?

Чжан Пэн: Прежде всего, вы должны иметь глубокое понимание способности распознавать эту модель. Вам следует постараться осознать ее преимущества и избегать использования ее недостатков. Например, если вы попросите модель рассчитать очень точные физические модели или математические формулы, она точно так же, как человеческий мозг, не умеет этого делать. не следует этого делать резко.

Например, нецелесообразно использовать его для замены привычного вам калькулятора, поэтому вам придется найти подходящий ракурс, чтобы полностью раскрыть его преимущества, а не идти в противоположном направлении и не загораживать пространство для путь его разработки, поскольку возможности модели могут быть скомпрометированы в любой момент. Итерации были отменены .

Вопрос: Насколько мы далеки от суперприложений ИИ, которые все обсуждают в последнее время? На самом деле, существует очень мало приложений искусственного интеллекта с более чем 10 миллионами активных пользователей в день.

Чжан Пэн: У каждого очень расплывчатое определение суперприложения. У каждого есть свой набор идей. Считается ли ChatGPT суперприложением?

Вопрос: Давайте посмотрим, с какой аналогией это сравнивается.

Чжан Пэн : Да, всегда нужно иметь аналогию. ChatGPT уже является самым быстрым продуктом в истории, имеющим более 100 миллионов пользователей в месяц. Если это нельзя назвать суперприложением, то что можно назвать суперприложением?

Не смотрите на этот вывод преждевременно. Если вы понаблюдаете за процессом, вы обнаружите, что он развивался очень быстро, поэтому наберитесь терпения. Появление суперприложений не является полностью технологическим явлением, но также учитывает множество таких факторов. как рынок и готов ли пользователь .

Позвольте мне привести вам еще один простой пример. Количество пользователей поисковой системы Google достаточно велико. Сколько времени потребовалось, чтобы она превратилась из поисковой системы номер один в мире в успешный коммерческий путь? 6 лет также потребовалось 6 лет для текущей Меты и оригинального Facebook.

Вопрос: Кроме того, с момента появления мобильного Интернета до WeChat и TikTok прошло больше времени.

Чжан Пэн : Так почему бы всем не подождать еще немного? Мог бы и попробовать. Точно так же, как когда мы в детстве играли в арканоид, вам нужно прицелиться в разрыв и очень точно попасть в него. Для этого сначала нужно найти, где находится разрыв. Где путь?

Многие вещи нужно исследовать одно за другим, и этот процесс очень важен. Не просто видеть окончательные результаты, но, что более важно, мы принимаем меры. Я думаю, что это то, на что всем следует обратить больше внимания в данный момент.

Вопрос: Некоторые представители отрасли считают, что инновационные приложения могут быть реализованы в ближайшие несколько лет. Он очень четко обозначил срок около трех лет. Что вы думаете?

Чжан Пэн: Возможно, завтра. Как я только что сказал, этот вопрос требует всестороннего рассмотрения различных факторов. Один из них — это зрелость самой технологии, а второй — готовность рынка и самих пользователей. Третье — это обнаружение спроса, и тут добавляется даже немного удачи. Здесь слишком много переменных, и сложно предсказать подобные вещи с помощью простой нейронной сети, такой как мой мозг.

Вопрос: В последнее время активно обсуждается мнение, что базовая модель без приложения бесполезна.

Чжан Пэн : Этот вопрос сам по себе разделен на два уровня. Во-первых, технологические инновации значимы сами по себе, потому что у нас так много научных исследователей, которые постоянно изучают причины человеческого интеллекта. Мы. То, как заставить машины приблизиться к человеческому интеллекту, имеет большое значение.

Второй уровень. Если результатом этого исследования будет то, что мы сможем спроектировать и произвести его, превратив в более ценную производительную силу, это будет иметь большее значение .

Этот вопрос – не выбор между двумя, а серия вопросов. Применение, конечно, очень важно. Мы надеемся, что сегодня технологии могут быть преобразованы в более новую производительность, но это не означает, что наше стремление к технологическим инновациям и необходимым исследованиям бесполезно. Не впадайте ни в одну из крайностей, это взаимоусиливающие отношения.

Вопрос: Существует также мнение, что модель с открытым исходным кодом не подходит для большинства сценариев применения, а коммерческая модель с закрытым исходным кодом является наиболее эффективной. Некоторое время назад Zhipu также выпустила версию GLM-4 с открытым исходным кодом. Что вы думаете о моделях с открытым и закрытым исходным кодом?

Чжан Пэн : Мы всегда считали, что открытый и закрытый исходный код имеют разные основные цели и значения. Закрытый исходный код рассматривается скорее с коммерческой точки зрения. Это путь бизнеса к предоставлению более качественных услуг и более безопасных продуктов. Что касается открытого исходного кода больших моделей, то его цель состоит в основном в обогащении экологии и продвижении технологических инноваций.

Если какая-либо технология просто пойдет по закрытому и монополизированному пути развития, она либо потеряет жизнеспособность, либо станет состоянием, не дружественным ко всей экологии . Как и в случае с биосферой, необходимо поддерживать определенную степень разнообразия. Открытый исходный код больше ориентирован на поддержание технологических инноваций и технологического разнообразия, чтобы сообщество открытого исходного кода также могло инвестировать в ядро технологий.

Вопрос: Ранее вы упоминали, что коммерциализация Zhipu сосредоточена на ToB. На каких отраслях в настоящее время сосредоточены клиенты ToB? С какими конкретными приложениями вы помогаете клиентам?

Чжан Пэн: Это просто означает, что наш текущий основной источник дохода по-прежнему находится на стороне ToB, но это не означает, что наш путь коммерциализации — это только ToB.

В настоящее время клиенты B-стороны, которых мы обслуживаем, охватывают более 10 отраслей, включая финансы, образование, Интернет, розничную торговлю, автомобили, энергетику, традиционное производство и т. д.

В настоящее время мы помогаем отраслевым клиентам начать работу, и я в основном использую несколько путей.

Прежде всего, у нас есть собственная открытая платформа, которая может помочь нашим клиентам быстро получить доступ к возможностям модели при относительно небольших затратах. Они могут быстро опробовать инновации, а затем обновиться и усовершенствовать свои собственные продукты и возможности искусственного интеллекта.

Второй — для некоторых крупных компаний, у которых относительно высокие требования к безопасности данных и приватизации. Мы предоставим решения для облачной приватизации и решения для локальной приватизации, а затем мы будем конкретизировать некоторые сценарии, а затем появятся китайские решения для малых предприятий. таким образом, мы предоставим интегрированные программные и аппаратные решения.

В настоящее время наша открытая платформа насчитывает более 400 000 корпоративных пользователей, включая несколько небольших групп разработчиков, которые зарегистрировали и использовали API нашей модели на нашей платформе. Ежедневный объем обслуживания превышает 60 миллиардов токенов. Объем обслуживания очень быстро растет.

Вопрос: OpenAI недавно прекратила предоставлять услуги API китайским разработчикам, а Zhipu вскоре запустила службу релокации. Как обстоят дела с миграцией пользователей сюда?

Чжан Пэн: По нашим наблюдениям, наблюдается рост, но реакция всего рынка имеет процесс. Я также спросил своих друзей о ситуации. На самом деле, все наблюдали рост.

Вопрос: Есть ли у вас планы поехать за границу в следующий раз?

Чжан Пэн: Мы уже намечаем наши международные направления бизнеса и в настоящее время ведем переговоры по некоторым вопросам.

Какой следующий шаг у больших моделей?

Вопрос: Выпуск GPT5 задерживается. В отрасли считают, что итерационная кривая больших моделей замедляется. Закон масштабирования подходит к концу?

Чжан Пэн: Ранний Закон масштабирования был очень простым и фокусировался только на параметрах модели. Однако позже все обнаружили значение Закона масштабирования. Размер его параметров был лишь одним из факторов и переменных. Он также включал другие факторы. например, Мы говорили об объеме данных, используемых для обучения, и количестве токенов, а позже обнаружили, что это также связано с объемом вычислений, поэтому смысл самого закона масштабирования также постоянно меняется.

Что ближе к истине закона масштабирования, так это объем вычислений. Объем вычислений объединяет вычислительную мощность и данные, а также масштаб параметров. Конечным результатом может быть комплексная переменная, которая может лучше отражать закон масштабирования. С точки зрения суммы расчета мы считаем, что закон масштабирования по-прежнему эффективен.

Дополнительным примером, подтверждающим это, является то, что Соединенные Штаты теперь ограничивают экспорт технологий искусственного интеллекта. Их стандартом ограничения больше не является, например, вычислительная мощность чипа или количество параметров и данных модели, а количество. Нарисуйте линию на основе 10 в 24-й степени. Если сумма расчета этой модели превышает эту линию, это не будет разрешено, поэтому вы можете видеть, что она также движется в направлении, более близком к истине.

Но в чем его суть? Мы все еще исследуем, потому что сам закон масштабирования — это наблюдаемое явление и полученное правило. Он не является коннотацией истины .

Вопрос: Будет ли Zhipu AI в будущем отдавать предпочтение крупной модели на стороне клиента или в облаке?

Чжан Пэн: Мы считаем, что путь нынешней большой модели — это движение к общему искусственному интеллекту или даже к сверхразуму, превосходящему человека. На данный момент это относительно надежный путь, но мы не будем ограничиваться облаком или клиентом. сторона. выбор .

Мы считаем, что развитие этой технологии имеет свои этапы, например, на определенном этапе облако может иметь высочайший уровень интеллекта из-за вычислительной мощности и других причин, если мы хотим перейти к следующему этапу общей искусственности. интеллект или суперискусственный интеллект. Он все еще может быть централизован в облаке, чтобы обеспечить более мощные возможности.

▲Гуманоидные роботы на WAIC.

Однако в некоторых конкретных сценариях, таких как встроенные в мобильные телефоны, автомобили и роботы, может потребоваться использование конечных вычислительных мощностей и конечных моделей для взаимодействия с облаком. Это может быть комбинация конечных устройств. Облако и конечная сторона. С помощью этой модели мы сможем в будущем достичь такого же интеллектуального интеллекта, как нынешнее облако на мобильных телефонах, но это включает в себя множество комплексных факторов, таких как чипы, вычислительная мощность и энергия, а также ряд других факторов. проблемы.

У любой технологии есть этапы. На данном этапе план такой, но в более долгосрочной перспективе является ли это (сторона устройства и облако) окончательным ответом? Однозначно нет, оно обязательно будет развиваться дальше в будущем.

Вопрос: Как вы думаете, где будет следующая разработка больших моделей?

Чжан Пэн: В настоящее время языковые и письменные способности крупных моделей близки к среднему человеческому уровню или даже немного превышают его. Далее мы надеемся использовать одно слово для его описания: «переход от виртуальности к реальности», то есть оно больше не ограничивается мозгом в чане, но может войти в реальную жизнь и работать для создания реальной производительности.

Для достижения этой цели, помимо языковых способностей, требуются многие другие способности, такие как зрительные способности, слуховые способности и способность использовать руки и ноги для роста рук и ног. Мы надеемся, что это станет мультимодальным состоянием А. Современная модель, которая может понимать человеческие намерения, разлагать человеческие намерения на логические этапы выполнения и использовать инструменты для подключения к физическому миру для выполнения этих задач.

Поскольку мы хотим, чтобы у него была более сильная способность вмешиваться в физический мир, безопасность становится более важной, чтобы не допустить совершения вредных действий в реальном физическом мире. То же самое происходит и в цифровом мире. Нам нужно улучшить безопасность. И это нужно сделать. больше, чем согласованность, мы называем это суперинтеллектом и суперсогласованностью.

# Добро пожаловать на официальную общедоступную учетную запись WeChat Aifaner: Aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.

Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo