ИИ переживает бум уже два года, и технология быстро развивается. Справилась ли большая модель с дилеммой коммерциализации?

С момента появления ChatGPT увлечение искусственным интеллектом распространяется уже два года. В последние два года обычные люди были в восторге от возможностей больших языковых моделей. Они могут генерировать плавный и естественный текст с помощью всего лишь одной инструкции. Сцены из научно-фантастических фильмов теперь стали реальностью. 

Путь крупных моделей также начал выходить на перекресток: как преобразовать новые технологии в новые продукты, удовлетворить реальные потребности и превратиться в новую бизнес-экосистему.

Точно так же, как мобильные платежи, смартфоны и LTE вместе способствовали процветанию эпохи мобильного Интернета, индустрия искусственного интеллекта также с нетерпением ищет такой PMF (Product Market Fit) в этом году.

Великое путешествие новых технологий началось. От того, удастся ли открыть новый континент, будет зависеть, станет ли «Большая модель» еще одной игрой с капиталом, сжигающей деньги, ускоренным повторением пузыря .com или началом новой промышленной революции, как сказал Хуан Жэньсюнь. Ответ будет доступен нам быстрее, чем AGI. 

Большие проблемы с большими моделями

Сегодня конкуренция базовых моделей в основном сформировала устойчивую картину. ChatGPT, возглавляемый OpenAI, также является лидером рынка. Anthropic, DeepMind, Llama и Grok также имеют свои сильные стороны.

Поэтому самое интересное в этом году не то, сколько еще параметров было расширено или на сколько секунд улучшена скорость отклика, а то, как технология больших моделей превратилась в полезный продукт. 

Как реализовать технологию больших языковых моделей, с самого начала было непростой задачей. Harvard Business Review однажды провел опрос и обнаружил, что существует целых 100 типов генеративных приложений ИИ.

Однако существует пять широких категорий: решение технических проблем, производство и редактирование контента, поддержка клиентов, обучение и образование, художественное творчество и исследования. 

Известная инвестиционная компания a16z представила своей команде отличные продукты генеративного искусственного интеллекта, многие из которых знакомы, например универсальный Perplexity, Claude и ChatGPT. Есть и более вертикальные, такие как продукты для заметок Granola, Wispr Flow, Every Inc., Cubby и т. д. Есть также NotebookLM, крупнейший победитель этого года в сфере образования, или чат-боты Character.ai, Replika и т. д.  

Blooming Flowers предназначен для обычных пользователей: большинство вышеперечисленных продуктов бесплатны и достаточны. Стоимость подписки или профессиональной версии не требует денег. Доход от подписки в этом году, как и у ChatGPT, составляет примерно 283 миллиона долларов США в месяц, что утроилось по сравнению с прошлым годом. Но перед лицом огромных затрат этот доход кажется каплей в море.

Наслаждаться развитием науки и техники — радость для обычных пользователей, в то время как растительное масло на огне остается практикам: какой бы захватывающей ни была технологическая эволюция, она не может оставаться в лаборатории, а должна попасть в коммерческое общество для испытаний. . Модель подписки не получила широкого распространения, а время рекламы еще не пришло. Времени тратить деньги на большие модели осталось совсем мало.

Напротив, тенденция бизнеса тоБ гораздо более уверенная.

Количество упоминаний ИИ в отчетах о прибылях и убытках из списка Fortune 500 почти удвоилось с 2018 года. Генеративный искусственный интеллект был главной темой, упоминавшейся в 19,7% всех звонков о доходах.

Это также консенсус всей отрасли. Согласно «Отчету о развитии искусственного интеллекта (2024 г.)», опубликованному Китайской академией информационных и коммуникационных технологий, в 2026 году более 80% предприятий будут использовать генеративные API-интерфейсы искусственного интеллекта или развертывать генеративные приложения.

Приложения для корпоративных и потребительских приложений демонстрируют разные тенденции развития: для потребительской стороны приложения крупных моделей ориентированы на низкий порог и креативность. Что касается корпоративных приложений, то в приложениях для больших моделей больше внимания уделяется профессиональной настройке и обратной связи.

Другими словами, повышение эффективности – это, конечно, то, к чему стремится и чего хочет достичь каждое предприятие, но эти четыре слова слишком расплывчаты. Большие модели должны доказать, что они действительно могут решать проблемы в сценариях использования и действительно повышать эффективность. 

Точно найдите угол резания и позвольте технике упасть 

Будь то инвестиции ресурсов или интенсивность развития рынка, внутренняя конкуренция за крупные модели будет жесткой в ​​течение 2024 года.

По данным Министерства промышленности и информационных технологий, темпы роста крупного рынка языковых моделей Китая в 2023 году превысят 100%, а объем рынка достигнет 14,7 млрд юаней. Различные производители активно пытаются начать процесс коммерциализации. Первое, что нужно начать, — это ценовая война: затраты на биллинг токенов, вызовы API и т. д. постоянно снижаются. Цены на многие массовые и популярные большие модели общего назначения уже не далеки от бесполезных.

Лучше снизить цены и сократить расходы. Понимание бизнеса и анализ сценариев — более трудный путь.

Однако не каждая компания участвует в ценовой войне и рассчитывает на победу в низких ценах.

«В этом случае более важно выявить наши характеристики и в полной мере раскрыть наши преимущества. В самой Tencent существует множество сценариев, которые дают нам больше информации и еще больше совершенствуют наши возможности. Эксперт по облачным интеллектуальным продуктам Tencent и Tencent Hunyuan». Менеджер по продукту ToB Чжао Синьюй думает так: «Посмотрите снаружи, сосредоточьтесь на отрасли, сосредоточьтесь на некоторых конкретных сценариях в этой отрасли, а затем медленно расширяйтесь».

Среди множества базовых моделей Hunyuan, возможно, не самая популярная, но ее техническую мощь нельзя игнорировать.

В сентябре Hunyuan выпустила общую литературную модель Hunyuan Turbo, в которой используется новая структура гибридной модели экспертов (MoE). От понимания и генерации языка, логического рассуждения, распознавания намерений до кодирования, задач длительного контекста и агрегирования — он имеет довольно высокую производительность. В ноябрьской версии динамического обновления она была повышена до самой производительной модели во всей серии. В настоящее время возможности Tencent Hunyuan полностью экспортируются через Tencent Cloud. Предоставляя модели разных размеров и типов в сочетании с другими продуктами искусственного интеллекта и возможностями Tencent Cloud Intelligence, это помогает моделировать приложения для реализации в сценариях.

Глядя на текущие формы реализации модельных приложений, их можно условно разделить на два типа: серьезные сцены и развлекательные сцены. Последнее похоже на чат-ботов, сопутствующие приложения и т. д.

«Серьезные сценарии» относятся к сценариям приложений, которые требуют более высокой точности и надежности в основных бизнес-операциях предприятий. В этих сценариях большие модели отвечают за обработку структурированной информации и часто должны следовать заданным бизнес-процессам и стандартам качества. Эффект от их применения будет напрямую связан с операционной эффективностью и бизнес-результатами компании.

Tencent Cloud однажды помог поставщику услуг исходящих звонков построить систему обслуживания клиентов . Это типичный серьезный сценарий. В то же время исходящие вызовы включают в себя возможности диалога на естественном языке, возможности понимания и анализа контента, и кажется, что естественный язык обладает высокой степенью адаптивности к большим языковым моделям.

На самом деле, проблема в деталях. В то время перед командой стояли две основные проблемы. Во-первых, это проблемы с производительностью. Из-за огромного количества параметров модели, достигающих масштаба 70B или 300B, важной технической проблемой стало то, как завершить ответ в течение 500 миллисекунд и передать его в нижестоящую систему TTS.

Второе — точность логики диалога. В некоторых разговорах модель будет давать нелогичные ответы, что влияет на общий эффект разговора. Чтобы преодолеть эти проблемы, команда проекта приняла стратегию интенсивной итерации и поддерживала быстрый ритм итерации: одна версия в неделю в течение 1-2-месячного цикла разработки.

Корпоративные клиенты проявили интерес к технологии больших языковых моделей и готовы предпринимать инновационные попытки. Однако в глубокой интеграции технологий и бизнеса всегда существует когнитивный пробел. Это связано не с непониманием компанией собственного бизнеса, а с необходимостью наличия профессиональной технической команды для поиска наиболее подходящих сценариев посредством глубокого понимания болевых точек отрасли и бизнес-сценариев, индивидуальных решений по внедрению ИИ для компании и достичь технологий, наиболее подходящих для бизнеса.

«Традиционный подход может потребовать, чтобы операторы создавали (корпуса) сцену за сценой, — сказал Синьюй. — При работе с большими моделями вам нужно только дать подсказку для реализации требований. После выяснения требований команда Хунюань обновляет версию». почти каждую неделю, что ускоряет итерацию. Через месяц-два точность достигла 95%.

Для этой услуги исходящих звонков генеративная технология является совершенно новой. Hunyuan напрямую позволил им увидеть преимущества больших моделей, сократив затраты на рабочую силу на три четверти.

«Лучший способ — продемонстрировать эффект», — сказал Синьюй, когда клиент хоть немного, но не очень разбирается в генеративной технологии, наиболее эффективно продемонстрировать эффект. Благодаря бизнес-опыту клиента мы можем найти сценарии, которые можно использовать, провести прямое тестирование и проверку, а также продемонстрировать эффекты, которые можно улучшить.

Подобный опыт, отраженный в сотрудничестве с Xiaomi, представляет собой сотрудничество под названием «двусторонняя спешка».

Другая сторона надеется внедрить большие модели во взаимодействие вопросов и ответов и применить возможности поиска ИИ на стороне терминала. Это отражается на двух сильных сторонах Hunyuan: во-первых, поддержка, предоставляемая богатой экосистемой контента Tencent, во-вторых, возможности Hunyuan в поиске с помощью искусственного интеллекта; Для вопросов и ответов точность очень важна.

«Вначале все еще было много трудностей», — вспоминает Синьюй. «С их точки зрения, бизнес-форма охватывает множество сценариев, включая светскую беседу, вопросы и ответы на вопросы и другие различные типы. Среди них сценарий вопросов и ответов на знания имеет относительно высокий уровень точности. . Требовать."

В ходе раннего тестирования команда Hunyuan выяснила свои преимущества в сценарии поиска. Обе стороны работали вместе, чтобы постепенно совершенствовать взаимодействие вопросов и ответов в широком смысле в соответствии с различными уровнями тем. Такое подразделение может позволить модели более четко понять конкретные потребности и требования к эффектам каждой сцены, чтобы выполнить более целенаправленную оптимизацию. 

Сцена с викториной стала той точкой приземления. Что касается последующей реализации, Hunyuan еще предстоит преодолеть множество проблем: разумеется, проблема задержки, время отклика должно быть быстрым, во-вторых, интеграция поискового контента; 

«Для всей ссылки мы создали собственную поисковую систему и модель классификации намерений, чтобы определить, является ли этот вопрос очень срочным. Например, связана ли эта тема с новостями или текущими событиями, а затем определить вопрос, на который следует ответить: к основной модели или к поиску ИИ».

Вызываются только самые необходимые детали, поэтому скорость реакции можно значительно улучшить. Важным выводом является то, что 70% запросов будут направлены на поиск с помощью ИИ, а это означает, что для базовой поддержки по телефону должно быть достаточно богатого контента.

За Hunyuan стоит вся экосистема контента Tencent. В экосистеме Tencent вы можете найти большое количество высококачественного контента из новостей, музыки, финансов и даже более конкретных областей, таких как медицина. Это данные, к которым гибридная модель может получить доступ и на которые можно ссылаться при поиске, и они также являются уникальными барьерами. 

После более чем двух месяцев интенсивных итераций требования, наконец, были полностью выполнены с точки зрения качества ответов, отклика и производительности, и система была запущена в реальный бизнес Xiaomi.

В этом суть бизнеса toB. Чтобы получить доход и завоевать доверие, он должен действительно приносить пользу бизнесу клиента.

Только обобщая «объем», мы можем перейти к большему количеству сценариев. 

Внедрение крупных моделей в различных отраслях и продуктах фактически способствует развитию самой технологии. 

Для некоторых продуктов с большими моделями при выборе пути ToC существует ключевой момент: использование обратной связи со стороны C для оптимизации модели. Большие модели имеют бесконечный спрос на настройку, а количество и активность групп потребителей C-конца обеспечивают питательную среду для итераций моделей. Таким образом, итеративный маховик может начать работать.

На самом деле, этого можно добиться и в тоБ-бизнесе, и требования еще выше.

Функция коррекции китайской композиции K12 «Youth Get» применяет мультимодальные возможности Hunyuan. В сочетании с технологией оптического распознавания символов Tencent Cloud Intelligence содержание сочинений учащихся идентифицируется, а композиция оценивается с помощью большой модели в соответствии с установленными стандартами оценки.

Обычно, если разница между большой моделью и реальным учителем находится в пределах пяти баллов, это хорошо – но добиться этого непросто. Вначале разница между рейтингом Хунюаня и реальным рейтингом учителя составляла менее пяти баллов только в 80% случаев.

«Модель обладает определенными методами и возможностями и может решать проблемы в некоторых сценариях. Но ориентация на бизнес конкретного клиента предъявляет более высокие требования к этому эффекту ». Синьюй сказал: «Возможно, точность 90% может достичь бизнес-целей. В 80% случаев существует определенная дистанция». 

Это значит, что нам придется продолжать «катиться». Поскольку клиентская база сервисных предприятий продолжает расширяться, к самой технологии выдвигаются и новые требования: во-первых, значительно повышается скорость итерации — при столкновении с C-конечными пользователями итерация может занять от одного до двух месяцев. Теперь версия может появляться каждую неделю. Этот высокочастотный ритм итераций значительно способствовал росту и прогрессу модели.

Во-вторых, благодаря постоянному обслуживанию различных корпоративных сценариев способность модели к обобщению также значительно улучшилась. Это показывает, что углубленное обслуживание потребностей диверсифицированных предприятий не только ускоряет темпы разработки и итерации модели, но также повышает практичность и адаптируемость модели, которую можно расширить от серьезных сценариев до сценариев, ориентированных на развлечения. 

Платформа ролевого контента «Dream Dimension» , которая только что получила десятки миллионов финансирования серии A , применила Hunyuan-role, эксклюзивную ролевую модель модели Hunyuan. Она предназначена для обслуживания молодых пользователей и сочетает в себе генеративные возможности. Технология искусственного интеллекта для обеспечения интерактивного, драматического интерактивного опыта виртуальных персонажей.

Hunyuan-роль создает новый способ взаимодействия человека и компьютера. Создавая богатые и разнообразные изображения виртуальных персонажей на основе предустановленного сюжетного фона и настроек персонажей, мы можем разрабатывать естественные и плавные интерактивные диалоги с пользователями.

На техническом уровне такие сценарии были применены к роли Hunyuan, которая продемонстрировала ведущие преимущества в обработке длинных и коротких текстовых диалогов, распознавании намерений и реагировании и т. д., способна к разнообразным сценариям применения и продемонстрировала отличные возможности антропоморфизма контента. —— Это не только обеспечивает теплый диалог и взаимодействие, но также способствует развитию сюжетной линии и создает захватывающий пользовательский опыт.

Эти характеристики делают Hunyuan-role мощным инструментом для привлечения клиентов и операций с пользователями, играя важную роль в улучшении удержания пользователей и стабильности использования. Это также отражает то, что способность к обобщению, сформированная Хунюанем, который был обучен и улучшен в серьезных сценах, может охватывать более широкий диапазон сцен и даже применяться на стороне устройства.

От серьезных сцен к постепенному расширению до развлекательных, творческих и даже других сцен — это путь, который должны пройти приложения для больших моделей.

По мере развития технологий и снижения затрат большие модели неизбежно будут расширяться и охватывать более широкий спектр сценариев применения. Первоначально он был сосредоточен на серьезных бизнес-сценариях, таких как корпоративные офисы, анализ данных, научные исследования и другие отрасли, поскольку эти сценарии имеют четкие потребности и высокую готовность платить.

Для дальнейшего расширения в сфере развлечений, творчества, производства контента и других отраслях нам необходимо иметь опорную точку в нашем мышлении: всегда концентрироваться на решении проблем спроса в конкретных сценариях в качестве основной цели и закрепить отправную точку для интеграции возможностей больших моделей. .

Помимо сотрудничества с прикладным программным обеспечением, необходимо также сотрудничать с производителями оборудования, чтобы модель можно было отображать и использовать на стороне терминала, наиболее близкой к потребителям, обеспечивая более удобный и мгновенный опыт обслуживания, который ближе к повседневной жизни пользователей. .

В этом процессе осведомленность рынка и признание генеративной технологии искусственного интеллекта постоянно улучшаются, а база пользователей также продолжает расширяться. В условиях быстро меняющейся рыночной среды возможность повторять модели стала особенно важной. Это отражается не только на технических характеристиках, но также включает в себя множество аспектов, таких как понимание потребностей пользователей и адаптируемость к различным сценариям. Только те модели и команды, которые способны быстро учиться, постоянно оптимизировать и постоянно адаптироваться к новым потребностям, могут сохранить преимущество в конкурентной борьбе. 

Поскольку он продолжает охватывать все больше сценариев, он также охватывает больше конечных потребителей. Поскольку рынок в целом принимает генеративные технологии, число потенциальных пользователей будет продолжать расти. Только модель, которая может быстро повторяться и совершенствоваться, может быстро адаптироваться к изменениям и двигаться вперед более устойчиво и дальше.

# Добро пожаловать на официальную общедоступную учетную запись WeChat Aifaner: Aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.

Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo