Большая модельная ценовая война Китая: крупные производители сходят с ума, Кайфу Ли и Ван Сяочуань не следуют их примеру, кого убьют первым?

29 мая, 2024 Дядя Влад

Я никогда не ожидал, что «618» этого года начнется с большой модели искусственного интеллекта.

Всего за несколько дней крупные отечественные модели, такие как Tencent, Alibaba, Baidu, iFlytek и т. д., снизили свои цены, что позволяет нам заранее почувствовать простую атмосферу «праздника покупок».

▲ Краткое описание текущего снижения цен на отечественные большие модели

Но прежде чем начнется самое интересное, давайте сначала выясним, что эти производители подразумевают под ценой на большие модели.

Обычно после того, как крупная компания, занимающаяся моделями искусственного интеллекта, обучает свою собственную большую модель с закрытым исходным кодом, она продает свой API (интерфейс прикладного программирования, интерфейс прикладного программирования) разработчикам и взимает плату.

▲ ПИ похож на официанта в отеле, картинка с сайтаhububble.com

Основываясь на API больших моделей, разработчики оптимизируют их путем подачи данных, точной настройки и т. д. Это модель монетизации многих крупных производителей моделей.

Нетрудно заметить, что изменения цен на большие модели могут не повлиять напрямую на потребителей, но напрямую повлияют на затраты разработчиков, создающих приложения.

Хотя в настоящее время существуют некоторые крупные компании, занимающиеся моделями искусственного интеллекта, которые применяют системы членства, системы на основе времени и другие модели, они обычно выставляют счета на основе использования, аналогично пакетам трафика мобильных телефонов, за исключением того, что единица выставления счетов изменилась с ГБ трафика на токены. .

Однако на данный момент не существует единого стандарта соответствия токенов, китайских иероглифов и букв, а также у каждой компании есть свое определение. Согласно предыдущим новостям, 1 токен Tencent ≈ 1,8 китайских иероглифа, 1 токен Tongyi Qianwen = 1 китайскому иероглифу, а в некоторых случаях 1 токен ≈ 0,5 китайских иероглифа.

▲ Фотографии из Технологического научно-исследовательского института Бинцзянь

Поэтому стандарты выставления счетов у каждой компании разные, но в целом они следуют правилу: чем больше масштаб большой модели, тем дороже цена. В конце концов, здесь есть затраты на обучение.

На данном этапе крупные производители все еще изучают бизнес-модель продажи вызовов API. Многие производители пытаются различными методами увеличить количество вызовов API крупных моделей, но рост не очевиден.

В этом случае снижение цен на API крупных моделей может побудить некоторых разработчиков опробовать приложения ИИ, начиная с «бесплатных пробных версий», что имеет определенное положительное значение для захвата и активации рынка. Это предпосылка и подоплека этой «войны».

Готовьтесь, сдавайтесь!

6 мая компания Magic Square Quantitative возглавила первую волну «войны» снижения цен. Цена ее большой модели DeepSeek-V2 упала всего до 1 юаня за миллион входных жетонов. Войдите в систему и получите слоган «токены 500 Вт».

11 мая Zhipu Big Model также «поспела за темпом» и запустила новые льготные меры. Квота для новых зарегистрированных пользователей была увеличена с 5 миллионов токенов до 25 миллионов токенов.

Цена продукта начального уровня GLM-3-turbo упала с 5 юаней до 1 юаня за миллион токенов, то есть на 80%.

Объявляя цену, он также «интимно» сравнил свой GLM-3-турбо с Alibaba, Baidu и ChatGPT, набитым порохом.

Впоследствии приход поставщиков облачных услуг довел эту волну «войны» за снижение цен до апогея.

15 мая ByteDouBao объявил: «Цена на большие модели снижена!» Тан Дай, президент Volcano Engine, объявил, что цена основной модели DouBao на корпоративном рынке составляет 0,0008/тысячу токенов, сравнивая Baidu, Ali и модели. с теми же характеристиками на рынке, цена обычно составляет 0,12/тысячу токенов, что обеспечивает инволюцию цен «от центов к центам».

Он также привел пример: «На один юань можно купить 1,25 миллиона жетонов основной модели Дубао», что составляет около 2 миллионов китайских иероглифов, что эквивалентно созданию трех «Романсов о трех королевствах».

21 мая, перед лицом ценовой войны ByteDance, соответствующее лицо, отвечающее за Alibaba Cloud, заявило в контратаке:

«Дружественные крупные модельные компании предложили различные темы снижения цен. Цель снижения цен – принести пользу рынку. В Китае то, какая компания действительно способна и имеет капитал для снижения цен, зависит от того, являются ли возможности базовой модели ведущими, являются ли есть ли ресурсы для рассуждения, и существует ли текущая модель. Ее уже используют многие пользователи, а большие модели не являются основным бизнесом».

В то же время Alibaba Cloud также выдвинула лозунг «прорываясь к самым низким ценам в мире» и коллективно снизила цены на свои 9 больших моделей. Цена вспомогательной модели Qwen-Long «уровня GPT-4» упала до 0,5. Ввод и вывод 2 юаня за миллион токенов.

Другими словами, за 1 юань можно купить 2 миллиона токенов, что эквивалентно объему текста 5 «Словарей Синьхуа», но цена составляет всего около 1/400 от GPT-4.

Всего несколько часов спустя Baidu, еще одна компания, которую постоянно сравнивают, также приняла меры. Две основные модели Wenxin Models, ERNIE Speed и ERNIE Lite, стали напрямую и совершенно бесплатными.

Хотя эти две модели не являются флагманскими среди крупных моделей, в настоящее время они являются моделями, которые обслуживают большинство пользователей в большой серии моделей Baidu Wenxin.

22 мая iFlytek также объявила, что примет участие в «конкурсе по снижению цен». API iFlytek Spark Lite будет постоянно доступен бесплатно, а цена iFlytek Spark Pro/Max составляет всего 0,21 юаня за 10 000 токенов. «Использование iFlytek Spark 3.5 max стоит всего 2,1 юаня и позволяет генерировать контент «Живого» Ю Хуа».

В тот же день Tencent Cloud объявила, что присоединилась к лагерю снижения цен на крупные модели. Цена API модели Hunyuan-lite полностью свободна от 0,008 юаня за тысячу токенов. Недавно выпущенный стандарт Hunyuan и модель Hunyuan с наивысшей конфигурацией в триллион параметров. -pro API оба Снижение цены происходит и вступает в силу немедленно.

На данный момент в игру вступили почти все производители крупных моделей. Кажется, в одночасье крупные модели коллективно начали сумасшедшее снижение цен.

Технологические инновации, стоящие за «ценовой войной»

Не только отечественные производители, но и зарубежные крупные модели в лице OpenAI также постоянно снижают цены на крупные модели. Хоть они и не так концентрированы, как отечественные производители, но принимают меры раньше отечественных производителей.

GPT-3.5 Turbo, запущенный в марте 2023 года, снизит стоимость тысячи токенов до 0,002 доллара США, что на 90% ниже, чем у предыдущего турбо GPT-3.5.

Цена входных токенов GPT-4 Turbo, выпущенных в ноябре, составляет всего 1/3 от GPT-4, а цена выходных токенов — 1/2 от GPT-4.

Недавно выпущенный GPT-4o в 2 раза быстрее предыдущего GPT-4 турбо, но цена вдвое дешевле. С 2023 года его снижали в цене четыре раза подряд.

Нетрудно заметить, что для OpenAI снижение цен стало основной стратегией постоянного обновления и расширения рынка. Другие крупные модели, такие как Gemini, также не забывают добавлять изменения в цене после производительности, и значительное снижение цен стало общей тенденцией.

Фактически, независимо от того, является ли это крупной отечественной моделью или крупной зарубежной моделью, основной причиной снижения цен является быстрое снижение затрат на выводы.

Не так давно компания DeepSeek-V2 представила нам в статье, что она использует MLA (скрытое внимание с несколькими головками) в сочетании с MoE (экспертная гибридная модель «Смесь экспертов») для достижения межуровневого улучшения производительности модели. Одновременное уменьшение количества. расчетов, существующих рассуждений и стоимостных обоснований. Заинтересованные друзья могут нажать, чтобы просмотреть исходный текст:

https://github.com/deepseek-ai/DeepSeek-V2/blob/main/deepseek-v2-tech-report.pdf

По мере увеличения вычислительной мощности и развития алгоритмов эта тенденция сохранится. В недавнем интервью председатель и главный исполнительный директор Sinovation Ventures Кай-Фу Ли рассказал о недавнем безумии снижения цен и высказал мнение, что «ожидается, что вся отрасль будет сокращать затраты на логические выводы в 10 раз каждый год, и это должно произойти».

Однако он также сказал, что в настоящее время возникает неустойчивый проигрышный подход в стиле «офо», заявив: «Если технология не очень хороша, мы будем полагаться исключительно на скидки и убытки при ведении бизнеса. Мы никогда не последуем такому подходу». Проведите сравнительный анализ».

Это связано с его уверенностью в своих больших моделях: «Как и Tesla, он не будет снижать цены только потому, что автомобили других марок дешевле, чем у него».

Однако все мы знаем, что Тесла на самом деле не снижает цены, а иногда даже становится пионером в снижении цен. Интересно, станут ли его высказывания «бумерангом» в будущем.

▲ Кай-фу Ли, председатель и генеральный директор Innovation Works, фото из Интернета

Волна уже близко

Помимо Кайфу Ли, Ван Сяочуань, основатель Baichuan Intelligence, также имеет другое понимание этой ценовой войны:

«Я думаю, что, как и в случае с оригинальным Didi Meituan, это будет стимулировать весь рынок B к более быстрому процветанию, и каждый будет с большей готовностью его попробовать».

Он считает, что ценовая война на самом деле напомнит тем производителям, которые слепо вошли в индустрию больших моделей, потому что боялись отстать, о необходимости пересмотреть свое позиционирование и устранить некоторые компании, которые «недостаточно ясно мыслили».

«Когда прилив поднимается и отступает, в конце концов останется жемчуг. Внутри должен быть пузырь. Ценовые войны сделают пузырь более процветающим. Это не означает, что в ситуации нет пузыря. В предыдущем пузыре Многие компании считали, что им приходится обучать модели. Это вредно для здоровья. На рынке нет необходимости в таком количестве поставщиков моделей, и нет необходимости в войне тысяч моделей или войне десяти тысяч моделей».

▲ Ван Сяочуань, генеральный директор Baichuan Intelligence

Фу Шэн, председатель и генеральный директор Cheetah Mobile, считает, что это беспомощный шаг после того, как гомогенизация крупных моделей затрудняет избавление от разрыва в производительности:

«Это большое снижение цен, по сути, означает, что крупные стартапы должны найти новые бизнес-модели. В краткосрочной перспективе производительность крупных моделей столкнулась с узким местом. Никто не может ни от кого избавиться, и никто не может придумать козырную карту. снизить затраты на выводы и снизить затраты. Цена продажи стала сейчас приоритетом для каждой компании».

Нет сомнений в том, что крупные производители снизили цены, что означает усиление конкурентного давления для многих стартапов в индустрии крупных моделей.

Фактически, когда отрасль вступает в стадию комплексного снижения цен, это означает начало широкомасштабной конкуренции на выбывание, в результате которой зачастую остается всего несколько компаний.

Мы часто видим, что на ранних этапах развития отрасли из-за огромного соблазна «окна» различные хорошие и плохие компании часто конкурируют друг с другом на рынке. Однако после одного или нескольких раундов масштабного снижения цен, в отрасли происходят перестановки, а эффективность неэффективна. Высокопроизводительные компании вытесняются с рынка.

В настоящее время этот процесс в сфере ИИ, похоже, ускоряется, особенно для производителей, чьи крупные модели не имеют преимуществ на рынке.

Но с другой стороны, снижение цен на крупные модели — это хорошая новость для пользователей, поскольку это означает, что они могут получить доступ к передовым технологиям искусственного интеллекта и использовать их с меньшими затратами, а на рынке легче создавать отличные приложения искусственного интеллекта.

Однако в настоящее время коммерциализация всей отрасли еще далека от формирования экосистемы. Помимо крупных модельных компаний в Китае все еще существует большой пробел в команде разработчиков приложений ИИ.

Согласно последним данным, опубликованным Baidu, большая модель Wenxin обрабатывает 250 миллиардов текстовых токенов в день, а ByteDance обрабатывает 120 миллиардов текстовых токенов в день. Однако большая часть этого — внутренний бизнес крупных компаний, использующих приложения искусственного интеллекта и бизнес-исследования. Видно, что в настоящее время фактически вся отрасль еще не сформировала экосистему.

Аналитики Bloomberg также ранее отмечали: «Китаю предстоит пройти долгий путь к прибыльности в сфере ИИ, и кадровые перестановки могут способствовать повышению прибыльности отрасли, но маловероятно, что это произойдет в ближайшее время. Вопрос стоимости всегда был важным фактором, ограничивающим рост». развитие отрасли.

IDC прогнозирует, что рынок крупных моделей искусственного интеллекта в Китае достигнет 21,1 миллиарда долларов США в 2026 году, а искусственный интеллект вступит в критический период для крупномасштабного внедрения.

Считается, что со снижением цен на большие модели, а также с развитием мультимодальности, ускорением скорости вывода и снижением затрат поиск, AI-ПК/мобильные телефоны или другие продукты бытовой электроники станут широким пространством. для разработки приложений искусственного интеллекта.

Такая возможность может напомнить многим людям о временах, когда Интернет был на пике популярности. На самом деле, у этих двух технологий есть много общего. Это также важная причина, по которой Хуан Жэньсюнь назвал нынешнюю эпоху «следующей промышленной революцией».

Снижение предельных издержек может стать непосредственной причиной революции платформ искусственного интеллекта

Партнер A16Z Мартин Касадо однажды высказал точку зрения, что в истории было два случая смены платформ и отраслевых революций, вызванных снижением предельных издержек, а именно чипов и Интернета.

Появление чипов снизило предельные издержки вычислений почти до нуля. До этого расчеты приходилось производить вручную. От людей требовалось голыми руками составлять таблицы логарифмов в большой комнате.

Затем были представлены ENIAC и другие машины, и скорость вычислений быстро возросла на четыре порядка. Последующая компьютерная революция привела к появлению большого количества новых отраслей, оживила многие компании и породила ряд новых компаний.

Затем, в эпоху Интернета, предельные издержки распространения упали до 0. Раньше независимо от того, что вы отправляли (коробку или письмо), существовала определенная стоимость. После появления Интернета цена за бит резко упала.

Это также было улучшение на четыре порядка, которое способствовало быстрому развитию смежных отраслей и привело к Интернет-революции. В этот период в качестве представителей выступили такие компании, как Amazon, Google и Meta.

Подобно двум вышеупомянутым технологиям, ИИ также представляет собой революцию в производительности, основанную на затратах. Большие модели сводят к 0 предельные затраты на создание, например создание изображений, понимание языка и т. д. Он также привел такой пример.

Если вы хотите создать о себе анимационного персонажа в стиле Pixar, большая модель будет стоить около 0,01 цента и займет всего 1 секунду, но наем графического дизайнера на час обойдется примерно в 100 долларов, а может и больше.

Вместо того, чтобы быть немного лучше, ИИ дешевле и на порядки быстрее.

▲ Сравните стоимость и время, необходимое для создания изображений между искусственным интеллектом и графическими дизайнерами.

В 1865 году британский экономист Уильям Стэнли Джевонс заметил, что технологические усовершенствования, которые сделали использование угля более эффективным, вместо этого приведут к увеличению потребления угля в широком спектре отраслей промышленности.

Он считает, что, вопреки интуиции многих людей, повышение эффективности приводит к снижению цен, что, в свою очередь, стимулирует рост спроса.

Другими словами, когда технологический прогресс повышает эффективность использования ресурсов, а снижение затрат приводит к увеличению спроса, скорость потребления ресурсов увеличивается, а не снижается. Это знаменитый «парадокс Джевонса».

▲ Уильям Стэнли Джевонс (1835.9.1—1882.8.13)

В прошлом такими ресурсами были чипы и Интернет. Благодаря повышению эффективности вычислений и информации, а также снижению цен они стимулировали рост спроса, создавали больше ценности и услуг, а также породили новые передачи платформ и отраслевые революции, тем самым повышая производительность. и доходы людей, в конечном итоге меняя облик всего мира и жизнь каждого из нас.

Это история чипов и Интернета много лет назад, а также история искусственного интеллекта, происходящая сегодня.

# Добро пожаловать на официальную общедоступную учетную запись WeChat Aifaner: Aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.

Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo