К счастью, национальный ИИ Apple не выбрал DeepSeek

Когда все гадают, куда национальный ИИ Apple сделает свой следующий шаг, ответ одновременно удивителен и разумен. Не самый живой, не самый громкий и не имеющий самой сильной оппозиции, а самый сдержанный – Али.

Как сообщает зарубежное издание The Information, Apple наконец выбрала Alibaba в качестве партнера по китайской версии ИИ.

В статье, опубликованной вчера вечером, мы также заметили поляризацию взглядов среди пользователей сети в области комментариев. Некоторые люди думают, что Alibaba — лучший кандидат и вполне заслужен, а другие озадачены тем, что Apple обошла DeepSeek и выбрала Alibaba.

Но если вы оглянетесь назад на весь процесс отбора, то, возможно, было бы справедливо, если бы Apple отказалась от DeepSeek.

Каков уровень модели Али Квен?

Среди многих крупных компаний, занимающихся искусственным интеллектом, Alibaba, вероятно, является самой скрытной.

Во многих случаях это не обязательно является недостатком. В постоянно меняющейся индустрии искусственного интеллекта «недостаточно сексуально» иногда является самым большим преимуществом, потому что другая сторона этого часто означает практичность.

С точки зрения технической мощи сообщество открытого исходного кода похоже на зеркало, которое может отражать истинную техническую мощь. Alibaba — один из немногих отечественных производителей, которые могут твердо стоять перед этим зеркалом.

Это видно из последнего списка крупных моделей с открытым исходным кодом Hugging Face, крупнейшего в мире сообщества искусственного интеллекта с открытым исходным кодом. Все десять лучших крупных моделей с открытым исходным кодом являются производными моделями, основанными на вторичном обучении модели с открытым исходным кодом Alibaba.

В настоящее время этот список является самым авторитетным в мире большим списком моделей с открытым исходным кодом. Его тестовые параметры охватывают понимание прочитанного, логические рассуждения, математические расчеты, вопросы и ответы, основанные на фактах, и т. д.

Еще одним неоспоримым фактом является то, что ценность создания технологического бренда все еще растет. Известная и популярная большая модель Qwen превзошла Llama и стала эталонной базовой моделью, признанной сообществом открытого исходного кода.

Будучи первой в отрасли крупной моделью с открытым исходным кодом, обеспечивающей «полноразмерность, полнорежимность и множественность сценариев», модель Alibaba Cloud Qwen предоставляет разработчикам и предприятиям размеры и версии в диапазоне от 1,5 байт до 72 байт и даже 110 байт, полностью удовлетворяя потребности различных сценариев применения.

Среди них только модели визуального понимания Qwen-VL и Qwen2-VL были загружены более 32 миллионов раз по всему миру. Неделю назад Qwen2.5-VL представил новое обновление, которое еще раз вызвало энтузиазм сообщества разработчиков программного обеспечения с открытым исходным кодом.

Данные говорят сами за себя. В списке моделей с открытым исходным кодом Hugging Face за 2024 год Qwen2.5-1.5B-Instruct стала самой популярной моделью с открытым исходным кодом среди мировых разработчиков с долей скачиваний 26,6%.

В настоящее время количество моделей, производных от Qwen, превысило 90 000, что делает ее крупнейшей группой моделей с открытым исходным кодом в мире.

В технологической волне моделей вывода Квен продемонстрировала мощное гравитационное поле. Недавно модель вывода s1, обученная командой Ли Фейфея, известной как «Крестная мать искусственного интеллекта», использовала меньше ресурсов и данных, которая также основана на модели дистилляции Qwen-32B, и достигла результатов сравнительного тестирования OpenAI o1-Preview в нескольких возможностях.

Все эти достижения обусловлены превосходной базовой прочностью модели Qwen, но именно эта сила дает Alibaba уверенность в том, что она принимает высокие стандартные требования Apple к функциям искусственного интеллекта.

Кроме того, по сравнению с другими стартапами в области искусственного интеллекта, преимущества Alibaba как признанного китайского гиганта в сфере искусственного интеллекта очевидны. Компания лучше знакома с потребностями внутренних пользователей и лучше понимает политику соблюдения требований к данным. Это обеспечивает важные гарантии для местной адаптации и быстрого внедрения функций искусственного интеллекта Apple.

Конечно, хотя Али в итоге и победил, такой результат не был предначертан с самого начала. За последние несколько месяцев Apple провела несколько раундов проверок ряда компаний-кандидатов, включая Tencent, ByteDance и DeepSeek.

В недавнем отчете о прибылях и убытках генеральный директор Apple Тим Кук похвалил DeepSeek.

Кук отметил, что компания DeepSeek добилась значительных инноваций в сокращении затрат на обучение и эксплуатацию модели V3. Он подчеркнул, что инновации, способствующие повышению эффективности, — это очень позитивная вещь, что и продемонстрировал DeepSeek.

Однако из-за небольшого размера команды и большого опыта работы с клиентами неудивительно, что DeepSeek вышел из игры. Это отражается в сообщении «сервер занят, повторите попытку позже». Напротив, техническое шасси и инфраструктура Alibaba Cloud предоставляют Apple более заметные преимущества в обеспечении локализованной поддержки вычислительных мощностей.

Что еще более важно, сотрудничая с Alibaba, Apple надеется запустить функции искусственного интеллекта (такие как интеллектуальный голос, визуальное понимание и т. д.), которые будут соответствовать привычкам китайских пользователей, повысить конкурентоспособность продукции и обратить вспять спад рынка.

По имеющимся данным, Apple, имеющая четкие цели, надеется найти партнера, который сможет понять потребности китайских пользователей на основе личных данных пользователей, что также является важной частью создания смартфонов Apple.

Когда Apple оценивала модели искусственного интеллекта, разработанные несколькими китайскими компаниями, она была недовольна способностью моделей понимать намерения пользователя и учитывать фактическое использование телефона пользователем в сгенерированных ответах.

Сможет ли она выдержать критику критических взглядов и суровые сценарии, выбор Apple Alibaba в качестве национального ИИ может стать лучшим ответом на этот вопрос, а также лучшим подтверждением силы Квен.

После того, как Qwen будет использоваться на iPhone, этот опыт изменится.

Поскольку индустрия мобильных телефонов вступила в новый виток технологических изменений, директор по продуктам OPPO Лю Цзоху сделал важное суждение на конференции по стратегии OPPO AI в прошлом году: «Мобильные телефоны с искусственным интеллектом станут третьим важным этапом изменений в индустрии мобильных телефонов после функциональных телефонов и смартфонов».

Развитие мобильных телефонов с искусственным интеллектом описывается в три этапа: первый — это искусственный интеллект на уровне приложений, который делает отдельные приложения более интеллектуальными; второй — это искусственный интеллект на уровне системы, который интегрирует возможности искусственного интеллекта в уровень операционной системы и, наконец, достигает стадии «ИИ — это система», делая искусственный интеллект ядром взаимодействия с мобильным телефоном.

Учитывая недавнюю популярность Deepseek, форма применения ИИ в области мобильных телефонов становится все более понятной. Производители мобильных телефонов обычно применяют решение «сотрудничества устройств и облаков»: легкие задачи обрабатываются локально на мобильном телефоне, а сложные задачи передаются в облако.

Apple Smart также продемонстрировала аналогичную многоуровневую архитектуру после прошлогодней конференции WWDC:

  • Локальная модель: В основном это небольшая доработанная модель 3B, предназначенная для таких задач, как суммирование и полировка. При поддержке адаптера ее возможности не слабые.
  • Вычисления в частном облаке: если локальная модель не соответствует требованиям, она будет передана в облако для вычислений. Apple обеспечивает сквозное шифрование для защиты безопасности и конфиденциальности пользовательских данных.
  • Сторонний LLM: используется для чатов с вопросами и ответами общего назначения. Приложения, такие как Siri, подключаются к внешним моделям, таким как ChatGPT.

Если не произойдет ничего неожиданного, в рамках последнего сотрудничества с Alibaba модель Qwen, скорее всего, будет интегрирована в экосистему iPhone в двух формах. Одна из них, по сути, представляет собой подключаемый модуль, предоставляющий полнофункциональные услуги искусственного интеллекта в качестве стороннего LLM.

Эта стратегия соответствует подходу Apple к интеграции ChatGPT на зарубежных рынках. Но поскольку его сотрудничество с OpenAI не является эксклюзивным, и такие модели, как Google Gemini или Claude, могут быть интегрированы в зарубежные iPhone в будущем, на внутренний рынок также могут быть представлены модели искусственного интеллекта отечественного производства.

Второй — сотрудничать с Alibaba для развертывания и разработки усовершенствованной версии небольшой модели. В отличие от DeepSeek V3/R1, который ориентирован на сверхбольшую модель 671B, Qwen использует комплексный подход. Даже известная компания DeepSeek решила построить 4 из 6 своих небольших моделей дистилляции с открытым исходным кодом на основе Qwen, что само по себе является лучшим подтверждением технической мощи Alibaba.

В качестве отступления: хотя компания Deepseek выпустила Janus-Pro-7B, мультимодальную модель, превосходящую OpenAI DALL·E 3, в настоящее время DeepSeek не поддерживает мультимодальные возможности на стороне C. И Qwen действительно хорош, когда его нет у других, и неплохо, когда он есть у других. Недавно выпущенный Qwen 2.5 Max также входит в число наиболее конкурентоспособных мультимодальных моделей высшего уровня.

Стоит отметить, что есть и прорывы в технологии сжатия моделей. В 2024 году китайские производители добились значительного прогресса в оптимизации моделей искусственного интеллекта, используя новейшие технологии количественного анализа и сокращения, чтобы значительно оптимизировать шкалу параметров, обеспечивая при этом качество продукции.

Например, по данным Canalys, MiLM2 от Xiaomi сократил параметры своей модели с 6 миллиардов до 4 миллиардов, в то время как Honor и vivo также сократили параметры своей модели с предыдущих 7 миллиардов до 3 миллиардов соответственно. Тонги Цяньвэнь также использует структурированное сокращение для сжатия модели параметров 7B до 2,2B, сохраняя при этом значительные возможности понимания и генерации.

На уровне инструмента Apple Core ML Tools также поддерживает количественную оценку весов модели, что позволяет снизить точность с плавающей запятой 32 по умолчанию до 16, 8 бит, 7 бит или даже 1 бита. Это не только значительно уменьшает объем памяти и потребление вычислительных ресурсов модели, но также повышает стабильность процесса вывода и надежность результатов.

Процесс квантования не меняет точность промежуточных тензоров, которые обычно поддерживаются на уровне точности с плавающей запятой 32 или с плавающей запятой 16, а веса деквантуются во время выполнения, чтобы соответствовать точности промежуточных тензоров, тем самым повышая точность результатов вывода.

Еще в прошлом году благодаря ряду технологий оптимизации, включая низкобитную планизацию, квантование активации, встроенное квантование, эффективное обновление кэша KV и использование инструментов Talaria для анализа задержек и энергопотребления, модель Apple 3B, работающая на iPhone 15 Pro, достигла задержки всего 0,6 миллисекунды для первого токена и могла генерировать 30 токенов в секунду, обеспечивая плавность работы.

Конечно, конечная цель Apple Intelligence — создать настоящего помощника искусственного интеллекта системного уровня.

Маленькие модели — это билет, а экология — главный козырь. Экосистема Alibaba охватывает электронную коммерцию, платежи, местные услуги и развлечения. После углубленного сотрудничества с искусственным интеллектом iPhone в будущем пользователи смогут беспрепятственно выполнять весь процесс бронирования услуг с помощью простых голосовых команд. Ожидается, что для дальнейшего расширения сценариев применения будут использоваться ресурсы таких предприятий, как DingTalk.

Конкуренция среди мобильных телефонов с искусственным интеллектом переходит от чисто технической конкуренции к конкуренции экологической интеграции и пользовательского опыта. Производителям необходимо работать вместе в трех измерениях: локальная вычислительная мощность, облачные возможности и экологическая синергия, чтобы создавать телефоны с искусственным интеллектом, которые действительно впечатляют пользователей.

Судя по реакции рынка, это сотрудничество намного превзошло ожидания. Будь то популярность DeepSeek или «брак» между Apple и Alibaba, это утверждение верно: настоящий мастер подобен реке, текущей на восток, кажущейся спокойной и тихой, но скрывающей в себе великую силу.

# Добро пожаловать на официальную общедоступную учетную запись WeChat aifaner: aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.

Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo