Под волной DeepSeek, катализатора инноваций конечного ИИ

В платоновской «Республике» есть метафорический рассказ о пещере. Группа заключенных с детства была заперта в пещере лицом к стене, а позади них горел огонь. Заключенные всю свою жизнь видели только тени, отражающиеся на стене, и думали, что эти тени и есть реальный мир.

Большие модели также были введены в заблуждение подобными «тенями» и когда-то считали нормой предварительную подготовку, способную творить чудеса. До тех пор, пока DeepSeek R1 не продемонстрировал возможности рассуждения в начале 2025 года, ИИ перешел от стадии простого наблюдения за тенями к исследованию истинных знаний интроспективным и диалектическим способом.

DeepSeek позволяет моделям выбраться из «пещеры», а также меняет парадигму умных терминалов.

Модель дистилляции DeepSeek была реализована на коммерческих терминалах, оснащенных платформой Snapdragon, менее чем через две недели после ее выпуска. Аппаратное обеспечение искусственного интеллекта больше не будет просто «сексуальной историей» для повышения стоимости, но уже имеет реальную прикладную ценность и коммерческий потенциал.

В последнем информационном документе Qualcomm «Трансформация искусственного интеллекта способствует инновациям в области вывода на стороне терминала» отмечается, что запуск DeepSeek знаменует собой вступление ИИ в эпоху инноваций в области вывода. Сокращение затрат на обучение, быстрое развертывание вывода и инновации для периферийных сред способствуют распространению высококачественных небольших моделей и ускорению внедрения ИИ на периферийных терминалах.

Лю Чжиюань, доцент Университета Цинхуа, соучредитель и главный научный сотрудник Wall-Facing Intelligence, также предположил, что этот переход от «прежде всего масштабирования» к «прежде всего эффективности» является важным источником вдохновения для искусственного интеллекта на устройствах: благодаря сжатию моделей, оптимизации параметров и инновациям алгоритмов можно значительно снизить требования к вычислительным ресурсам, сохраняя при этом производительность модели, что делает ее пригодной для работы на терминальных устройствах.

Модель Qwen-7B, созданная с помощью DeepSeek, смогла работать на одном уровне с самой совершенной облачной моделью GPT-4o, выпущенной в прошлом году.

Это также означает, что многие модели, которые в прошлом могли обрабатывать только крупномасштабные параметры в облаке, могут быть развернуты на портативных терминальных устройствах для локального выполнения сложных процессов рассуждения и даже могут работать на полную мощность. В то же время, в условиях новой волны искусственного интеллекта на устройствах, мы наблюдаем еще один ключевой переход в интеллектуальных терминалах — от чисто функциональных устройств к агентам с автономным пониманием и возможностями действий.

Технологический переломный момент ИИ на устройстве: от «прежде всего масштабирования» к «эре инноваций на основе логических выводов»

Два года назад Билл Гейтс опубликовал блог, в котором сообщил, что за свою жизнь он был свидетелем двух революционных демонстраций. Первая была в 1980 году, когда он увидел графический интерфейс пользователя (GUI), предшественник современных операционных систем, а вторая — когда он увидел, как ИИ отвечает за несколько месяцев до GPT-3.5.

Однако рядовые пользователи, очевидно, не так сильно воспринимают это изменение, поскольку носитель интерактивных изменений не может быть отделен от интеллектуальных терминалов, точно так же, как iPhone превратил операции кнопок в эпоху обычных телефонов в сенсорное взаимодействие, тем самым изменив всю экосистему смартфонов.

Так что же это за носитель в эпоху ИИ?

Возможно, это не обязательно новая форма терминала, а новая форма опыта, которую привносят умные терминалы – от управления приложениями до управления агентами.

Как и новая тенденция, упомянутая генеральным директором Qualcomm Анмоном в конце прошлого года, искусственный интеллект — это новый пользовательский интерфейс (UI). Внедрение конечного ИИ изменит традиционную логику взаимодействия.

Пользователю не нужно открывать конкретное приложение, а ИИ-агент может напрямую выполнять задачи посредством мультимодального ввода (голос, изображение, видео). Эти функции фактически неотделимы от поддержки ИИ на периферийной стороне.

Например, многие интерактивные функции агента YOYO в серии Honor Magic7 требуют поддержки возможностей обработки искусственного интеллекта на стороне терминала. NPU Qualcomm Hexagon, оснащенный Snapdragon 8 Extreme Edition, обеспечивает достаточную вычислительную мощность искусственного интеллекта на стороне терминала для выполнения задач искусственного интеллекта, таких как рассуждение и понимание локально на телефоне.

В прошлом ИИ на стороне устройства был ограничен производительностью оборудования, но требования к вычислениям для больших моделей быстро растут. Хотя смартфоны, оснащенные Snapdragon 8 Extreme Edition, могут запускать на устройстве модели масштаба 7B, некоторые сложные сценарии использования и задачи генеративного ИИ, такие как генерация высококачественных изображений, по-прежнему необходимо сочетать с мощью облачных вычислений.

Однако сейчас наступил технический переломный момент в развитии искусственного интеллекта на стороне устройства.

  1. Текущие передовые небольшие модели искусственного интеллекта уже обладают превосходной производительностью. Благодаря дистилляции моделей и новой сетевой архитектуре производительность превзошла более крупные модели, которые год назад могли работать только в облаке.
  2. Размеры параметров модели быстро уменьшаются, а передовые методы квантования и сокращения позволяют разработчикам уменьшать размер модели, сохраняя при этом точность.
  3. Разработчики могут создавать более функциональные приложения на периферии, такие как суммирование текста, помощники по программированию и перевод в реальном времени.
  4. Пусть «Агент» станет новым порталом взаимодействия, а персонализированные мультимодальные ИИ-агенты упростят взаимодействие.

Ма Деджиа, старший вице-президент и генеральный менеджер подразделения технологического планирования и периферийных решений компании Qualcomm Technologies, рассказал iFaner, что, поскольку масштаб моделей продолжает уменьшаться, модели с масштабом параметров 1–2 миллиарда в будущем будут занимать меньше оперативной памяти и лучше адаптироваться к терминалам с настройками памяти 8–12 ГБ.

Гетерогенная вычислительная архитектура: аппаратная основа конечного ИИ

Qualcomm Technologies располагает тремя ведущими в отрасли процессорами, которые очень важны для разработки конечного искусственного интеллекта.

Ма Децзя сказал: «У нас есть лучшие в отрасли специальные процессоры Qualcomm Oryon, и мы применили их на наших ПК, мобильных и автомобильных платформах».

Графический процессор Qualcomm Adreno может удовлетворить многие функциональные требования, необходимые для работы ИИ на стороне терминала, кроме того, Qualcomm Hexagon NPU полностью предназначен для обработки генеративных рабочих нагрузок ИИ;

Эти три основных процессорных блока должны обладать лучшими в отрасли возможностями и иметь возможность работать вместе для достижения гетерогенных вычислений и удовлетворения потребностей в разработке генеративного искусственного интеллекта. Qualcomm имеет очень сильное преимущество в этой области.

Внедрение ИИ на стороне терминала выдвинуло более высокие требования к архитектуре чипов. Подход Qualcomm заключается в интеграции NPU, GPU и CPU в гетерогенную вычислительную архитектуру терминала, тем самым обеспечивая более высокую вычислительную мощность при более низком энергопотреблении и удовлетворяя потребности задач обработки ИИ в различных сценариях.

Ядром этой архитектуры является взаимодействие трех основных процессорных блоков, подобное симфоническому оркестру:

  1. Процессор Oryon собственной разработки Qualcomm. В новейшем процессоре Oryon второго поколения используется 3-нм техпроцесс TSMC с максимальной основной частотой 4,32 ГГц и большой кэш-памятью (крупнейший в отрасли кэш-память второго уровня объемом 24 МБ), что позволяет значительно сократить задержку вывода ИИ.
  2. Графический процессор Qualcomm Adreno: отвечает разнообразным функциональным требованиям для операций искусственного интеллекта на стороне терминала и особенно хорошо работает при параллельных вычислениях и обработке изображений.
  3. Qualcomm Hexagon NPU: разработан специально для обработки генеративных рабочих нагрузок искусственного интеллекта, что позволяет Snapdragon 8 Extreme Edition добиться повышения производительности искусственного интеллекта на 45 % и повышения энергоэффективности искусственного интеллекта на 45 %.

Среди них процессор Oryon повторно используется в мобильных телефонах и автомобильных чипах. Это означает, что эти терминальные устройства могут использовать общую базовую архитектуру, иметь лучшую совместимость, а взаимодействие друг с другом будет более плавным.

Эта гетерогенная вычислительная архитектура была отражена во многих новейших флагманских телефонах Snapdragon 8 Extreme Edition. iQOO 13 использует вычислительную мощность ИИ Snapdragon 8 Extreme Edition для создания механизма обработки сигналов ИИ для киберспорта. Он интеллектуально оптимизирует сеть с помощью ИИ для достижения более низкой задержки в многозадачных сценариях. Он может играть в игры во время видео или прямой трансляции.

REDMI K80 Pro применяет технологию искусственного интеллекта для подключения, обеспечивая мультисетевую интеграцию Xiaomi Star AI, которая может выполнять интеллектуальное прогнозирование сигнала и автоматически оптимизировать сеть. В сцене метро задержка видео WeChat снижается на 31%, а задержка короткого видео снижается на 29%.

Если интеллектуальные терминалы вступили в эпоху агентов, то гетерогенная вычислительная архитектура представляет собой «центральную нервную систему» ​​интеллектуального агента. Она не только обрабатывает различную сенсорную информацию, но также координирует «мышление» и «действия», чтобы обеспечить эффективную, плавную и стабильную работу конечного ИИ.

Программное обеспечение также является ключом к раскрытию потенциала конечного ИИ.

Точно так же, как высокопроизводительные гонки требуют не только мощного двигателя, но и точной настройки и отличного водителя. Реализация искусственного интеллекта на устройстве не только опирается на мощные вычислительные мощности оборудования, но также требует эффективной и полной поддержки программных инструментов.

Для разработчиков фактически нет необходимости знать конкретные детали конструкции аппаратного обеспечения. Что более важно, так это поддержка библиотеки программных инструментов, которая позволяет им свободно и гибко выбирать необходимую среду, среду выполнения и инструменты в соответствии со своими потребностями, а также разрабатывать приложения и агенты искусственного интеллекта для любой операционной системы.

Предоставляя аппаратную основу, Qualcomm также создает стек программного обеспечения для искусственного интеллекта, включая библиотеки, SDK и инструменты оптимизации, которые могут упростить развертывание моделей и повысить производительность.

Разработчики могут использовать эти ресурсы для эффективной адаптации моделей к платформам Qualcomm и сокращения времени вывода на рынок приложений с поддержкой искусственного интеллекта. Независимо от того, насколько мощной является вычислительная мощность конечного ИИ, она может быть реализована только через приложения и в конечном итоге преобразована в пользовательский опыт.

В практических приложениях вы можете поднять трубку, чтобы определить ингредиенты, которые вы будете использовать для приготовления. После успешной идентификации телефон может помочь вам создать соответствующие рецепты, а также вы можете попросить телефон предоставить вам несколько низкокалорийных комбинаций меню.

После приготовления вы можете с помощью камеры узнать на телефоне, сколько калорий содержится в пище. Поскольку смартфоны теперь поддерживают мультимодальные возможности искусственного интеллекта, этот вариант использования может быть полностью реализован на стороне устройства.

Этот сценарий представляет собой типичное применение интеллектуальных агентов в качестве новой платформы: пользователям больше не нужно открывать несколько приложений, они могут напрямую выполнять сложные задачи посредством естественного взаимодействия.

Эта стратегия, ориентированная на разработчиков, значительно упростила процесс интеграции расширенных функций ИИ в потребительские и коммерческие продукты, а также ускоряет применение инноваций в области рассуждений ИИ на стороне устройства.

AI Hub становится сундуком с сокровищами для разработчиков

В настоящее время многие производители смартфонов, ПК и автомобилей интегрировали DeepSeek в терминальные устройства и начали практику использования высококачественных небольших моделей для обновления возможностей искусственного интеллекта на стороне терминала или создания новых приложений искусственного интеллекта. Инновации в периферийных приложениях искусственного интеллекта готовы к взлету.

Если вы разработчик, у вас также есть более острая необходимость во внедрении ИИ на чиповых платформах в различных сегментах. Qualcomm AI Hub, выпущенный Qualcomm в прошлом году, сделал большой шаг вперед, позволив разработчикам выбирать соответствующую платформу и модель разработки, писать приложения и, наконец, развертывать их на разных типах мобильных терминалов.

Qualcomm AI Hub содержит более 100 предварительно оптимизированных моделей искусственного интеллекта, таких как Llama, Allam 3B, Tongyi Qianwen, OpenAI и модели других производителей, и поддерживает плавное развертывание на терминалах, оснащенных платформой Snapdragon. Спустя год после его выпуска более 1500 компаний в настоящее время используют его , что еще больше способствует популяризации приложений искусственного интеллекта на стороне устройства.

Число терминалов, охватываемых AI Hub, также увеличивается. Ма Деджиа рассказал нам, что Qualcomm AI Hub может поддерживать мобильные платформы, ПК, IoT, автомобили и даже сетевые терминальные платформы Wi-Fi, такие как платформа Qualcomm Robot RB3 второго поколения, роботизированная платформа для области IoT.

Qualcomm становится строителем экосистемы искусственного интеллекта на стороне устройства. Благодаря активному сотрудничеству с мировыми производителями моделей искусственного интеллекта Qualcomm не только предоставляет мощную вычислительную платформу, но также разрабатывает полный стек программного обеспечения и инструменты разработки, позволяющие разработчикам легче интегрировать модели искусственного интеллекта в приложения.

Прежде чем действительно наступит эра интеллектуальных терминалов агентов, отрасли необходимо создать полноценную экосистему искусственного интеллекта на стороне устройства.

Qualcomm становится главным архитектором искусственного интеллекта на стороне устройства

Во времена династии Суй в Китае родился Ю Вэнькай, инженер-строитель с многолетней репутацией. Он не только спланировал сеть водных путей, идущих с севера на юг, но и новаторски спроектировал систему шлюзов для решения технических проблем, связанных с прохождением судов между разными уровнями воды. Используйте систематическое мышление «генерал будет процветать, засор будет уменьшаться», чтобы объединить разрозненные реки в взаимосвязанную транспортную сеть.

Это очень похоже на унифицированную и эффективную вычислительную основу, предоставляемую Qualcomm для искусственного интеллекта на стороне устройства. Подобно тому, как строительство Гранд-канала потребовало преодоления множества проблем, таких как рельеф местности и гидрология, ИИ на устройстве сталкивается с более разнообразными и сложными требованиями со стороны различных оконечных устройств и различных сценариев применения. Сюда входят не только ограничения производительности оборудования, но и множество ограничений, таких как размер модели, энергопотребление и задержка.

Чтобы по-настоящему интегрировать ИИ в эти разнообразные терминалы, как Ю Вэнькай планировал строительство Большого канала, необходим «главный архитектор», который сможет выполнить проектирование на высшем уровне и создать мощную базовую архитектуру для поддержки его эффективной работы. Эта архитектура должна не только обрабатывать огромные объемы данных, но и гибко адаптироваться к различным сценариям применения.

Этот переход от конкретного к абстрактному, от техники к технологии на самом деле отражает основной контекст развития человеческой цивилизации.

Наследственной сущностью человеческой цивилизации является процесс дистилляции информации. От пословного копирования в средние века и систематической структуры информационного века до эпохи рассуждения ИИ, очистка информации приняла новую форму — модели развивают способности рассуждения посредством обучения с подкреплением, как младенцы понимают мир посредством непрерывного самоисследования.

Как и Qualcomm AI Hub, упомянутый ранее, создаваемая им предварительно оптимизированная библиотека моделей позволяет разработчикам применять модели, адаптированные для терминальных устройств, к технической основе мобильных телефонов, ПК, автомобилей и других терминалов Qualcomm.

Облегчение моделей — ключ к популяризации конечного ИИ. Модели дистилляции DeepSeek уже можно запускать непосредственно на смартфонах и ПК на платформе Snapdragon. Этот технологический прорыв аналогичен конструкции водосберегающих ворот в проекте Гранд-Канала, которая обеспечивает максимальную эффективность движения при минимальном потреблении ресурсов.

В то же время инновации в рассуждениях ИИ стремительно набирают обороты.

Исследовательская фирма Counterpoint Research прогнозирует, что 2025 год станет ключевым переломным моментом для телефонов с генеративным искусственным интеллектом.

Генеративная технология искусственного интеллекта становится стандартной функцией мобильных телефонов среднего и высокого класса. Ожидается, что глобальный уровень проникновения мобильных телефонов с генеративным ИИ увеличится с 19% в 2024 году до 29% в 2025 году, а поставки составят около 400 миллионов единиц. К 2027 году ожидается, что поставки мобильных телефонов с генеративным ИИ достигнут 550 миллионов единиц (что составит 43% от общего рынка).

Кроме того, ожидается, что масштабы производства периферийных чипов искусственного интеллекта в мире вырастут с 7,6 млрд долларов США в 2023 году до 25,2 млрд долларов США в 2027 году (средний темп роста 27,1%), причем основными областями роста станут автомобили, промышленный Интернет вещей и медицина.

Qualcomm превращается в главного архитектора конечного ИИ.

Возможности конечного искусственного интеллекта внедряются в каждый уголок терминала, от смартфонов до автомобилей, от XR-гарнитур до ПК. Формируется технологический «Большой канал», который соединяет различные терминалы и способствует свободному потоку аналитических данных.

# Добро пожаловать на официальную общедоступную учетную запись WeChat Aifaner: Aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.

Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo