Разговор с Виво Ху Байшанем: Индустрия мобильных телефонов является наиболее типичной новой производительностью, прототип MR можно будет увидеть в этом году

В последнюю неделю 2024 года Ай Фанер и другие представители СМИ пришли в штаб-квартиру vivo в Дунгуане и провели непринужденную беседу с Ху Байшанем, исполнительным вице-президентом и главным операционным директором vivo, и поговорили о структуре рынка, процессах и приложениях искусственного интеллекта. и о будущем направлении и планировании продуктов vivo, включая мысли о рынке складных экранов, планы и мнения о MR-очках, гуманоидных роботах и ​​очках искусственного интеллекта, а также о сильных сторонах vivo: визуализации.

Ниже приводится краткое изложение диалога на уровне продукта (диалог был отредактирован Ай Фанером для удобства чтения):

В телефото и видео еще есть возможности для совершенствования, но искусственному интеллекту мобильных телефонов еще предстоит пройти долгий путь.

Вопрос: Что вы думаете о нынешней ситуации с искусственным интеллектом? Сможет ли искусственный интеллект заменить изображения в качестве аргумента номер один для мобильных телефонов в будущем? Качество изображения флагманских телефонов подошло к концу?

Ху Байшань: Давайте сначала поговорим об изображениях. Наша конечная цель — заменить большинство сцен, используемых зеркальными камерами. Я говорю о сценах. Так что его потолок все еще очень высок.

Я также ранее говорил, что основная камера X200 Pro была уменьшена с 1 дюйма до 1/1,28 дюйма на флагмане предыдущего поколения, но пользовательский опыт не ухудшился. Причина отсутствия снижения заключается в процессоре обработки. мощность и алгоритм обработки изображений значительно улучшились. Это иллюстрирует проблему. Пользовательский опыт основной камеры достиг хорошего уровня. Если мы ставим оценку, предполагая, что зеркалка с обычным фокусным расстоянием составляет 100 баллов, то наша основная камера теперь близка к 80–85 баллам.

Но с точки зрения телефото и видео разрыв с зеркальными все еще относительно велик. Если и дальше забивать, то основная камера 80 на 85, а телевик около 60, еле проходя.

В сцене концерта с фокусным расстоянием 10x наш X200 Pro все еще в порядке. То есть, когда вы сидите на улице, при 20x фокусном расстоянии можно четко видеть, кто этот человек, но пользователь все равно не работает. Не осмелюсь поделиться фотографией с Moments, потому что ею немного сложно пользоваться, но я могу использовать ее 10 раз.

Что касается телеобъектива, изображения, полученные с помощью мобильного телефона, относительно далеки от зеркальных. Через 3-5 лет vivo сможет улучшить телефото до уровня 80 баллов. Такая возможность все еще существует. Хотя использование внутреннего пространства мобильных телефонов достигло своего предела, где еще есть возможности для улучшения? Светочувствительные возможности датчиков изображения можно продолжать совершенствовать с помощью технологий, а большие модели и алгоритмы формирования изображений также могут быть значительно улучшены. Вот почему я уверен, что vivo в будущем достигнет 80 баллов в телефото.

Съемка изображений относительно статична, поэтому область действия алгоритма будет намного шире, но видео динамично, и если к видео добавить кучу алгоритмов, это приведет к огромному давлению на энергопотребление. Конечно, здесь есть возможности для улучшения. Чип сейчас составляет 3 нм, а следующее поколение будет чипами SoC 2 нм, и в будущем даже специализированные чипы обработки изображений улучшатся. На следующем шаге мы также будем использовать возможности алгоритма больших моделей на видео, но общая логика видео является динамической, поэтому возможности благословения алгоритма все равно будут слабее.

Будь то телефото или видео, пользователям еще предстоит пройти долгий путь, прежде чем пользователи смогут удовлетворить свои высокие требования. Сама технология еще имеет много возможностей для развития, поэтому обработка изображений по-прежнему будет в центре внимания будущих флагманских телефонов.

Говоря об ИИ, это правда, что за последние два года были произведены большие модели, и ИИ там все еще быстро развивается. Возвращаясь к самому мобильному телефону, ИИ все еще имеет свои ограничения. Самая большая проблема мобильных телефонов — недостаточная вычислительная мощность. Я разделил ИИ мобильных телефонов на три этапа:

Первым этапом является расширение возможностей ИИ в некоторых прошлых функциях. Например, в последний период самой популярной вещью во всей индустрии мобильных телефонов было устранение ИИ. Эта функция существует уже более десяти лет, и она существует. существовал в эпоху функциональных технологий, но в то время алгоритм был относительно низкоуровневым, и его всегда делали плохо.

В прошлом возможности распознавания речи с использованием методов глубокого обучения могли иметь вероятность успеха только 90%. При таком показателе успеха вы обнаружите, что разговор не может быть завершен в течение нескольких раундов, а искажение в каждой ссылке слишком велико. . Генеративная большая модель остается прежней после ее выхода, а способность распознавания речи и способность семантического понимания сразу значительно улучшаются. Раньше у нас была функция под названием «Телефонный секретарь», которая впервые была запущена на NEX 3. Как только люди услышали о ней, они поняли, что это сделано традиционным ИИ, и повесили трубку, сказав несколько слов. Теперь, благодаря ИИ, никто не может сказать, что ИИ говорит за короткий период времени.

Все они основаны на улучшении определенной функции или определенного модуля. Они не просто немного отличаются от общего искусственного интеллекта (AGI), но и сильно отличаются.

Второй этап, я думаю, — это интеграция возможностей больших моделей в систему. Например, когда мы раньше искали настройку функции, мы вообще не могли ее найти, потому что пунктов меню было слишком много и они сбивали с толку. В будущем искусственный интеллект и системы будут тесно связаны, что позволит телефону четко понимать ваши намерения и то, что делать дальше, что сделает взаимодействие с телефоном более интеллектуальным. Например, «Атомный остров», который мы только что попробовали, предназначен для того, чтобы узнать ваши намерения и найти решения. Этот этап будет длиться относительно долго, поскольку пользовательский опыт на этом этапе и текущие вычислительные мощности едва ли могут его удовлетворить.

Третий этап — это то, что мы назвали PhoneGPT на конференции VDC 2024. Функция, которую мы тогда продемонстрировали, заключалась в заказе на вынос, и мы сказали, что она прошла успешно. На самом деле вероятность успеха каждого шага составляет всего 85%. После трех шагов я больше не могу бежать, и это занимает много времени. Этот опыт — всего лишь модель, а пользовательский опыт совсем не хорош.

Чтобы по-настоящему реализовать требования PhoneGPT, требования к вычислительной мощности не увеличиваются немного, а увеличиваются во много раз. Текущей интегрированной архитектуры, архитектуры упаковки и пропускной способности недостаточно. Для реального PhoneGPT все требования к возможностям заключаются в том, что текущие высокоскоростные хранилища, возможности серверной стороны, возможности полосы пропускания и архитектура SoC должны быть близки к серверной стороне, чтобы иметь возможность быть реализованными.

Это похоже на изображения. Мы видим, что потребности пользователей были созданы. Многие модели работают на облачных серверах. В нашем внутреннем вычислительном центре имеется около 10 000 вычислительных карт. Многие модели могут работать в облаке, например модель с 130B параметрами. но эту шкалу нельзя использовать на мобильных телефонах. Мобильные телефоны могут работать только с параметрами 2B и 3B. Поэтому, по моим оценкам, мобильным телефонам потребуется менее пяти лет, чтобы по-настоящему внедрить PhoneGPT, и он не будет соответствовать требованиям к пользовательскому опыту.

Трек AI в настоящее время находится на втором этапе. Это постепенное улучшение, а не улучшение от 0 до 1. Таким образом, в настоящее время у искусственного интеллекта мало движущей силы для всей волны замены телефонов, поскольку пользователи не чувствуют мутацию от 0 до 1. Происходит только мутация от 0 до 1. Когда пользователи обнаружат, что PhoneGPT может делать так много вещей, они это сделают. Будет сильное желание сменить телефон.

Поскольку я отвечаю как за продукты, так и за технологии, я должен раскрывать информацию о текущем уровне наших технологий или технологий всей отрасли.

Вопрос: В каких аспектах отражается новая производительность в индустрии смартфонов и какие части являются наиболее важными?

Ху Байшань: Индустрия мобильных телефонов является наиболее типичным представителем производительности нового качества. Насколько я понимаю, производительность нового качества воплощает в себе характеристики трех максимумов: высоких технологий, высокого качества и высокой кинетической энергии, а также высокой кинетической энергии. четыре новые характеристики. Если оценивать по этому стандарту, мобильные телефоны попадают в типичную категорию новых производительных устройств. Мы видели, что в течение последних нескольких лет на мобильных телефонах постоянно внедрялись новые технологии.

Два направления, которым мы придаем большое значение, — это направление обработки изображений и направление искусственного интеллекта. В области обработки изображений за последние пять лет каждый смог почувствовать эффекты фотографирования мобильных телефонов в различных условиях. Это процесс быстрого прогресса.

Мобильные телефоны заменили многие цифровые камеры, которые мы использовали в прошлом, в том числе беззеркальные камеры и зеркальные камеры в некоторых сценах. Все больше потребителей готовы платить за более качественную фотографию и готовы платить больше. Покупайте мобильный телефон, чтобы делать более качественные фотографии. .

X100 Ultra и X200 Pro, которые мы выпустим в 2024 году и которые мы назвали «Концертные артефакты», одинаковы. В последние годы было много концертных сцен. Люди проводят различные концерты, и потребители надеются запомнить этот прекрасный момент. Зачем нам мобильные телефоны на концертных сценах? Зеркальные камеры нельзя использовать на сцене концерта, поэтому потребители могут использовать свои мобильные телефоны только для записи прекрасных моментов.

То же самое относится и к направлению ИИ. ИИ только начал развиваться, но на самом деле он расширил возможности мобильных телефонов во многих направлениях. Я думаю, нет никаких сомнений в том, что индустрия мобильных телефонов является представителем новой производительности. Я также верю, что в течение долгого времени мобильные телефоны по-прежнему будут основным продуктом бытовой электроники и могут способствовать повышению производительности.

Прототип Vivo MR можно будет увидеть в следующем году, а на то, чтобы роботы-гуманоиды созрели, уйдет десять лет.

Вопрос: Как продвигается компания vivo в области MR (смешанной реальности) и человекоподобных роботов?

Ху Байшань: Наша MR работает относительно быстро. Команда vivo MR набрала почти 500 человек. Наша цель — примерно сентябрь или октябрь 2025 года. Высокоточные прототипы MR будут доступны в магазинах vivo примерно в дюжине городов по всему миру. Опыт на полке. От первоначального бронирования до опыта на месте формируется стандартизированный процесс, позволяющий каждому испытать его.

С точки зрения коммерциализации нам необходимо взглянуть на всю экосистему MR. Экосистеме MR по-прежнему нужен развлекательный и игровой контент. Потому что vivo — относительно чистая компания, которая не производит контент, поэтому контент зависит от того, сможет ли вся экосистема ему соответствовать по времени. Конечно, множество информации показывает, что индустрия движется в благоприятном направлении. В прошлом их идея заключалась в производстве аппаратного обеспечения. В последнее время их идея заключается не в производстве аппаратного обеспечения, а в разработке программного обеспечения. . Это очень важно для нас.

Мое требование к команде MR состоит в том, что мы должны найти сцены, которые, по нашему мнению, более необходимы. Точка сегментации толпы не имеет значения, но для сегментированной толпы MR незаменима.

Например, впечатления от игр, в которые играют на мобильных телефонах, или игр, в которые играют на консолях, находятся на этом уровне. После появления MR пользователи обнаружили, что эти игры просто отбросы, и их качество значительно улучшилось. За исключением того, что они не носят с собой MR-оборудование, большую часть времени они ищут его всякий раз, когда у них есть время поиграть в игры. Это сценарий, когда оно им просто нужно.

Что касается роботов-гуманоидов, мы также упоминали эту концепцию в прошлом году. Все знают, почему существует такой спрос: старение общества становится все более серьезным.

С точки зрения тенденций, роботы действительно движутся в одном направлении. Мы проанализировали некоторые ключевые направления роботов, одним из которых является пространственное восприятие. Способность пространственного восприятия MR очень сильна. После завершения MR проблем с пространственным восприятием робота не возникнет.

Еще одним требованием к роботу является то, что его руки и ноги должны быть достаточно гибкими, а его мозг должен обладать сильными возможностями принятия решений. Поэтому, чтобы воплотить в жизнь идеального робота для каждого, по нашему собственному мнению, потребуется более десяти лет.

Способность пространственного восприятия и способность принимать решения не будут такими совершенными за короткий период времени, но возможности рук и ног действительно улучшатся относительно быстро, как, например, у промышленных роботов, которые выполняют специальные задачи в особых сценах.

Для создания действительно идеального робота может потребоваться десять или даже пятнадцать лет, но мы можем реализовать его поэтапно. Например, сначала ограничим масштаб: роботы производственной линии могут выполнять «две работы», но мы надеемся выполнить «десять работ». в будущем «Живой» мы тоже наращиваем эту возможность, но производить продукцию не так быстро.

Наша текущая логика такова. Этот тип робота — это то, что мы внутри себя называем требованиями сцены и потребностями пользователей. Требования и требования пользователей относительно ясны, но путь технического решения не совсем ясен. Как и раньше, когда мы говорили об изображениях, пользователи хотят снимать с помощью эталонной зеркальной камеры. Роботы — это ситуация, когда пользовательская сцена достаточно четкая, но технология не соответствует. В ближайшие три-пять лет мы выясним зрелое состояние технологии. На основе зрелого состояния технологии мы сможем создать продукт, способный решать определенные локальные сценарии на данный момент.

Грубо говоря, нам нужно выяснить, какого состояния технологии достигнут в ближайшие три-пять лет, включая возможности искусственного интеллекта. Основываясь на этих технических возможностях, мы делаем некоторые сокращения в идеальном сценарии для удовлетворения потребностей конкретных сценариев. Это некоторые циклы продуктов, которые мы разработали внутри компании.

Вопрос: Сеть индустрии дополненной реальности будет развиваться быстрее. Что вы думаете об этом?

Ху Байшань: Мы так понимаем продукт AR. Прежде всего, с точки зрения потребностей пользователя, очки AR с дисплеями не должны быть очень тяжелыми, сорок или пятьдесят граммов. AR-очки имеют дисплейную часть, на которой отображаются вещи. Эту категорию мы пока не создали. Будем рассматривать очки без дисплея.

Независимо от того, в какой категории мы работаем, мы должны найти срочно необходимые сценарии, о которых я упоминал ранее. Для этой категории они абсолютно необходимы. Некоторое время назад со мной разговаривал коллега по продукту, и я спросил, нужно ли это. важно их найти. Есть ли пользователи и сценарии? Он сказал, что нашел часть этого, и это звучало разумно.

Потому что руки многих пользователей уже заняты, когда они работают. Как насчет другого человека, стоящего позади и обслуживающего его? Если он один и его руки заняты, ему нужно вспомогательное устройство, чтобы компенсировать эту сцену. Ни мобильный телефон, ни другие устройства не могут решить проблему. Поэтому логика позиционирования нашего МР-оборудования такова: эта вещь срочно нужна и незаменима для тех людей. Мы нашли какие-то группы людей. Если продукт быстрый, то он должен появиться к концу 2025 года, если медленный, то. он появится в 2026 году.

Появился спрос на ширмы, и ритм производства изменится.

Вопрос: Рынок мобильных телефонов со складным экраном, который растет уже четыре года, находится в стагнации или даже снижается. Каковы планы Vivo в отношении мобильных телефонов со складным экраном?

Ху Байшань: На складные ширмы вначале могут возлагаться большие надежды со стороны различных производителей, потому что, в конце концов, это огромное изменение формы продукта. Возвращаясь к потребностям пользователей: кто использует складные ширмы?

Для таких людей, как я, старше 45 лет, чьи глаза начали страдать от пресбиопии, складные телефоны теперь решают проблему многих людей, чьи глаза начали страдать от пресбиопии. Чтобы смотреть много новостей или видео, им нужен телефон. гораздо больший экран на своем мобильном телефоне. Это решает проблему, необходимую пожилым людям.

Люди второго типа похожи на всех здесь работающих в средствах массовой информации, которые используют фальцевальные машины и должны обрабатывать много информации, включая меня, которому приходится обрабатывать много электронных писем компании.

Моноблок сначала обрабатывает информацию вертикально, а когда вы нажимаете на него, вам приходится поворачивать его горизонтально. Это не очень хорошо, и шрифты относительно маленькие.

Независимо от того, какая это категория, она решает потребности сегментированных групп. Почему я говорю, что при создании продуктов нам также необходимо выяснить, какие пользователи остро нуждаются. Когда Folding впервые вышел, у большого количества пользователей было желание попробовать что-то новое. Они никогда раньше не использовали его, поэтому попытались его использовать, но после использования обнаружили, что он им не подходит.

У меня есть друг, который сказал, что, кроме чтения WeChat, телефонных звонков и отправки текстовых сообщений, в остальное время на его мобильном телефоне TikTok все еще находится в вертикальном положении. Складной экран на него не влияет. все, он точно не купит складной экран для своего следующего телефона.

После предыдущей разработки от складного экрана остались пользователи, которым он просто нужен. Только что упомянутые два типа пользователей — это те, кто хочет попробовать что-то новое. Емкость рынка первого и второго типов пользователей на самом деле не так уж и велика. Более того, во многих сценариях, таких как игровые сценарии, складные экраны определенно не подходят для использования. Его среда рассеивания тепла хуже, чем у моноблока, а удобство управления не так хорошо, как у моноблока. Поэтому складные ширмы стали продуктом для сегментированных людей. Общий размер этого рынка зависит от размера сегментированного населения. В будущем он может стабилизироваться на уровне около 5 миллионов единиц.

Что касается нас, стоит ли нам это делать? Сделать. Потому что существуют разные группы людей в зависимости от потребностей пользователей, но мы должны это контролировать. Мы сделали две модели одновременно с большой скидкой по сравнению с предыдущим поколением: одну с упором на изображение и производительность, а другую с упором на экономическую эффективность. Мы планировали продать миллионы единиц, но в итоге обнаружили, что все же сделали это. При сотнях тысяч единиц этот масштаб все еще ограничен. Обычно мы будем проводить итерацию раз в год. Мы будем продвигаться в этом темпе и улучшать пользовательский опыт. В конце концов, всегда есть пользователи, которым просто нужен Folding. Например, некоторые пользователи используют один мобильный телефон для ежедневного общения в WeChat и социальных сетях. и еще один мобильный телефон для чтения котировок акций.

Кроме того, что касается небольших складных изделий, то в 2023 году во всем мире вырастет количество небольших складных изделий. В 2024 году доля небольших складных изделий от ведущих брендов отрасли упадет на 30–40%. Vivo в будущем не должна выпускать небольшие складные изделия. .

Цена на флагманские телефоны продолжит расти, но опыт работы с субфлагманскими телефонами уже достаточно хорош.

Вопрос: Цена на флагманские телефоны в этом году немного выросла. Продолжится ли рост цен в следующем году? Какова стоимость и цена vivo Balance?

Ху Байшань: Мы считаем, что рост цен может продолжиться. Есть два фактора, влияющие на рост цен. Первый из них очень очевиден. Флагманская платформа SoC и процесс производства полупроводников будут улучшены, поэтому рост цен неизбежен. Мы также изо всех сил стараемся вести переговоры с производителями SoC, и мы не можем слишком сильно повышать цену. Например, если им придется пожертвовать своей валовой прибылью, мы также пожертвуем небольшой валовой прибылью, чтобы сохранить ее. Или, если рост цен будет медленнее, то это будет 500, и мы увеличим его на 300. , и в следующем году вырастет еще двести.

Второй включает в себя только что упомянутые изображения, такие как телеобъектив, который далек от 80 очков. Мы должны продолжать инвестировать каждый год, хотя пространство остается неизменным, методы реализации, такие как расположение объективов и реализация. модули, изменятся большие изменения. После серьезных изменений норма доходности снизится, а себестоимость каждого продукта увеличится.

Это неизбежная тенденция роста цен на флагманские телефоны. Для большинства обычных пользователей (субфлагманские телефоны сейчас) дела обстоят лучше. Например, на платформе N-1 (субфлагманский телефон, использующий флагманский чип предыдущего поколения) пользовательский опыт значительно улучшился по сравнению с оригиналом. Наши будущие флагманские образы также могут быть развернуты на продуктах платформы N-1, чтобы решить проблему покупательной способности пользователей.

Грубо говоря, если пользователи хотят получить максимальный пользовательский опыт, максимальный опыт работы с изображениями, искусственным интеллектом и играми, мне очень жаль, но им все равно придется заплатить дополнительно пятьсот юаней. Не гонюсь за максимальным опытом, просто средний опыт, хорошо, платформа N-1 также имеет очень хороший внешний вид, конечно, у нее нет такого максимального опыта, но пользователи не хотят играть в самые мощные игры , просто поиграйте в Genshin Impact, N-1 С платформой проблем нет абсолютно. Если при фотосъемке вы не гонитесь за телеобъективом с 20-кратным увеличением для концертов, а если вам нужен 10-кратный, то обычная модель нашей серии X также может удовлетворить вас больше.

Таким образом, пользователи с высокой покупательной способностью и стремлением к максимальному опыту пойдут дальше, но среди нас мы обязательно представим некоторые продукты в подходящих ценовых диапазонах и продукты с лучшим опытом для удовлетворения потребностей пользователей.

В пластиковой теплице судьбы каждая капуста, обработанная слишком большим количеством пестицидов, когда-то мечтала стать экологически чистым органическим овощем.

# Добро пожаловать на официальную общедоступную учетную запись WeChat Aifaner: Aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.

Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo