Попрощайтесь с фальшивым взглядом, теперь цифровые люди наконец могут «думать» и «сотрудничать».
Философ Энди Кларк в книге «Естественный киборг» предположил, что отношения между людьми и технологиями меняются от «использования инструментов» к «симбиотической эволюции».
Цифровые человеческие технологии ускоряют этот процесс: в ваше отсутствие цифровые люди, созданные вашим изображением и голосом, могут общаться и выражать свои мысли 24 часа в сутки. В это время существование «человека» получило новое определение.
Голоса этих ведущих полны энтузиазма, и они рассказывают о продуктах плавно и четко. Если внимательно рассмотреть эти идеальные лица, изменчивые выражения и тона, после просмотра всей прямой трансляции может быть сложно осознать, что это не настоящие люди, а цифровые человеческие якоря, управляемые ИИ.
Данные показывают, что виртуальные цифровые люди заняли 22,7% рынка приложений для цифровых людей, занимая первое место в области потокового вещания электронной коммерции, а их интерактивность и точность постоянно улучшаются.
Сегодня Baidu также представила новое поколение цифровых людей Huiboxing на конференции разработчиков AI Create2025 Baidu. Основатель Baidu Робин Ли также впервые предложил концепцию весьма убедительных цифровых людей.
Цифровые человеческие якоря, наконец, больше не являются «жесткими марионетками», которыми они когда-то были, а открыли новую версию, приближаясь к тому, что сказал Робин Ли: «Каждый — это маркетинговая команда».
Ведущий с искусственным интеллектом наконец-то научился «действовать»
«Сравнимо с реальными людьми» звучит так, как будто это то, что делают все цифровые люди, но только увидев случаи, вы сможете почувствовать «убедительность» этого.
Высокая точность неудивительна. Что действительно удивительно, так это то, что с таким количеством движений, выражений и ответов на различные вопросы, на которые нужно ответить в любой момент, цифровые люди могут выполнять их плавно и беспрепятственно — средства по уходу за кожей можно протирать в мгновение ока, а демонстрации можно проводить одним прикосновением руки.
За этой серией действий стоит некий замысел. На этот раз Huiboxing перешел из режима сценария в режим сценария. Подробный сценарий не только определяет то, что говорят персонажи, но также проектирует сцены, эмоции, тон, действия и т. д. Это обеспечивает высокую степень интеграции и унификации тона, выражения и движений цифрового человека, поэтому цифровой человек может плавно и плавно комбинировать контент и совершать совместные действия.
Реализация режима сценария поддерживается «способностью цифровых людей принимать решения». Другими словами, сегодняшние цифровые люди больше не просто копируют образ и голос реальных ведущих, но также обладают рядом способностей. Например, на основе среды комнаты прямой трансляции вы можете воспринимать сигналы, принимать решения и думать, а также иметь возможность реализовать следующий шаг.
Эта способность является ключом к «очень убедительным» цифровым людям. Использование цифровых людей в прямых трансляциях само по себе не является чем-то необычным. Это также общее направление применения при фактической реализации ИИ. Цифровые якоря уже появились на основных платформах электронной коммерции. Но на тот момент, чтобы цифровые люди выглядели «не пластиковыми» и «не драматичными», я уже приложил все усилия.
В наше время, когда приложения становятся все более распространенными, цифровые люди становятся все более «объемными». Создание цифровых людей для пользователей на основе мультимодальной технологии обычно требует интеграции нескольких модальностей, таких как текст, тон, зрение, движение и даже восприятие эмоций, что приводит к сложным техническим связям. Он включает в себя кросс-модальное слияние и сотрудничество, понимание и генерацию естественного языка, захват и генерацию движения, а также взаимодействие в реальном времени и оптимизацию задержек.
Благодаря турбодвигателю Wenxin 4.5 цифровые люди Huiboxing в прошлом избавились от смущения «подделки на первый взгляд». Изменения и улучшения в реалистичности — это только часть этого: что действительно имеет решающее значение, так это его способность мыслить независимо и принимать решения, а также возможности многоагентного планирования.
Эти возможности действительно определяют опыт продавца и проверяют стоящую за ним техническую мощь.
Когда вы откроете комнату прямой трансляции, поддерживаемую Huiboxing, вы увидите, как ведущий естественным образом поворачивает голову, берет продукт, отображает детали на 360 градусов, и даже жесты и выражения лица точны. Этого гиперреалистичного эффекта достаточно, чтобы заставить задуматься: «Это действительно ИИ?»
Это определение «высокой убедительности» в Baidu: с точки зрения пользовательского опыта и сценариев прямой трансляции цифровые люди уже могут достичь выразительности, сравнимой с реальными людьми, и даже коэффициент конверсии в некоторых сценариях может превосходить реальных людей.
Мобильный телефон превращает вас в «фабрику якорей»
Рост количества цифровых человеческих якорей обусловлен спросом на эффективные и недорогие операционные модели в индустрии прямых трансляций электронной коммерции. Традиционные человеческие ведущие сталкиваются с высокими затратами на рабочую силу и ограниченным рабочим временем, в то время как цифровые человеческие ведущие могут обеспечить круглосуточную непрерывную прямую трансляцию, что значительно повышает операционную эффективность и обеспечивает снижение затрат и повышение эффективности.
Упомянутое здесь «снижение затрат» не только означает, что можно сэкономить на трудозатратах ведущих и помощников вещателей, но также включает в себя ряд затрат на обучение, таких как настройка и тестирование.
Другими словами, платформы и технологические компании усердно работали над совершенствованием мультимодальных технологий, но пользователям также необходимо приложить усилия для изучения и исследования различных операций и вариантов использования. Когда процесс слишком громоздкий, он весьма отпугивающий.
На этот раз последняя мобильная версия Baidu оснащена, возможно, одной из самых практичных инноваций в индустрии прямых трансляций: функцией «начать трансляцию в один клик» .
Если вы зарегистрируетесь, указав номер своего мобильного телефона, и загрузите двухминутное видео, каждый сможет начать собственную цифровую прямую трансляцию одним щелчком мыши на своем мобильном телефоне.
Однако это только отправная точка. После голоса ведущего изображения есть еще и среда комнаты прямой трансляции, особенно разные сценарии и материалы для разных типов продуктов… Это «пороги».
«Трансляция в один клик» — это действительно один клик. Найдя Huiboxing через приложение Baidu, вы можете напрямую увидеть четыре предустановленных типа сценариев. Конечно, вы также можете написать свой собственный. Эти предустановленные сценарии являются лучшим справочником.
Представьте, что продавец ювелирных изделий использует разные стили, чтобы представить один и тот же продукт в 10 залах прямых трансляций одновременно: используя научный стиль для объяснения знаний о драгоценных камнях, используя литературный стиль, чтобы рассказать историю ювелирного бренда, используя стиль продаж, чтобы напрямую затронуть болевые точки пользователей, и напрямую предлагать ценовые скидки.
Настройка сценариев на основе личности ведущего и усиление стиля ведущего — сильные стороны Huiboxing, включая модели Wenxin 4.0, Wenxin 4.5 и DS-R1. Благодаря подробным и простым объяснениям улучшается популяризация контента, пользователи остаются дольше, а конверсия в комнате прямой трансляции увеличивается, и даже горячие точки в Интернете можно отслеживать в режиме реального времени, а текущие горячие темы можно интегрировать в объяснения продуктов.
Справедливости ради, хотя якоря можно увидеть повсюду, выразительность каждого якоря различна, что ограничено его уровнем знаний и уровнем языкового выражения. Цифровые люди больше не ограничены этими условиями. Их запасы знаний могут быть безграничны, а выразительные возможности гибко меняться в зависимости от конкретных ситуаций.
«Нелогичная» ситуация заключается в том, что некоторые торговцы товарами для здоровья и хорошего самочувствия предпочитают использовать цифровых людей. Пин Сяоли, вице-президент Baidu и генеральный менеджер электронной коммерции Baidu, отметил, что запрещенные слова могут появляться из-за того, что живые ведущие могут оговориться. Цифровые люди могут добиться точного управления при условии оптимизации. Некоторый вертикальный контент можно решить, внедрив базу знаний.
Настройка соответствующей среды, генерация сценариев и гибкая настройка метода трансляции в зависимости от товаров и сцен позволяют действительно и эффективно снизить порог прямой трансляции. Будь то популяризация знаний, обмен опытом или эмоциональная консультация, все это можно прекрасно адаптировать. Каждый пользователь может добиться великолепного превращения из «видео» в «якорный клон». Это наиболее прямая и очевидная ценность и значение, которые приносят технологические инновации.
Прямая трансляция – лучший сценарий для внедрения мультимодального ИИ
Последний отчет IDC показывает, что Baidu Huiboxing занимает первое место по всеобъемлющей силе в области электронной коммерции в прямом эфире цифровых людей. Это не случайно: прямая трансляция электронной коммерции является идеальным сценарием реализации мультимодальной технологии искусственного интеллекта. Здесь визуальный, слуховой и интерактивный опыт идеально интегрированы, а многочисленные преимущества технологии искусственного интеллекта используются в полной мере.
Для индустрии прямых трансляций, которая уже достаточно конкурентоспособна, цифровые человеческие технологии принесли три основных изменения:
1. Прорыв в масштабах
В прошлом году количество цифровых привязок Huiboxing превысило 100 000, что помогло продавцам увеличить средний коэффициент конверсии на 31 % и снизить затраты на запуск на 80 %. Если он есть на сайте Baidu, то при поддержке платформы его можно запустить практически бесплатно.
2. Новая модель взаимодействия человека и машины.
Цифровые люди не просто заменяют настоящие якоря, но могут демонтировать исходную работу якоря и интегрировать исходные процессы. В традиционных прямых трансляциях необходимо сотрудничать операторам и ведущим, а также ассистентам трансляции, полевым диспетчерам и т. д. Цифровые люди эквивалентны совмещению этих ролей, что не может быть более дружелюбным по отношению к малому и микробизнесу.
3. Перейти к любителям
Не все умеют разговаривать на камеру три-четыре часа. Однако технологии цифровых людей помогли большему количеству любителей получить преимущества, предоставляемые ИИ. Он больше даже не ограничивается «создателями видео», а имеет собственный «якорный аватар». Обычные люди также могут реализовать собственную круглосуточную бесперебойную жизнь и вести собственные прямые трансляции.
Среди множества сценариев применения мультимодальной технологии искусственного интеллекта прямая трансляция может быть той областью, которая лучше всего отражает коммерческую ценность технологии. В конце концов, ни один другой сценарий не может одновременно предъявлять такие высокие требования к визуальной точности, естественности голоса, взаимодействию в реальном времени и созданию контента.
Это также отражает то, что самой большой особенностью Baidu Huiboxing является то, что он не только решает проблему «похожести на человека», но и позволяет цифровым людям иметь способность «думать» и «сотрудничать». Это означает, что ИИ не просто имитирует людей, но становится интеллектуальным агентом, который может самостоятельно реагировать на различные ситуации в сценариях прямой трансляции.
Далее, пользователей прямых трансляций ждет разрушительная интерактивная революция. Цифровые люди с высокой убедительностью могут автоматически реагировать, корректировать видеоматериалы в соответствии с атмосферой комнаты прямой трансляции и даже имитировать разминочное взаимодействие с реальными людьми. Этот интеллектуальный опыт меняет ожидания потребителей в отношении прямых трансляций.
Для практиков помощь ИИ позволяет профессионалам сосредоточиться на создании основной ценности. Для любителей, которые все еще ждут, когда технология перестанет ограничиваться несколькими ведущими ведущими, а станет инструментом, которым сможет овладеть каждый, Baidu продвигает демократизированную революцию в создании контента и коммерческом самовыражении.
# Добро пожаловать на официальную общедоступную учетную запись WeChat aifaner: aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.
Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo