Byte выпускает большое семейство моделей Doubao, которые могут произвести три копии «Романа трех королевств» за один доллар, а цена на 99% дешевле, чем в отрасли.

Что можно купить за один доллар?

На состоявшейся сегодня утром весенней конференции по движущей силе двигателей Volcano Engine Force 2024 года президент Volcano Engine Тан Дай дал неожиданный ответ.

За один юань можно купить 1,25 миллиона жетонов основной модели Дубао, что составляет около 2 миллионов китайских иероглифов, что эквивалентно трем книгам «Романа трёх королевств».

Ценовая война начинается! Byte выпускает большую модель кресла-мешка

Ключевые проблемы при реализации сценариев больших моделей заключаются в эффектах модели, затратах на выводы и сложности реализации.

Чтобы помочь предприятиям решить эти проблемы и использовать более совершенные модели, более низкие затраты и более простые в реализации решения, помогающие предприятиям добиться трансформации искусственного интеллекта, Volcano Engine сегодня официально запустил новое поколение полнофункциональных сервисов искусственного интеллекта.

Хорошая технология должна применяться в больших масштабах и постоянно оттачиваться с помощью большого количества обращений.

Год назад модель кресла-мешка, ранее известная как «Жаворонок», стала одной из первых крупных моделей в Китае, зарегистрированных с помощью алгоритма.

После года итеративной разработки большая модель Дубао в настоящее время обрабатывает 120 миллиардов токенов текста и генерирует более 30 миллионов изображений в день.

Начиная с сегодняшнего дня модель Doubao будет официально представлена ​​внешнему миру через Volcano Engine.

Семейство моделей, выпущенное на этот раз, включает универсальную модель Doubao pro, универсальную модель lite, ролевую модель, модель распознавания речи, модель синтеза речи, модель диаграммы Винсента и другие модели.

Среди них Beanbao Big Model Pro является самым сильным представителем модели beanbao. Он обладает превосходной производительностью во многих измерениях, таких как понимание логики генерации и памяти. Он поддерживает контекстные окна 128 КБ и может помочь пользователям быстро понимать длинный и сложный текстовый контент.

В некоторых сценариях для клиентов, которые чувствительны к задержкам и затратам, лучшим выбором будет универсальная модель lite с погремушками.

Благодаря использованию ролевых моделей, будь то роль учителя сычуаньского диалекта или продвижение интерпретации сценария, фактическая демонстрация на месте очень проста.

Голос — важная часть взаимодействия с ИИ.

Модели распознавания речи и модели синтеза речи могут точно идентифицировать контент, язык и контекст пользователя, а благодаря изучению тембра, тона и интонации большие модели могут выражать реальные эмоции, позволяя ИИ общаться как настоящие люди.

Большой объем использования может улучшить хорошую модель и значительно снизить стоимость единицы вывода модели. Сегодня Volcano Engine превратился в «ценового мясника», принеся шок на миллиард пунктов на рынок крупных моделей.

Цены на модели с одинаковыми характеристиками на рынке обычно составляют 0,12 юаней/тысячу токенов, в то время как входная цена вывода модели универсальной модели Doubao pro-32k составляет всего 0,0008 юаней/тысячу токенов, что на 99,3% ниже отраслевой цены.

Или, входная цена модели Pro-128k общей модели Doubao составляет 0,005 юаней/тысячу токенов, что на 95,8% ниже, чем цена в отрасли, что действительно обеспечивает инволюцию цен «от центов до центов».

Кроме того, чтобы помочь предприятиям лучше внедрять приложения для больших моделей, Тан Дай также объявил о запуске платформы Volcano Ark 2.0 и выпустил три плагина для больших моделей:

  • Сетевой плагин: поиск соответствующей информации по данным во всей сети.
  • Плагин контента: предоставление богатого видео и графического контента.
  • Плагин базы знаний: поддерживает тонкую настройку собственных данных для максимального уменьшения иллюзий ИИ.

Ориентация на приложения, реализация – это путь

Благодаря платформе разработки, основанной на искусственном интеллекте, у нас есть возможность сделать каждого разработчиком приложений искусственного интеллекта.

На пресс-конференции Тан Дайди красноречиво высказал это суждение. Будучи платформой для создания приложений искусственного интеллекта нового поколения, пользователи могут быстро создавать на Button различные боты на основе моделей, независимо от того, есть ли у них навыки программирования или нет.

Более того, пользователи также могут публиковать ботов на различных социальных платформах, в коммуникационном программном обеспечении или развертывать их на других каналах, например на веб-сайтах.

На открытии пресс-конференции был продемонстрирован ИИ-бот пятиклассника. Он использовал знания китайского языка, полученные в школе, для создания ИИ-бота, которого можно назвать учителем английского языка.

В корпоративных средах, где требуются более широкие возможности сценариев приложений, Haidilao использует кнопки для имитации упражнений по диалогу с клиентами, чтобы помочь сотрудникам службы поддержки клиентов повысить уровень обслуживания.

Super Orangutan использует Kouzi, чтобы помочь пользователям понять, как улучшить физическую форму; China Merchants Bank создал на основе Kouzi мобильного дисконтного бота, который рекомендует рестораны в дисконтных магазинах и анализирует рыночные условия…

Бот, созданный Button, поддерживает смешанное взаимодействие в нескольких режимах, таких как текст, изображения, голос, видео, карты графического интерфейса и т. д. Пользователи могут даже общаться с ботом голосом, как в чате с реальным человеком, и он всегда будет отвечать в самым разумным и естественным способом каждый запрос пользователя.

Кроме того, Huoshan Engine также официально выпустила Kouzi Professional Edition — в соответствии с потребностями предприятий Huoshe Engine дополнительно инкапсулирован на основе платформы Kouzi и поддерживает множество расширенных функций.

За последние десять лет или около того ByteDance, которая лучше всех понимает эпоху мобильного Интернета, всегда, казалось, была в состоянии создать популярный продукт и незаметно стала тем гигантом, которым она является сегодня.

Самое впечатляющее в этой конференции то, как ByteDance понимает применение и разработку продуктов в эпоху больших моделей.

Чжу Цзюнь, вице-президент по продуктам и стратегии, сказал, что вместо запуска кода на сервере более важно создать соответствующие формы продуктов и естественные методы взаимодействия, которые удовлетворят реальные потребности пользователей и побудят пользователей по-настоящему захотеть использовать эти продукты.

На пресс-конференции Чжу Цзюнь раскрыл происхождение названия кресла-мешка.

«Дубао», который, кажется, имеет мало общего с ИИ, на самом деле является первым общим принципом, который был определен при его первом названии: простота, легкость чтения и легкость запоминания.

В то же время, чтобы сократить расстояние между продуктом и пользователем, они внутри компании определили три принципа дизайна продукта для таких продуктов, как кресла-мешки: персонификация, близость к пользователю, встраивание в среду использования пользователя и персонализация.

За последний год ByteDance провел много исследований в области приложений для крупных моделей, и его самое большое ощущение заключается в том, что по сравнению с тем, что было до эпохи искусственного интеллекта, в создании приложений есть как общие черты, так и большие различия.

Так что же общего? Основные потребности человека фактически не изменились. Например, потребность быстро и удобно получать информацию не изменилась, и нам необходимо совершенствоваться в работе…

По его мнению, в прошлом было относительно легко создавать продукты, потому что, по крайней мере, базовая технология была зрелой и стабильной, поэтому вам просто нужно было использовать свое сочувствие и думать о том, каковы потребности пользователей. Но в эпоху больших масштабов. модели, это было совершенно другое.

Новая трудность заключается не только в том, чтобы рассмотреть, что может сделать большая модель в данный момент, но, что, возможно, более важно, в том, чтобы угадать, какие новые пользовательские сценарии можно реализовать через 3 месяца, 6 месяцев или два года.

Так что это новая задача, и также необходимо постоянно прогнозировать PMF следующего продукта в условиях динамичного технологического развития.

На примере поисковой системы искусственного интеллекта Чжу Цзюнь сообщил, что в первой половине прошлого года при выполнении задачи оценочного поиска он часто отвечал неправильно на 6 вопросов из 10, а это означает, что сценарий поискового приложения совершенно несостоятелен. , с развитием возможностей модели, теперь задачи поиска ИИ По крайней мере, сегодня можно использовать.

Такая трансформация с нуля, от юзабилити к оптимизации, — это не только прорыв на техническом уровне, но и результат глубокого понимания потребностей пользователей.

Согласно отчету McKinsey, к 2030 году глобальный экономический прирост, обусловленный большими моделями, достигнет 49 трлн юаней, из которых экономический прирост Китая достигнет 14 трлн юаней.

Огромный экономический прирост включает в себя не только повышение существующей эффективности работы с помощью крупных моделей, но также новые сценарии и новые бизнес-форматы, вызванные новыми технологиями. Исследование ByteDance — это микрокосм реализации приложений искусственного интеллекта, а также общая тема, над которой должна задуматься вся отрасль.

И именно это неоднократно подчеркивал Тан Дай на этой пресс-конференции. Хорошие модели должны использоваться всеми и каждой компанией.

# Добро пожаловать на официальную общедоступную учетную запись WeChat aifaner: aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.

Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo