ИИ-единорог Step Star завершил финансирование на сотни миллионов долларов, и отечественный ИИ-шесть драконов вышел в финал

APPSO стало известно, что крупная модель-единорог Step Star недавно завершила финансирование серии B на сотни миллионов долларов. Основными инвесторами этого раунда финансирования являются Шанхайская государственная компания Capital Investment Co., Ltd., а ее фондами являются Tencent Investment, Wuyuan Capital и Qiming Venture Partners.

Сообщается, что это финансирование будет использовано для дальнейшего продвижения исследований и разработок базовых моделей, укрепления возможностей мультимодального и комплексного рассуждения, а также расширения охвата сценариев применения C-стороны с помощью продуктов и экологии, предоставляя пользователям богатый и разнообразный пользовательский опыт.

Данные показывают, что во второй половине 2024 года количество обращений к мультимодальному API Step Star выросло более чем в 45 раз . За последние 10 месяцев Step Star выпустила в общей сложности 11 базовых моделей собственной разработки, среди которых модели серии Step неоднократно занимали «№ 1 в Китае» в авторитетных списках крупных моделей в стране и за рубежом .

Серия базовых моделей Step Star, ориентированная на «триллионы + мультимодальные перевозки», разрабатывается быстро, и их характеристики остаются ведущими на внутреннем рынке . В настоящее время все больше и больше разработчиков создают более богатые функции и возможности приложений C-end на основе мультимодальных больших моделей, а также исследуют и реализуют новые сценарии потребления с помощью собственных приложений искусственного интеллекта.

Стратегия компании вращается вокруг сценариев, которые «имеют реальные потребности» и «могут принести инновации в пользовательском опыте», уделяя особое внимание «супермоделям» + «суперприложениям» за счет сочетания самоисследований и экологического сотрудничества, а также возможностей своей базы. большие модели, ориентированные на создание инновационного опыта для пользователей C-конца.

С точки зрения базовой модели Step Star — один из немногих крупных модельных стартапов в Китае, сформировавший полный спектр модельных матриц от понимания до генерации, от текстовых до мультимодальных . В будущем компания будет настаивать на предварительном обучении и продолжит воздействие на AGI (искусственный интеллект).

Что касается продуктового бизнеса, Step Star запустила интеллектуального помощника Yuewen , который поддерживает мультимодальное взаимодействие. Его мультимодальная интеллектуальная функция визуального поиска «Вопрос по фотографии» — первая функция в Китае, интегрированная в кнопку управления камерой iPhone 16. .

Разработчики создают более богатые функции и возможности приложений C-side на основе своей мультимодальной большой модели . Приложение искусственного интеллекта интернет-знаменитостей « Книга желудка » может помочь пользователям быстрее и интереснее записывать свой рацион; приложение психологического исцеления искусственным интеллектом « Комната исцеления лесом » реализует мультимодальное взаимодействие между пользователями и лечебными продуктами.

В области интеллектуальных терминалов Step Star также сотрудничает с ведущими производителями мобильных телефонов, такими как OPPO и Honor, для разработки технологий крупных моделей в области создания контента. Step Star достигла стратегического сотрудничества с China Online и China National Knowledge Infrastructure, чтобы Узнайте, как использовать технологию больших моделей. Стимулируйте производство и спрос на различные сценарии создания контента.

В области финансов и экономики крупномасштабная модельная технологическая компания «Caiyue Xingchen», соучредителем которой является Jiemian Finance Association, запустила вертикальную крупномасштабную модель финансовой индустрии « Finstep » и частную модель C-side, которая может предоставить пользователям функции такие как интеллектуальный анализ данных с помощью искусственного интеллекта и интерпретация финансовых отчетов. Помощник по богатству « Маленький бог богатства ». Кроме того, Step Star также сотрудничала с Taijunan и Jiemian Finance Association для запуска первой в отрасли крупномасштабной мультимодальной вертикальной модели ценных бумаг с сотнями миллиардов параметров — « Большой модели Junhong Lingxi ».

Цзян Даксин, основатель и генеральный директор Step Star, планирует, что путь компании к реализации AGI — это « единая модальность — мультимодальность — объединение мультимодального понимания и поколения — мировая модель — AGI ». Поскольку конкуренция среди отечественных больших моделей «Шесть маленьких драконов» продолжает усиливаться, Class Star продолжит прилагать усилия как к базовым моделям, так и к продуктам C-конца, стремясь охватить несколько областей и предоставлять более совершенные продукты больших моделей для различных групп пользователей. .

В дополнение к своему богатому бизнесу по производству продуктов C-конца, Step Star также выпустила серию крупногабаритных моделей общего назначения Step с превосходными характеристиками. Ниже приводится краткое описание продукта:

  • Шаг 1 : Большая языковая модель с сотнями миллиардов параметров, с логическими рассуждениями, знанием китайского и английского языков, математикой и производительностью кода, превышающей GPT-3.5;
  • Шаг-1V : Мультимодальная большая модель, точно понимает изображения, текст, данные, диаграммы и обладает возможностями создания контента, логических рассуждений, анализа данных и т. д.;
  • Шаг-1X : Большая модель создания изображений с сильным семантическим пониманием и возможностями творческой реализации изображений;
  • Step-Video : большая модель генерации видео, которая поддерживает генерацию видео высокой четкости 1080P и 10 с. Она хороша для семантического понимания, выполнения инструкций, создания движений и эстетики в китайском стиле;
  • Step-tts-mini : воспроизведение речи и создание крупных моделей. Загрузите 5 секунд аудио для точного воспроизведения индивидуальных тембральных характеристик и эмоций;
  • Step-Asr : большая модель распознавания речи, которая может распознавать различные акценты и точно преобразовывать их в текст;
  • Шаг 2 : Большая языковая модель с триллионами параметров, использующая архитектуру MoE, с строгим контролем над деталями генерации языка и выдающейся способностью понимать и следовать человеческим инструкциям. Она занимает первое место в Китае и пятое место в мире по оценке LiveBench. список;
  • Шаг-1,5 В : Итеративная версия большой мультимодальной модели с более сильными возможностями мультимодального понимания, реализующая переход от понимания изображения к пониманию видео;
  • Step-1.5v-turbo : Модель понимания видео, точно идентифицирует видеообъекты, персонажей и окружающую среду, понимает атмосферу видео и эмоции персонажей, а также обладает сильной способностью следовать командам;
  • Шаг 1o Аудио : большая сквозная голосовая модель со 100 миллиардами параметров, поддерживает смешанный ввод и вывод голоса и текста, быстро реагирует и может обеспечить естественный интерактивный опыт с высоким IQ и высоким EQ;
  • Step-1-flash : Чрезвычайно быстрая версия большой модели, используемая для решения задач в общих областях, поддерживает длину контекста 8 КБ, низкую задержку первого слова и высокую скорость вывода.

# Добро пожаловать на официальную общедоступную учетную запись WeChat Aifaner: Aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.

Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo