Выпущена новая модель, приближающаяся к GPT-4! «Европейская версия OpenAI» объединилась с Microsoft, но была подвергнута сомнению как нарушающая первоначальное намерение

28 февраля, 2024 Дядя Влад

Вчера вечером компания Mistral AI, известная как «Европейский OpenAI», выпустила свою новейшую модель генерации текста верхнего уровня — Mistral Large.

Эта модель обладает возможностями рассуждения верхнего уровня и может использоваться для решения сложных задач рассуждения на нескольких языках, охватывающих понимание текста, преобразование и генерацию кода.

Просто нарисуйте ключевые моменты:

Контекстное окно размером 32 КБ для точного извлечения информации из большого документа.
Возможности точного выполнения команд позволяют разработчикам настраивать стратегии аудита.
Поддерживает ограничения на вызовы функций и режимы вывода, что помогает масштабировать разработку приложений и модернизировать технологические стеки.
Встроенная поддержка английского, французского, испанского, немецкого и итальянского языков с глубоким пониманием грамматики и культурных особенностей.

Прилагаем адрес опыта: https://chat.mistral.ai/chat

Mistral AI снова расширяет свои возможности

Mistral Large показал хорошие результаты во многих тестах производительности, став второй наиболее широко используемой моделью в мире по API, уступая только GPT-4 и оставляя позади другие основные модели.

По сравнению с LLaMA 2 70B, GPT-4, Claude 2, Gemini Pro 1.0 и другими основными моделями Mistral Large демонстрирует сильные способности к рассуждению.

В многочисленных тестах здравого смысла и рассуждения, таких как MMLU, Hellas и WinoG, Mistral Large соответствует GPT-4 и намного превосходит другие модели.

Mistral Large показывает значительно лучшие результаты, чем LLaMA 2 70B, в тестах HellaSwag, Arc Challenge и MMLU на французском, немецком, испанском и итальянском языках.

Mistral Large также хорошо показал себя в программировании и математических задачах. Многие бенчмарк-тесты еще далеко впереди.

Кроме того, Mistral AI также выпустила новую модель, оптимизированную по задержке и стоимости, Mistral Small, которая превосходит Mixtral 8x7B по производительности, но имеет меньшую задержку.

По мнению Mistral AI, Mistral Small станет идеальным средним выбором между моделями с открытым исходным кодом и флагманскими моделями, обладая теми же инновационными преимуществами, что и Mistral Large, особенно с точки зрения поддержки RAG (Retrival Augmentation Generation) и вызовов функций.

Однако характеристики малой задержки, заявленные моделью Mistral Small, ограничены по сравнению с Mixtral 8x7B, но ее стоимость значительно увеличена: входная стоимость выше в 2,8 раза, а выходная – в 8,5 раза.

Mistral Large теперь доступен на платформах La Plateforme и Azure и интегрирован в Le Chat. Le Chat (буквально переводится как «кошка» с французского) — это чат-бот с искусственным интеллектом, похожий на ChatGPT, который поддерживает многоязычное общение.

Пользователи могут выбирать между тремя различными моделями: Mistral Small, Mistral Large и Mistral Next. Однако Le Chat не поддерживает сетевые функции в реальном времени.

Вскоре после запуска Le Chat потерпел крах из-за того, что на него собралось больше, чем ожидалось, людей, и на момент публикации Le Chat снова заработал и работает.

Мы также впервые испытали Le Chat. В зависимости от сложности самого языка, а также количества и качества получаемых обучающих данных, Le Chat более выразителен на английском языке и может варьироваться от языка к языку на других языках.

Столкнувшись с китайской головоломкой, Мистраль Лардж явно немного растерялся и некоторое время не давал ответа.

Вопрос: Бабочка, муравей, паук, многоножка, они работают вместе, кому в итоге не платят?

Но если вы переключите его на английский, он сразу же превратится в эксперта по решению проблем. Ответы ясны и логичны, и он вырастет до «человекоцентрированного взгляда на работу и вознаграждение». Однако в китайском контексте это головоломки. не следуйте здравому смыслу.Ведь «Мороконожка» не вознаграждена.

Проблема проживания цыплят и кроликов в одной клетке для «Мистраль Лардж» непростая задача. После постановки линейных уравнений ответ пришел быстро, но 16 цыплят и 19 кроликов в ответе были неправильными.

Вопрос: В одной клетке сидят цыплята и кролики, всего голов 35, ног 94. Сколько всего цыплят и кроликов?

Это классическая математическая задача, которую можно решить с помощью системы линейных уравнений.
Предполагая, что количество цыплят равно x, а количество кроликов равно y, можно записать следующие два уравнения:
1. х + у = 35 (общее количество кур и кроликов 35)
2. 2x + 4y = 94 (у курицы 2 ноги, а у кролика 4 ноги, всего 94 ноги)
Выразите x в первом уравнении как функцию от y, чтобы получить x = 35 – y, и подставьте его во второе уравнение, чтобы получить:
2(35 – у) + 4у = 94
Решение уравнения дает нам y = 19. Подстановка x = 35 – y дает нам x = 16.
Следовательно, цыплят 16, а кроликов 19.
Последние два вопроса можно решить аналогично: ответ: 16 кур и 19 кроликов.

Затем мы попросили ChatGPT задать Mistral Large тестовый вопрос по математике, который был более интенсивным, но в целом результат оказался хорошим:

Маленькая модель, большое достижение

Mistral AI была основана в мае прошлого года со штатом всего 25 сотрудников, но ее большая языковая модель уже прославилась на Hugging Face.

Ранее мы сообщали, что она выпустила Mixtral 8x7B. Как только эта модель была запущена, она мгновенно взорвала сообщество открытого исходного кода и не давала спать бесчисленному множеству разработчиков по ночам.

Хотя размер параметра у него всего 46,7B, производительность Mixtral 8x7B, которая хороша как на малых, так и на больших размерах, во многих тестах сравнима с Llama 2 70B и GPT-3.5, а в некоторых даже немного лучше.

Секрет успеха Mistral AI заключается в умной интеграции трех основных элементов в области искусственного интеллекта — талантов, данных и вычислительной мощности.

The Economist сообщил, что основатели и технические специалисты Mistral AI пришли из элитных технических институтов Франции и накопили ценный отраслевой опыт в исследовательских лабораториях таких технологических гигантов, как Google и Meta. Они одни из немногих экспертов в мире, которые действительно умеют обучать передовым модельным технологиям.

Во-вторых, данные — еще одно волшебное оружие для успеха Mistral AI. Mistral уникален в обучении данных модели. Например, модель может эффективно фильтровать повторяющуюся или бессмысленную информацию, что делает модель более упорядоченной и эффективной с масштабом параметров всего в миллиарды.

Это означает, что обычные пользователи могут даже легко запускать модели Mistral AI на своих персональных компьютерах.

По случаю появления Mistral Large лауреат премии Тьюринга Ян ЛеКун, старший научный сотрудник NVIDIA Джим Фан и другие известные личности также отправили поздравления с X.

В настоящее время стоимость Mistral AI превысила 2 миллиарда долларов США, а инвестиционный состав, стоящий за ней, не уступает инвестициям ведущих мировых компаний.

От ведущих компаний венчурного капитала в США, таких как Lightspeed Venture Capital, Redpoint Venture Capital и Index Venture Capital, до гигантов венчурного капитала Кремниевой долины a16z, NVIDIA, Salesforce, BNP Paribas и т. д., все они отдают предпочтение Mistral AI. После нескольких раундов финансирования Mistral AI уже вошел в ряды ИИ-единорогов.

Вчера Microsoft также объявила о новом партнерстве с Mistral AI, пообещав, что сотрудничество с Mistral AI будет сосредоточено на следующих трех ключевых областях:

Суперкомпьютерная инфраструктура. Microsoft будет поддерживать Mistral AI через суперкомпьютерную инфраструктуру Azure AI для обучения ИИ и рабочих нагрузок вывода.
Расширенный рынок: Microsoft и Mistral AI сделают передовые модели Mistral AI доступными для клиентов через каталог моделей MaaS и машинного обучения Azure в Azure AI Studio.
Исследования и разработки в области искусственного интеллекта: Microsoft и Mistral AI будут изучать возможности сотрудничества для разработки собственных моделей для избранных клиентов, даже для рабочих нагрузок европейского государственного сектора.

Но этот шаг Microsoft был подвергнут сомнению пользователями сети. Пользователь X @osxzxso намекнул, что Microsoft пытается применить «сложную» стратегию, чтобы монополизировать рынок. Маск также выразил свое согласие в разделе комментариев, отправив ошеломляющий смайлик.

Я вижу, как намазываю Нутеллу на обе стороны хлеба.
Я видел арахисовое масло, намазанное на обе стороны хлеба.

Стоит отметить, что осторожные пользователи сети заметили, что после того, как Mistral AI выпустила новую модель, соответствующий контент на ее официальном сайте о ее приверженности сообществу открытого исходного кода незаметно исчез, а новая модель не поддерживает открытый исходный код.

Однако генеральный директор Mistral Менш заявил в интервью Wall Street Journal, что Mistral AI не нарушил первоначальное намерение сделать открытый исходный код, а принял двойную стратегию: одновременно продвигать стратегии коммерциализации и поддерживать обязательства по открытому исходному коду.

Очевидно, нам необходимо найти тонкий баланс между построением бизнес-модели и сохранением наших ценностей открытого исходного кода. Мы хотим изобретать что-то новое и новую архитектуру, а также предоставлять нашим клиентам более востребованные продукты.

# Добро пожаловать на официальную общедоступную учетную запись aifaner в WeChat: aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.

Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo