OpenAI выпускает самую мощную модель o1! GPT-5, возможно, никогда не наступит, преодолевая узкое место искусственного интеллекта и открывая новую эру.

Без всякого предупреждения OpenAI внезапно выпустила серию моделей OpenAI o1. Согласно официальному технологическому блогу, o1 представляет собой самый сильный уровень искусственного интеллекта с точки зрения способностей к рассуждению.

Генеральный директор OpenAI Сэм Альтман сказал: «OpenAI o1 — это начало новой парадигмы: ИИ, который может выполнять сложные рассуждения общего назначения».

Эта новая модель является важным прорывом в решении сложных задач рассуждения и представляет собой новый уровень возможностей ИИ. Исходя из этого, OpenAI решила переименовать эту серию в OpenAI o1 и начать отсчет с начала.

Не знаю, означает ли это, что название GPT-5 больше не появится.

Краткое изложение особенностей новой модели:

  • OpenAI o1: мощная производительность, подходящая для решения сложных логических задач в различных областях.
  • OpenAI o1 mini: Экономичен и подходит для приложений, требующих рассуждений, но не требующих обширных знаний о мире.

Теперь модель полностью реализована, и вы можете получить к ней доступ через веб-клиент ChatGPT или API.

Среди них o1-preview по-прежнему является предварительной версией, а OpenAI продолжит обновлять и разрабатывать следующую версию. В настоящее время существуют определенные ограничения на использование: o1-preview имеет 30 сообщений в неделю, а o1-mini — 50 сообщений в неделю.

Как и слухи о «Клубнике», эти новые модели ИИ способны рассуждать о сложных задачах и решать более сложные проблемы, чем когда-либо прежде в науке, программировании и математике. Чиновники говорят, что эти расширенные возможности рассуждения будут особенно полезны, если вам нужно решить сложные проблемы в области науки, программирования, математики и многого другого.

Например, исследователи-медики могут использовать его для аннотирования данных секвенирования клеток, физики — для создания сложных квантово-оптических формул, а разработчики — для создания и выполнения многоэтапных рабочих процессов.

Кроме того, серия OpenAI o1 превосходно справляется с созданием и отладкой сложного кода.

Чтобы предоставить разработчикам более эффективные решения, OpenAI также выпустила более быструю и дешевую модель вывода OpenAI o1-mini, которая особенно хороша при кодировании.

Уменьшенная версия o1-mini стоит на 80 % дешевле, чем o1-preview, и представляет собой мощную и эффективную модель, подходящую для сценариев применения, требующих рассуждений, но не требующих обширных мировых знаний.

Во время обучения OpenAI обучает эти модели глубоко думать, прежде чем ответить на вопрос. o1 генерирует внутреннюю цепочку мыслей перед ответом на вопрос, что позволяет ему глубже рассуждать.

Посредством обучения модель OpenAI o1 учится совершенствовать свой образ мышления и продолжает совершенствоваться за счет большего обучения с подкреплением (учитываемого во время обучения) и большего времени на размышления (учитываемого во время тестирования).

Исследователь OpenAI @yubai01 также указал на маршрут обучения 01:

Мы используем RL для обучения более мощной модели вывода. Я так рада быть частью этого путешествия, а оно имеет большое значение!

По имеющимся данным, в тестах эта модель показала себя как аспирант в таких задачах, как физика, химия и биология, особенно в области математики и кодирования.

На квалификационном экзамене Международной математической олимпиады (IMO) GPT-4o решила только 13% задач, в то время как модель вывода набрала 83%. В соревновании по программированию Codeforces его производительность вошла в число 89% лучших в когорте.

Однако, как и в слухах, в ранней версии эта модель еще не имеет некоторых общих функций ChatGPT, таких как мультимодальные возможности, такие как просмотр веб-страниц и загрузка файлов или изображений.

Напротив, GPT-4o более приспособлен для многих распространенных сценариев применения.

Чтобы обеспечить безопасность новых моделей, OpenAI предлагает новый безопасный метод обучения.

В самом строгом «джейлбрейк-тесте» GPT-4o набрал 22 балла (из 100), тогда как модель o1-preview набрала 84 балла, что далеко впереди по уровню безопасности.

Пользователи ChatGPT Enterprise и Edu также получат доступ к обеим моделям, начиная со следующей недели. Соответствующие требованиям разработчики теперь могут использовать обе модели через API с ограничениями поминутной скорости.

Чтобы подчеркнуть здесь важный момент, OpenAI заявила, что в будущем она предоставит доступ к o1-mini всем бесплатным пользователям ChatGPT. Однако есть большая вероятность, что количество раз будет ограничено.

Более подробная информация о новой модели o1 будет предоставлена ​​вам вскоре после более подробного ознакомления. Если у вас есть какие-либо интересующие вопросы, пожалуйста, сообщите нам в области сообщений.

Мои рассуждения далеко впереди, но я до сих пор не могу сказать, какой из них больше, 9,11 или 9,8.

Официальный представитель также выпустил больше демонстрационных видеороликов OpenAI o1.

Например, используйте OpenAI o1, чтобы написать веб-игру по поиску белок. Цель этой игры — управлять коалой, избегать растущего количества клубники и найти белку, которая появится через 3 секунды.

В отличие от традиционных классических игр, таких как Snake, логика игр этого типа относительно сложна и проверяет способность OpenAI o1 к логическому рассуждению.

Или OpenAI o1 начал решать некоторые простые физические задачи посредством рассуждений.

В демонстрации был приведен пример, когда в обычную чашку помещали маленькую клубнику, чашку переворачивали на столе, а затем чашку брали, спрашивали, где будет клубника, и просили объяснить ход рассуждений. Это показывает, что модель способна понимать изменения положения объектов в разных физических состояниях.

При реализации в конкретных приложениях OpenAI o1 также может стать правым помощником врача, например, помогая врачам организовывать и обобщать информацию о случае и даже помогать в диагностике некоторых сложных и сложных заболеваний.

Марио Кренн, квантовый физик, увлекающийся объединением ИИ и науки, также задал модели o1 OpenAI вопрос о применении конкретного квантового оператора. В результате OpenAI o1 также легко с этим разобрался.

Сколько букв "r" в "Клубнике"? GPT-4o даст неправильные ответы, но это не может смутить OpenAI o1. Это достойно похвалы.

Однако после фактического тестирования OpenAI o1 по-прежнему не может решить классическую задачу «Что больше, 9,11 или 9,8?», что приводит к серьезному вычету баллов.

По поводу появления OpenAI o1 Джим Фан, руководитель отдела воплощенного интеллекта NVIDIA, сказал:

Мы, наконец, видим, как парадигма масштабирования времени вывода обобщается и внедряется в производство. Как сказал Саттон (крестный отец обучения с подкреплением) в «Горьких уроках», есть только два метода, которые можно без ограничений масштабировать с помощью вычислений:

Учитесь и ищите. Пришло время обратить внимание на последнее.

По его мнению, многие параметры в больших моделях используются для запоминания фактов, что действительно полезно для «повышения оценок» в контрольном тесте вопросов и ответов. Однако если способность к логическому рассуждению отделена от знаний (памяти фактов), используется small «Ядро вывода» используется для вызова таких инструментов, как браузеры и средства проверки кода, что позволяет сократить объем вычислений перед обучением.

Джим Фан также указал на самое мощное преимущество OpenAI o1, то есть модель o1 может легко стать частью маховика данных.

Проще говоря, если модель дает правильный ответ, то весь процесс поиска можно превратить в набор обучающих данных, содержащий положительные и отрицательные вознаграждения. Такие наборы данных можно использовать для обучения будущих версий модели, и по мере того, как генерируемые обучающие данные станут более точными, производительность модели будет продолжать улучшаться. Хорошая идея — осознать внутренний цикл тренировки себя через собственную игру.

Тем не менее, пользователи сети также обнаружили некоторые проблемы в ходе фактического тестирования. Например, время ответа было намного дольше, хотя на размышления ушло больше времени, были также такие проблемы, как неполные ответы на вопросы и неполные ответы на некоторые вопросы.

Cyber ​​Zen Heart предполагает, что на этот раз o1 может быть агентом GPT-4o после некоторой тонкой настройки/согласования, а общая производительность намного ниже ожидаемой.

Сэм Альтман также признает, что у o1 все еще есть недостатки и ограничения, он производит большее впечатление при первом использовании и меньше после того, как вы проводите с ним больше времени.

Несмотря на это, общая производительность модели OpenAI o1 замечательна.

Теперь выпуск модели OpenAI o1 можно расценивать как повод для войны моделей ИИ во второй половине года. Если не произойдет ничего неожиданного, другие ИИ-компании не будут этого скрывать.

Правильно, я нацелен на старых конкурентов, таких как Anthropic, Meta AI и xAI, а также на некоторых потенциально глубоких темных лошадок ИИ.

Более того, с момента выпуска GPT-4 до настоящего времени глубочайшее значение каждой версии модели OpenAI заключается не в высокой производительности, а в том, чтобы обеспечить эталон для технического маршрута, тем самым побуждая людей двигаться в неизведанные глубокие воды.

GPT-4 такой, и OpenAI o1 надеется быть таким.

# Добро пожаловать на официальную общедоступную учетную запись WeChat aifaner: aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.

Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo