Усовершенствованная модель OpenAI «Project Strawberry» наконец-то появилась
После нескольких месяцев спекуляций и ожиданий OpenAI выпустила производственную версию своей продвинутой модели рассуждения Project Strawberry , которая была переименована в «o1». К нему присоединяется «мини-версия» (как и GPT-4o), которая предложит более быстрое и оперативное взаимодействие за счет использования более обширной базы знаний.
Похоже, что o1 предлагает смешанный набор технических достижений. Это первая модель рассуждения OpenAI, разработанная для использования человеческой дедукции для ответа на сложные вопросы по предметам, включая естествознание, программирование и математику, быстрее, чем это могут сделать люди.
Например, во время тестирования o1 сдали квалификационный экзамен на Международную олимпиаду по математике. В то время как его предшественнику, GPT-4o , удалось правильно решить только 13% представленных задач, o1 правильно решил 83% из них. В онлайн-соревнованиях Codeforces o1 набрал 89-й процентиль. Более того, o1 может отвечать на вопросы, которые ставили в тупик предыдущие модели (например, «что больше, 9,11 или 9,9?»). Однако компания ясно дает понять, что этот выпуск является лишь предварительной версией всех возможностей модели-новичка.
Новый o1 «был обучен с использованием совершенно нового алгоритма оптимизации и нового набора обучающих данных, специально предназначенного для него», — рассказал The Verge руководитель исследования OpenAI Джерри Творек. Сообщается, что, используя комбинацию обучения с подкреплением и рассуждений «цепочки мыслей», o1 делает более точные выводы, чем его предшественник. «Мы заметили, что эта модель меньше галлюцинирует», — сказал Творек, — однако «мы не можем сказать, что разгадали галлюцинации».
Подписчики ChatGPT-Plus и Teams смогут протестировать o1 и o1-mini начиная с сегодняшнего дня. Подписчики Enterprise и Edu должны получить доступ к следующей неделе.
Компания заявляет, что o1-mini в конечном итоге станет доступна для пользователей бесплатного уровня, но не уточнила сроки. Разработчики заметят резкое увеличение цен на API для o1 по сравнению с GPT-4o. Доступ к o1 будет стоить 15 долларов за миллион входных токенов (по сравнению с 5 долларами за миллион для GPT-4o) и 60 долларов за миллион выходных токенов, что в четыре раза больше, чем плата 4o в размере 15 долларов за миллион. Реальный вопрос заключается в том, считает ли новая модель, что слово «клубника» содержит две буквы R или три .