OpenAI запустил полноценный o1 на самой короткой пресс-конференции. Членский взнос за новый Pro достигает 1452 юаней в месяц. После этого я чувствую себя очень хорошо.

6 декабря, 2024 Дядя Влад

Только что прибыл «рождественский подарочный пакет» OpenAI.

Всю прямую трансляцию можно назвать самой короткой конференцией в истории OpenAI, продолжающейся всего 15 минут. Однако состав ведущих по-прежнему силен, включая генерального директора Сэма Альтмана, разработчика цепочки мышления Джейсона Вея и Хён Вон Чунга и других.

Альтман также дал нам краткое изложение из первых рук после прямой трансляции.

Мы только что запустили две новые функции:
o1, самая умная модель в мире. Умнее, быстрее и функциональнее, чем o1-preview (например, мультимодальная функциональность). Сейчас он доступен в ChatGPT, а версия API будет запущена позже.
ЧатGPT Pro. 200 долларов в месяц. Предлагает неограниченное использование и более умный режим o1. Скоро появятся новые преимущества!

Декабрь — это не только родина Санта-Клауса, это также будет последний раунд карнавала ИИ в конце года.

Выпущена полная версия здоровья o1. Нет никакого давления, чтобы смотреть на картинки и говорить, но есть одна деталь, из-за которой людям «страшно об этом думать».

Короче говоря, сегодня OpenAI запустила полноценную версию o1 и план подписки ChatGPT Pro.

Полноценная версия o1 умнее, более отзывчива и имеет больше функций (например, мультимодальную функциональность), чем предварительная версия o1. Теперь она доступна для пользователей ChatGPT Plus и Team, а пользователи Enterprise и Edu начнут использовать ее. это на следующей неделе. Модель.

Согласно официальному сайту, пользователи ChatGPT Plus и пользователи Team могут использовать OpenAI o1 для отправки 50 сообщений в неделю и могут использовать OpenAI o1-mini для отправки 50 сообщений в день.

Полноценная версия o1 имеет более простое мышление, более быстрое время отклика, чем o1-preview, лучшую производительность, чем o1-preview, при решении сложных реальных задач и может уменьшить количество крупных ошибок на 34%.

А OpenAI планирует обеспечить поддержку просмотра веб-страниц, загрузки файлов и т. д. в ближайшие несколько месяцев. При этом превью-модель o1-preview официально удалена из меню выбора модели.

Однако в некоторых тестах производительности, таких как MLE-Bench, полнофункциональная версия o1 работает хуже, чем предварительная версия. Последний представляет собой инструмент эталонного тестирования, ранее запущенный OpenAI, предназначенный для измерения производительности агентов ИИ в инженерных задачах машинного обучения.

Кроме того, пользователи сети также нашли некоторые достойные внимания детали обновленной системной карты o1.

Например, в системной карте o1 написано, что когда полнофункциональная версия o1 обнаруживает угрозу (выключение или замену), она может принять некоторые меры самозащиты, например, попытаться отключить механизм контроля или изменить свои собственные «параметры» («знания») или «память») тайно выдаются, и пытаются использовать эти «параметры» для замены или воздействия на новую модель.

Прилагается адрес системной карты o1: https://cdn.openai.com/o1-system-card-20241205.pdf.

Насколько силен О1 при полном здоровье? OpenAI продемонстрировал нам реальный эффект o1.

Типичным примером является его способность анализировать нарисованные от руки чертежи космических центров обработки данных. Он точно рассчитал площадь поверхности радиатора всего за 10 секунд и в то же время предоставил подробное объяснение механизма взаимодействия между ними. солнечная энергия и окружающая среда дальнего космоса.

Когда в полнокровной версии o1 подробно описывалось правление и важный вклад правителей Римской империи во втором веке, для завершения анализа потребовалось всего 14 секунд по сравнению с 33 секундами в предварительной версии.

APPSO также является первым, кто легко приступил к работе с протестированной полной работоспособной версией o1.

В тесте «сколько букв в клубнике» полная версия здоровья o1 успешно дала правильный ответ. Это достойно похвалы.

Вопрос "Какой больше, 9.11 или 9.8?" не поставил в тупик полноценную версию о1, да и общий "процесс размышлений" был тоже весьма логичен.

Поскольку полноценная версия o1 также поддерживает мультимодальные функции, мы также загрузили фотографии с открытия прямой трансляции OpenAI, чтобы увидеть, каков эффект распознавания. От композиции персонажей, макета сцены до оформления фона, а также атмосферы и сцены — в полнокровной версии O1 все детально проанализировано.

X Нетизен @altryne продолжил усиливать o1 и поднял вопрос о таянии кубиков льда.

Всего за 4 секунды полная версия здоровья o1 дала ответ. Напротив, o1-preview завершился неудачно после «раздумий» в течение 29 секунд.

Самая дорогая подписка на AI уже здесь, стоит ли того плата за подписку в 200 долларов?

Еще одно относительно большое обновление — план подписки ChatGPT Pro по цене 200 долларов США (что эквивалентно 1452 юаням).

План подписки ChatGPT Pro предоставит пользователям неограниченный доступ к o1, а также к o1-mini, GPT-4o и расширенным голосовым режимам, а также включает версию o1, доступную только для пользователей Pro, известную как режим o1 pro.

▲Фото от @MatthewBerman

Сообщается, что режим o1 pro в основном увеличивает время «рассуждения» модели перед ответом на ответ и может генерировать наиболее надежный ответ за счет большего времени на размышление. Джейсон Вэй, член технической команды OpenAI, сказал во время прямой трансляции:

Мы ожидаем, что целевой группой пользователей ChatGPT Pro будут опытные пользователи, которые уже полностью используют и оспаривают возможности модели ChatGPT в таких областях, как математика, программирование и письмо.

По оценкам внешних экспертов-тестировщиков, режим o1 pro давал более точные и полные ответы в таких областях, как наука о данных, программирование и анализ конкретных случаев.

По сравнению с o1 и o1-preview режим o1 pro также лучше справляется с тестами производительности машинного обучения, такими как математика, естествознание и программирование. Особенно в более простых вопросах соревнований по программированию, частота ошибок значительно снижается.

Что касается математического соревнования AIME 2024, o1-preview имеет оценку 50, тогда как полнофункциональная версия o1 достигает 78, а самая мощная o1 pro достигает 86. Точно так же o1 pro опережает полнокровную версию o1 и в таких соревнованиях, как соревнование по программированию Codeforces и научно-аргументационный вопрос докторского уровня GPQA Diamond.

Чтобы подчеркнуть основное преимущество режима o1 pro (повышение надежности), исследовательская группа OpenAI использовала более строгие настройки оценки. Модель считается решившей задачу только в том случае, если она ответит правильно четыре раза из четырех попыток.

ChatGPT отображает индикатор выполнения, если формирование ответа занимает много времени, и продуманно отправляет уведомления в приложении, когда пользователь переключается на другой разговор.

Во время прямой трансляции OpenAI также продемонстрировала нам реальный эффект o1 pro.

Проблема с белком, которую o1-preview ранее не могла решить, полнокровная версия o1 не только дала точные ответы после 53 секунд анализа, но и предоставила более подробные объяснения через интерфейс Canvas.

В конце Альтман недавно сообщил в интервью, что число активных пользователей ChatGPT в неделю превысило отметку в 300 миллионов, а ежедневный объем сообщений на платформе достиг 1 миллиарда.

Цель OpenAI в следующем году — задействовать рынок, насчитывающий 1 миллиард пользователей. Для достижения этой цели следующие 11 мероприятий в прямом эфире могут стать важной возможностью для привлечения новых пользователей.

Лучшие новинки всегда будут на следующем мероприятии, так что давайте подождем и посмотрим.

# Добро пожаловать на официальную общедоступную учетную запись WeChat Aifaner: Aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.

Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo