GPT-4.5 выпущен! Самая большая и дорогая модель OpenAI не считает DeepSeek конкурентом

28 февраля, 2025 Дядя Влад

Друзья, не спешите пока отписываться от членства в ChatGPT.

В последнее время Неделя открытого исходного кода DeepSeek идет полным ходом: разработчики по всему миру заняты обменом кодом и поиском вдохновения. С другой стороны, OpenAI выбрала последний день Недели открытого исходного кода, чтобы избавиться от «большого убийцы» GPT-4.5.

Сэм Альтман поделился своим личным опытом работы на платформе X:

Это был первый раз, когда я почувствовал, что ИИ разговаривает с вдумчивым человеком. Он действительно дает ценные советы и даже заставил меня несколько раз откинуться на спинку стула, поражаясь тому, насколько хорошо ИИ может давать ответы.

Однако он также напомнил, что GPT-4.5 не является моделью вывода и не сокрушит другие модели в тестах производительности. Причина, по которой он не появился на пресс-конференции, заключалась в том, что он ухаживал за своими детьми в больнице.

С сегодняшнего дня пользователи ChatGPT Pro имеют доступ к GPT-4.5 (Research Preview). На следующей неделе она будет постепенно открыта для пользователей Plus и Team. На следующей неделе пользователи Enterprise и Edu также смогут испытать эту новую версию.

Опыт очень прост. Вам нужно только переключаться между селекторами моделей в веб-версии, мобильной версии и версии для настольного компьютера.

GPT-4.5 поддерживает поиск в Интернете и может обрабатывать загрузку файлов и изображений, а также может использовать Canvas для написания и программирования. Однако в настоящее время GPT-4.5 не поддерживает мультимодальные функции, такие как голосовой режим, видео и совместное использование экрана.

GPT-4.5 в основном становится умнее за счет «обучения без учителя» (то есть обучения на большом объеме данных самостоятельно), а не за счет сосредоточения внимания на возможностях рассуждения, таких как OpenAI o1 или DeepSeek R1.

Проще говоря, GPT-4.5 знает больше, а серия o1 может думать лучше.

Основные моменты кратко изложены ниже:

Более широкие знания: он изучает больше информации и поэтому понимает больше, чем раньше.
Меньше ерунды: уменьшено количество «галлюцинаций» (когда ИИ выдумывает факты)
Лучшее понимание сердец людей: более высокий «эмоциональный интеллект» и лучшее понимание своих истинных намерений.
Разговоры стали более естественными: общение больше похоже на общение с реальным человеком и менее роботизировано.
Более креативно: лучше работайте в письменной форме и дизайне.

GPT-4.5 официально выпущен, я лучше понимаю ваше сердце

Самое интуитивное изменение GPT-4.5 заключается в том, что он лучше вас понимает.

Это больше похоже на понимающего друга, способного понять ваши последствия и уловить ваши тонкие эмоциональные изменения.

В ходе внутреннего тестирования OpenAI обнаружила, что тестировщики предпочитают ответы GPT-4.5 ответам GPT-4o, считая, что они более естественны, теплы и больше соответствуют привычкам человеческого общения.

В сравнительных оценках с участием тестировщиков-людей GPT-4.5 имеет более высокий процент побед (тест человеческих предпочтений), чем GPT-4o, включая, помимо прочего, творческий интеллект (56,8%), профессиональные проблемы (63,2%) и повседневные проблемы (57,0%).

GPT-4.5, являющаяся крупнейшей и самой богатой знаниями моделью OpenAI на сегодняшний день, расширяет предварительное обучение на основе GPT-4o и призвана быть более общей, чем мощные модели OpenAI, ориентированные на рассуждения в областях STEM.

Прорыв GPT-4.5 во многом обусловлен прогрессом «обучения без учителя».

Проще говоря, обучение без учителя позволяет ИИ самостоятельно учиться на огромных объемах данных, а не полагаться на ручную маркировку данных.

Это все равно, что позволить ребенку увидеть мир самому, вместо того, чтобы взрослые ему все рассказывали. Таким образом, дети могут получить больше и богаче знания и сформировать собственное «мировоззрение».

OpenAI считает, что возможности обучения и рассуждения без присмотра являются двумя столпами развития ИИ.

Благодаря этому GPT-4.5 имеет более широкую базу знаний, более точное понимание намерений пользователя и улучшенный эмоциональный интеллект. Поэтому он особенно подходит для письма, программирования и решения практических задач, уменьшая при этом галлюцинации.

SimpleQA используется для оценки фактичности больших языковых моделей (LLM) при ответах на простые, но сложные вопросы. Точность GPT-4.5 в SimpleQA (чем выше значение, тем лучше) достигает 62,5%, что значительно опережает другие модели OpenAI.

Кроме того, при оценке частоты галлюцинаций SimpleQA (чем ниже значение, тем лучше) GPT-4.5 набрал 37,1%, что также сильно отстает от других моделей OpenAI.

В наборе данных PersonQA GPT-4.5 достиг точности 0,78, что лучше, чем GPT-4o (0,28) и o1 (0,55).

Кроме того, OpenAI провела обширные тесты безопасности GPT-4.5, включая отклонение вредоносного контента, оценку галлюцинаций, обнаружение предвзятости, защиту от джейлбрейк-атак и т. д.: GPT-4.5 показал хорошие результаты в отклонении небезопасного контента, но немного превосходил модель предыдущего поколения с точки зрения чрезмерного отказа.

Что касается многоязычности, GPT-4.5 поддерживает 14 языков, превосходя GPT-4o в оценке MMLU, особенно в языках с низким уровнем ресурсов (таких как суахили и йоруба).

Что касается программирования и разработки программного обеспечения, производительность при выполнении задач генерации и восстановления кода GPT-4.5 улучшилась.

Агентические задачи оценивают способность ИИ самостоятельно выполнять сложные задачи в реальной среде, включая терминальные операции (среда Linux + Python), получение ресурсов (например, автоматическая загрузка, запуск программ) и выполнение сложных задач (например, загрузка и запуск моделей ИИ) и т. д.

Системная карта, выпущенная OpenAI, показывает, что GPT-4.5 по-прежнему имеет определенные ограничения в автономных задачах и далек от действительно автономного агента ИИ.

Помимо обычных пользователей, GPT-4.5 открывает двери и разработчикам.

OpenAI одновременно открыл API GPT-4.5, включая API завершения чата, API помощников и пакетный API.

GPT-4.5 поддерживает вызов функций, структурированные выходные данные, потоковые ответы и системные сообщения, а также имеет визуальные возможности, которые можно обрабатывать посредством ввода изображений.

Разработчики могут интегрировать GPT-4.5 в свои приложения через интерфейс API, чтобы создавать более интересные и полезные продукты.

Однако GPT-4.5 требует больших вычислительных ресурсов и затрат, поэтому он не заменит GPT-4o. Более того, OpenAI все еще оценивает, следует ли предоставлять GPT-4.5 в API в долгосрочной перспективе, чтобы продолжить разработку будущих моделей, одновременно поддерживая текущие функции.

Вступает ли ИИ в эпоху «эмоционального интеллекта»?

Эту прямую трансляцию ведут Миа Глезе, Рафа Гонтихо Лопес, Юлонг Ченг, Джейсон Теплиц и Алекс Пайно.

Когда в демо-версии его попросили написать сердитое текстовое сообщение другу, который часто отменял встречи, GPT-4.5 смог распознать разочарование пользователя и дать более тонкий и конструктивный ответ, помогая пользователю выражать свои чувства более рациональным способом.

Другая демонстрация продемонстрировала способность GPT-4.5 объяснить сложный вопрос: «Почему морская вода соленая?»

GPT-1 совершенно не имел представления об ответе, GPT-2 дал релевантный, но неправильный ответ, GPT-3.5 Turbo впервые дал правильный, но плохо объясненный ответ, GPT-4 чрезмерно детализировал факты, а GPT-4.5 предоставил краткое, связное и интересное объяснение, в котором в начале использовались даже запоминающиеся структуры предложений.

Согласно сообщениям, OpenAI добилась нескольких ключевых инноваций в механизме обучения при разработке GPT-4.5.

Обучение такой крупномасштабной модели требует значительных улучшений в инфраструктуре постобучения, поскольку обучающие данные и размеры параметров на этапах предварительного и постобучения совершенно разные.

Команда разработала новый механизм обучения, который позволяет точно настроить такую большую модель, используя меньшие вычислительные ресурсы.

В частности, они завершили процесс постобучения посредством нескольких итераций, сочетая контролируемую точную настройку и обучение с подкреплением с обратной связью от человека, и, наконец, разработали развертываемую модель.

Что касается предварительного обучения, команда под руководством Алекса и Джейсона предприняла ряд мер для максимального использования вычислительных ресурсов:

Используйте обучение с низкой точностью, чтобы в полной мере использовать производительность графического процессора.
Одновременное предварительное обучение моделей в нескольких центрах обработки данных, поскольку они требуют больше вычислительных ресурсов, чем может обеспечить одна архитектура сети с высокой пропускной способностью.

Кроме того, команда создала новую систему вывода, чтобы модель могла быстро отвечать пользователям ChatGPT и поддерживать плавность разговора. В то же время они заявили, что продолжат совершенствоваться после выпуска, чтобы модель работала быстрее.

Эти инновации в механизмах обучения и развертывания позволяют команде вводить в модель больше вычислительной мощности для достижения массового масштабирования обучения без учителя, что является ключевой причиной, почему GPT-4.5 по-прежнему может демонстрировать четкое понимание и низкий уровень галлюцинаций, не полагаясь на пошаговое рассуждение.

Стоит отметить, что Марк Чен, главный научный сотрудник OpenAI, дал интервью Алексу Кантровитцу перед выпуском GPT-4.5.

Когда его спросили, улучшила ли OpenAI эффективность работы моделей, он ответил:

Процесс повышения эффективности работы модели часто относительно независим от развития основных возможностей модели. Я вижу много работ, посвященных архитектурам вывода. DeepSeek отлично с этим справляется, и мы прилагаем к этому много усилий. Мы очень сосредоточены на том, как предоставить эти модельные услуги всем пользователям по более низкой цене, и прилагаем все усилия, чтобы сократить расходы.
Будь то модель вывода, такая как GPT-4, или другие модели, мы всегда стремимся к более дешевой оптимизации вывода. С момента первого выпуска GPT-4 эксплуатационные расходы сократились на порядки, и мы добились хороших успехов на этом фронте.

Позже, когда его спросили, столкнулся ли действующий Закон о масштабировании с узким местом или наблюдалось ли снижение отдачи от расширения, Марк Чен ответил:

«У меня другое понимание масштабирования. Когда дело доходит до обучения без учителя, вам нужно больше ключевых элементов, таких как вычислительные ресурсы, оптимизация алгоритмов и больше данных. И GPT-4.5 действительно доказывает, что мы можем продолжать развивать парадигму масштабирования, и эта парадигма не противоречит способности рассуждать.

Навыки рассуждения должны основываться на знаниях. Модель не может рассуждать в вакууме, ей необходимо сначала получить знания, а затем на этой основе развивать способности к рассуждению. Поэтому мы считаем, что эти две парадигмы дополняют друг друга и между ними существует взаимоусиливающая петля обратной связи. "

Фактически, GPT-4.5 не только демонстрирует огромный потенциал обучения без учителя, но и предвещает направление развития ИИ, более похожего на человека.

В прошлом развитие ИИ в основном было сосредоточено на улучшении интеллекта, например, при игре в шахматы, решении задач, распознавании изображений и т. д. Теперь, в отличие от сенсации, вызванной выходом GPT-4 два года назад, ожидания людей в отношении ИИ сместились с «того, что он может делать» два года назад, на «что он может делать лучше, быть безопаснее и более управляемым» сегодня.

Все больше и больше компаний, занимающихся искусственным интеллектом, начинают уделять внимание «эмоциональному интеллекту», пытаясь заставить ИИ лучше понимать человеческие эмоции и потребности.

GPT-4.5 является представителем этой тенденции. Инвестирование ресурсов в разработку искусственного интеллекта, который лучше понимает мышление людей, по-прежнему является предложением, достойным внимания отрасли. Однако, хотя GPT-4.5 демонстрирует высоту, которой могут достичь языковые модели, основанные на огромных данных и вычислительной мощности, ее производительность все еще кажется несколько ограниченной.

С этой точки зрения это может быть больше похоже на поэтапный конец, играющий переходную роль между прошлым и будущим. Это не только доработка и ремонт прошлых поколений моделей, но и прокладывание пути к следующей волне технологий.

Настоящий прорыв, возможно, придется дождаться реализации GPT-5.

Если вы обеспокоены тем, что у OpenAI осталось недостаточно времени для итерации, не волнуйтесь, у меня есть хитрость. Итерация фиктивной версии — GPT-4.5→GPT-5. В ближайшие «месяцы» реальный ритм выпуска должен быть GPT-4.5→GPT-4.6→GPT-4.7→…

Хорошая новость в том, что на этот раз вам не придется ждать еще два года.

# Добро пожаловать на официальную общедоступную учетную запись WeChat aifaner: aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.

Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo