Вот почему люди снова утверждают, что GPT-4 хорош

19 декабря, 2023 Дядя Влад

Похоже, что OpenAI занята очисткой своих языковых моделей GPT после обвинений в том, что GPT-4 стал «ленивым», «тупым» и испытывает ошибки, выходящие за рамки нормы для чат-бота ChatGPT, распространенного в социальных сетях в конце ноября.

Некоторые даже предполагают, что GPT-4.5 тайно был распространен среди некоторых пользователей, основываясь на некоторых ответах самого ChatGPT. Независимо от того, правда это или нет, в прошлом за GPT-4 определенно произошли некоторые положительные внутренние изменения.

Больше графических процессоров, лучшая производительность?

Еще в прошлый четверг начали поступать сообщения, в которых отмечалось улучшение производительности GPT-4. Профессор Wharton Итан Моллик, ранее комментировавший резкий спад производительности GPT-4 в ноябре, также отметил оживление модели, не увидев для себя никаких доказательств перехода на GPT-4.5. Постоянно используя интерпретатор кода для исправления своего кода, он описал изменения как «день и ночь, как в скорости, так и в качестве ответа» после того, как столкнулся с тем, что ChatGPT-4 был «ненадежным и немного скучным в течение нескольких недель».

Пока это происходило, OpenAI в прошлую среду незаметно возобновила своиподписки на ChatGPT Plus , регистрация которых была прекращена с 14 ноября. Альтман заявил в посте X: «Спасибо за ваше терпение, пока мы нашли больше графических процессоров».

Пока неизвестно, существует ли корреляция между восстановлением регистрации ChatGPT Plus и улучшением GPT-4, но время интересно. Примечательно, что регистрация на платную версию закрылась вскоре после первого DevDay разработчиков OpenAI, на котором компания представила множество новых функций для платной версии чат-бота с искусственным интеллектом. Компания создала список ожидания для подписок ChatGPT Plus, поскольку регистрации после DevDay превышают возможности службы по обработке функций.

Вскоре после этого пользователи начали сообщать о необычном поведении GPT-4, выходя за рамки уже известных традиционных шуток ИИ. Одна из распространенных жалоб заключалась в том, что GPT-4 «разговаривал» с пользователями или требовал нескольких объяснений команды, прежде чем иметь возможность выполнить запрос. Другая жалоба заключалась в том, что модель объясняла пользователям, как выполнять их команду, а не выполнять задачу.

Деградация GPT-4 началась как минимум с июля, когда исследование выявило резкое снижение точности в период с марта по июнь. Многие, в том числе вице-президент по продуктам OpenAI Питер Велиндер, предполагают, что качество ответов может оказаться недостаточным как психологический феномен по мере дальнейшего обновления модели. Некоторые добавили, что пользователям может быть полезно изменить свои запросы для получения желаемых результатов.

Хотя OpenAI по большей части хранит молчание о своей внутренней работе, пост Альтмана X о графических процессорах, вероятно, стал ярким индикатором того, что происходит за кулисами. В апрельских отчетах указывалось, что OpenAI потребуется более 30 000 графических процессоров для поддержания коммерческой производительности до конца года. Это было до всплеска интереса в ноябре.

Секретное тестирование GPT-4.5 или просто галлюцинации?

Помимо этого, слухи о GPT-4.5 усилились благодаря появлению нескольких других подробностей о потенциальной утечке новой версии GPT.

Основатель информационного бюллетеня @therundownaiРоуэн Чунг недавно поделился в X (ранее Twitter) информацией о ценах на новую модель GPT-4.5, которую OpenAI находится в разработке. Подробности включают новые ценовые уровни и информацию о расширенных мультимодальных возможностях.

Чунг спросил генерального директора OpenAI Сэма Альтмана через платформу социальных сетей о достоверности утечки, на что тот ответил: «Нет».

Слухи о GPT 4.5 начались в четверг с «утекшего» изображения, показывающего новую модель GPT-4.5 с новыми расширенными мультимодальными возможностями и новой ценой.
Однако Сэм Альтман прокомментировал: «Нет». когда его спросили, правдивы ли слухи.
Но это еще не все… pic.twitter.com/iUJkFUqTMh
— Роуэн Чунг (@rowancheung) 18 декабря 2023 г.

Однако несколько пользователей, которые воспользовались предлагаемым обновлением, убеждены, что они используют GPT-4.5 и что оно новое и лучше, чем когда-либо. Некоторые спросили чат-бота, который, по их мнению, использует GPT-4, какая у него модель — и он ответил: «GPT-4.5 Turbo».

Это заставило многих поверить, что OpenAI тестирует GPT-4.5, в первую очередь в своих мобильных приложениях, надеясь ускользнуть от опытных пользователей. Однако не всем удалось воссоздать эти результаты, и модель сообщит им, что последняя версия — это просто GPT-4. Сотрудник OpenAI Уилл Депью также прокомментировал этот вопрос, назвав это «очень странной и до странности последовательной галлюцинацией».

Чунг отметил сообщение с официальной страницы ChatGPT X с смайликами «мозг и голова в облаках», которые, по его мнению, являются расплывчатым способом OpenAI подтвердить, что ответы являются галлюцинациями.

Примечательно, что OpenAI предоставляет ранний и эксклюзивный доступ своим платным пользователям, в том числе пользователям ChatGPT Plus , пользователям API-разработчиков и корпоративным пользователям. Когда объявляются функции, они одними из первых знакомятся с новейшими версиями GPT и их функциями. Многие, кто возится с моделями и замечает незначительные изменения, вероятно, имеют тот или иной доступ к API для разработчиков или используют сервис для тестирования кода и делятся своим вкладом с общественностью.

Даже если OpenAI тестирует GPT-4.5, неизвестно, когда может появиться обновление, особенно когда компания восстанавливается после сервисной и организационной дестабилизации. Кроме того, компания и продукт все еще новы, и пока неясно, как выглядит рутинный цикл обновлений. На данный момент, я полагаю, не имеет значения, какую «версию» ChatGPT мы используем, потому что улучшения кажутся реальными.