Вот как выглядят Claude 3.5 Sonnet и GPT-4o в прямом сравнении.

В постоянно растущем ландшафте моделей больших языков (LLM) среди остальных участников гонки выделяются два лидера: Claude 3.5 Sonnet от Anthropic и GPT-4o от OpenAI (буква «o» означает «Omni»). Оба ИИ могут похвастаться впечатляющими возможностями, но какой из них преобладает? В этом руководстве подробно рассматриваются Claude 3.5 Sonnet и GPT-4o, анализируя их сильные и слабые стороны применительно к различным задачам.

Мы не только изучим их относительную точность и скорость ответа, но также раскроем структуру ценообразования и уровни обслуживания. К концу этой статьи вы будете вооружены знаниями, позволяющими принять обоснованное решение о том, какой LLM лучше всего соответствует вашим конкретным потребностям и бюджету.

Цены и уровни

Пользователи ChatGPT могут получить доступ к модели GPT-4o бесплатно, но количество запросов, которые вам разрешено задать в течение трех часов, ограничено. Превышение этого предела приведет к использованию GPT-3.5, более старой и менее функциональной модели OpenAI, пока таймер восстановления не будет сброшен.

Пользователям придется заплатить за подписку ChatGPT Plus за 20 долларов в месяц, подписку на Teams за 30 долларов в месяц или подписку Enterprise по рыночной цене, если они хотят использовать GPT-4o в свое удовольствие. Плата за доступ не только резко увеличивает ограничение скорости использования модели искусственного интеллекта, но также предоставляет доступ к дополнительным функциям, таким как генерация изображений Dall-E.

снимок экрана с ценовыми уровнями Claude
антропный

Доступ к Клоду настраивается примерно так же. На бесплатном уровне пользователи могут общаться с чат-ботом либо через Интернет, либо через приложение iOS. Они также могут загружать изображения и документы на сервер Anthropic и запрашивать у ИИ их содержимое, а также ограниченно использовать новую модель Claude 3.5 Sonnet.

Заплатив 20 долларов в месяц за учетную запись Pro, вы получаете все: от уровня бесплатного пользования, а также более высокие лимиты использования, доступ к Claude 3 Opus и Haiku, приоритетную пропускную способность и доступность, а также возможность создавать проекты с использованием ИИ, ориентированного на набор. документов или файлов. Заплатив 30 долларов в месяц на человека (минимум 5 человек) за учетную запись Teams, вы получаете еще более высокие ограничения на использование и возможность обмениваться чатами между товарищами по команде.

Преимущества использования Клода

Хотя имя Claude, возможно, и не пользуется такой же степенью узнаваемости, как GPT-4o, новейшая модель искусственного интеллекта Anthropic имеет ряд преимуществ перед своим конкурентом — и не только в тестах производительности . Во-первых, Claude может похвастаться значительно большим контекстным окном, чем ChatGPT (200 000 символов против 128 000).

Это означает, что он может запоминать и анализировать гораздо больший фрагмент предыдущего разговора или текста, что приводит к более тонким и релевантным ответам, особенно при длительном взаимодействии. Клод также обучен отдавать предпочтение точности, а не креативности в своих ответах.

Возможно, ему немного сложно генерировать забавные хайку, но Клод превосходно умеет обобщать исследовательские работы и создавать отчеты на основе загруженных данных. У Клода также есть более поздняя дата прекращения знаний, чем у GPT-4o: апрель 2024 года по сравнению с октябрем 2023 года.

скриншот сонета Клода 3.5 с боковым экраном «Артефакты»
антропный

Кроме того, Anthropic обучила свои модели Клода как конституциональные ИИ. Это означает, что система реализует набор принципов для вынесения суждений о полученных результатах, эффективно направляя модель к такому этическому поведению, которое продиктовано конституцией. Это включает в себя избежание токсичных или дискриминационных результатов, а также отказ от описания или пропаганды незаконной или неэтичной деятельности.

Преимущества использования GPT-4o

GPT-4o, с другой стороны, предлагает пользователям более широкий набор функций, большую базу знаний и более гибкие возможности входа в систему, чем Claude.

В отличие от предложения Anthropic, ChatGPT может генерировать изображения (хотя для этой функции требуется подписка) и выходить в Интернет, чтобы найти самую свежую доступную информацию, а не только данные, на которых он обучался. И в отличие от процесса регистрации с Клодом, пользователям GPT-4o не нужно будет предоставлять свой номер телефона для проверки или вообще какие-либо учетные данные, чтобы начать использовать модель. GPT-4o более эффективен в создании творческого контента с помощью изображений, текста и аудио, чем Клод.

Веб-сайт ChatGPT также имеет тенденцию перегружаться пользовательскими запросами с гораздо меньшей скоростью, чем сайт Клода.

Сравнение скорости и точности

Обе модели способны генерировать широкий спектр текстовых результатов: от обработки написанной пользователем прозы до создания компьютерного кода и алгоритмов электронных таблиц. Когда их попросили сгенерировать «кусок кода Python, который будет измерять площадь круга и генерировать график функции», оба вернули фрагменты с одинаковой структурой. GPT-4o произвел следующее:

импортировать numpy как np
импортировать matplotlib.pyplot как plt

# Функция для вычисления площади круга
Защиту вычисление_области (радиус):
вернуть np.pi * радиус ** 2

# Генерируем диапазон значений радиуса
radii = np.linspace(0, 10, 100) # радиусы от 0 до 10 со 100 точками

# Рассчитаем соответствующие значения площади
области = Calculation_area (радиусы)

# Построение графика функции
plt.figure(figsize=(10, 6))
plt.plot(радиусы, площади, метка = 'Площадь = πr²')
plt.title('Площадь круга как функция радиуса')
plt.xlabel('Радиус')
plt.ylabel('Площадь')
plt.legend()
plt.grid(Истина)
plt.show()

Между тем, ответ Клода был более конкретным:

импорт математики
импортировать numpy как np
импортировать matplotlib.pyplot как plt

защита Circle_area (радиус):
вернуть math.pi * радиус**2

# Генерация радиусов от 0 до 10 по 100 точкам
радиусы = np.linspace(0, 10, 100)

# Рассчитать площади для каждого радиуса
области = [circle_area(r) для r в радиусах]

# Создаём сюжет
plt.figure(figsize=(10, 6))
plt.plot(радиусы, площади, 'b-', ширина линии = 2)
plt.title('Площадь круга как функция радиуса')
plt.xlabel('Радиус')
plt.ylabel('Площадь')
plt.grid(Истина)

# Добавляем несколько интересных моментов
plt.plot(0, Circle_area(0), 'ro', label='r = 0')
plt.plot(1, Circle_area(1), 'ro', label='r = 1')
plt.plot(5, Circle_area(5), 'ro', label='r = 5')
plt.plot(10, Circle_area(10), 'ro', label='r = 10')

plt.legend()
plt.show()

С точки зрения идентификации изображений обе модели очень похожи. Когда их попросили идентифицировать различные аспекты следующего изображения, и GPT-4o, и Клод 3.5 легко смогли найти и описать каждый из 21 присутствующего элемента.

массив 3D-изображений, созданных Meta 3D Gen
Мета

Преимущество GPT-4o заключается в предоставлении информации о недавних событиях, поскольку он позволяет искать в Интернете более свежие новости, чем данные обучения. Если вы спросите Клода, «что произошло вчера в Люксембурге», вы получите только заметку: «Прошу прощения, но у меня нет доступа к новостям в реальном времени или информации о конкретных событиях, которые произошли вчера в Люксембурге. Мой предел знаний приходится на апрель 2024 года, и у меня нет информации о событиях после этой даты». ИИ предлагает ряд полезных рекомендаций относительно того, где вы можете найти запрошенную информацию.

Я действительно обнаружил, что сравнение двух систем представляет собой некоторую проблему, главным образом потому, что я смог сделать только полдюжины запросов Клоду, прежде чем система заблокировала меня на три часа. Даже на бесплатном уровне ChatGPT я не буду полностью отключен от системы — мне просто придется какое-то время общаться с немного худшей моделью.

Как лучше?

В конечном счете, лучший выбор зависит от ваших конкретных потребностей. Если вы отдаете предпочтение фактической точности, длительной обработке документов и у вас ограниченный бюджет, Клод может подойти лучше.

Однако, если вам нужен более широкий спектр творческих функций и вы готовы платить за дополнительные функции, ChatGPT все равно будет лучшим вариантом.