Grok-3 от xAI впечатляет, но ему нужно сделать гораздо больше, чтобы меня убедить

Компания xAI под руководством Илона Маска анонсировала свою новейшую модель искусственного интеллекта Grok-3 в прямом эфире. С самого начала было очевидно, что компания хочет быстро заполнить все практические пробелы, которые могут сделать ее чат-бота более доступным для обычного пользователя, а не просто продавать риторику о пробуждении и понимании Вселенной.

Компания выпустит две версии своей последней модели искусственного интеллекта, а именно. Грок-3 и Грок-3 мини. Последний подготовлен для сценариев с низким уровнем вычислительных ресурсов, а первый будет предлагать полный набор возможностей Grok-3, таких как DeepSearch, Think и Big Brain.

О чем весь этот шум?

Домашняя страница чата Grok 3.
Надим Сарвар / Digital Trends

Когда Маск рассказал обо всех новых функциях, которые появятся в Grok-3 вместе с экспертами по xAI, стало очевидно, что этот выпуск предназначен не только для установления новых показателей производительности, но и для того, чтобы уловить все горячие тенденции, которые будут определять ландшафт искусственного интеллекта в 2025 году.

Согласно тестам, предоставленным компанией, Grok-3 и даже Grok-3 mini показали себя лучше, чем модели OpenAI GPT-4o , Gemini, Claude и Deep Seek, в таких задачах, как кодирование, математика и решение научных задач.

В рейтинге Chatbot Arena (LMSYS) ранняя версия Grok-3 достигла максимума в 1400 очков, опередив Gemini 2.0 Flash Thinking, DeepSeek и другие. Компания разрабатывала Grok-3 впечатляющими темпами, и достижение таких показателей производительности — настоящий подвиг, несмотря на то, что она является относительной выскочкой перед лицом Google или OpenAI.

Сравнение тестов Grok-3 AI.
xAI

Однако внедрение его в мейнстрим будет самой большой проблемой, особенно с точки зрения доступа. Grok-3 изначально будет доступен подписчикам X Premium+ в рамках программы раннего доступа. В настоящее время самый высокий уровень подписки X, Premium+, стоит 22 доллара в месяц и 229 долларов за годовой план.

Соответствующие критериям пользователи получат доступ к функциям Grok-3, таким как рассуждение, DeepSearch, более высокие лимиты использования и ранний доступ к новым инструментам. Компания также запускает отдельный сервис подписки под названием SuperGrok, который предлагает приоритетный доступ к Grok-3 и более высокие лимиты генерации изображений.

Представление SuperGrok командой xAI.
xAI

Эта подписка будет ограничена мобильным приложением Grok и недавно запущенным веб-сайтом Grok.com. Маск говорит, что новейшие и самые передовые возможности будут предоставляться через веб-сайт.

«Это своего рода бета-версия, поэтому поначалу следует ожидать некоторых недостатков, но мы быстро улучшимся», — сказал Маск в прямом эфире, добавив, что пользователи могут ожидать улучшений каждый день. Было бы интересно посмотреть, как xAI заполняет пробел в интересе среднего энтузиаста чат-ботов, раскачивающего телефон и одновременно отправляющего пикантную презентацию высокооплачиваемым корпоративным клиентам.

В курсе тенденций

Похоже, что xAI многое делает с Grok-3 не только с точки зрения расширенных возможностей, но и с точки зрения равенства функций. Одним из выдающихся элементов Grok-3 являются расширенные возможности рассуждения и мышления, что, похоже, является новой горячей тенденцией в мире языковых моделей.

Возьмем, к примеру, режим Think Grok-3, который является прямым конкурентом моделей OpenAI O-серии. Такие модели искусственного интеллекта предназначены для того, чтобы тратить больше времени на обдумывание и анализ запросов пользователей, прежде чем они дадут ответ.

Пользователи могут видеть цепочку мыслей в режиме реального времени, а преимуществами, по мнению пользователей, являются повышение производительности в области естественных наук, математики и запросов, связанных с программированием. xAI закрывает эту пропасть не только с помощью режима Think, но и с помощью отдельного инструмента Big Brain для Grok-3, который расширит его вычислительные возможности для более продвинутых и сложных сценариев.

Грок 3, ответ глубокого размышления.
xAI

Google не сильно отстает со своей линейкой Gemini. Недавно компания запустила серию моделей искусственного интеллекта Gemini 2.0 , в которую входит Gemini 2.0 Flash Thinking Experimental и отдельная итерация, ориентированная на приложения, в которой приоритет отдается информации, полученной с YouTube, Карт и поиска Google.

DeepSeek , китайский чат-бот с открытым исходным кодом, который недавно взорвал Уолл-стрит, также предлагает продукт для мышления и рассуждения под названием DeepThink. Несмотря на то, что ответы подвергаются цензуре , производительность весьма впечатляет.

xAI также преследует формулу агента ИИ с помощью Grok-3, хотя у него есть много возможностей, особенно по сравнению с такими, как OpenAI и Google. С этой целью компания запускает свой первый агентный продукт, созданный на базе Grok-3, который называется DeepSearch.

Илон Маск с командой xAI
xAI

Он работает более или менее так же, как Deep Research в Google Gemini и конкурирует с одноименными продуктами Perplexity и OpenAI. Он выполняет поиск в Интернете, составляет полный отчет, а также цитирует все источники, из которых он извлек информацию.

xAI опаздывает в гонку, но цена может стать помехой, когда дело дойдет до массовой привлекательности. Perplexity будет предлагать ограниченное количество запросов Deep Research бесплатно, в то время как Google предлагает более щедрый пакет Gemini Deep Research за 20 долларов для подписчиков Gemini Advanced.

Deep Research (или DeepSearch для Grok-3) — чрезвычайно ресурсоемкий процесс, поэтому имеет смысл сделать его премиальным бонусом. Но предоставление клиентам возможности попробовать его, даже с ограниченным количеством запросов, повышает вероятность получения новых подписчиков — стратегии, которой следуют и Perplexity, и OpenAI.

Демонстрация Gemini Live на Google Pixel 9.
Близнецы Live от Google. Джо Маринг / Цифровые тенденции

Маск также упомянул, что в Grok также появится режим голосового взаимодействия, который запустится примерно через неделю. Основное внимание уделяется предоставлению альтернативного метода общения с Гроком, более естественного.

ChatGPT OpenAI уже некоторое время предлагает так называемый голосовой режим, апользователям Google Gemini также доступна аналогичная функция под названием Gemini Live .

xAI не предоставил подробностей о голосовом режиме Grok-3, но подтвердил, что он будет иметь разговорную память, чтобы запоминать детали предыдущих взаимодействий. «Это один из лучших опытов Грока», — сказал Маск во время прямой трансляции.

Найти массовую привлекательность — сложная задача

Инструменты для использования ИИ Грока-3.
xAI

Deep Research — не единственная агентная реализация чат-ботов с искусственным интеллектом, и здесь xAI сильно отстает. OpenAI недавно представила Оператора , ИИ-агента, который может выполнять сложные веб-задачи от имени пользователей, по сути взяв на себя контроль над работой по просмотру веб-страниц.

Он может выполнять такие задачи, как покупки, бронирование столиков в ресторанах и работу, связанную с поездками, благодаря базовой структуре агента, использующего компьютер (CUA). Самое главное, что OpenAI уже заключила соглашения с такими компаниями, как DoorDash, InstaCart, Uber и eBay, чтобы представить Оператора как впечатляющую демонстрацию практических агентских возможностей.

Кроме того, существует система плагинов ChatGPT , которая делает чат-бота гораздо более функциональным за счет интеграции с такими платформами, как Zapier, Expedia, Klarna, Slack и Shopify и другими. Они делают ChatGPT гораздо более привлекательным продуктом для предприятий, чем Grok-3.

Google, с другой стороны, использует свой обширный портфель продуктов и приложений, которые люди используют ежедневно. Глубокая интеграция на системном уровне с приложениями (через расширения) на Android и доступность мультимодальных возможностей Gemini в таких продуктах Workspace, как Gmail и Docs, дают ему огромное функциональное преимущество.

DeepSeek, с другой стороны, уже используется такими брендами, как Honor . Apple также внедрила стек Apple Intelligence на основе ChatGPT на миллионы iPhone и Mac иподписала соглашение с Alibaba о предложении этих функций в Китае.

xAI пока не нашел таких претендентов на Грока. Это самая большая проблема для xAI на данный момент, и было бы интересно посмотреть, какие бренды он сможет привлечь, чтобы вывести Grok-3 со всеми его наворотами в мейнстрим.