У DeepSeek появился новый конкурент, и вы можете опробовать его прямо сейчас
Alibaba только что представила свою последнюю модель рассуждения, и кажется, что DeepSeek и OpenAI есть о чем беспокоиться — по крайней мере, если все обещания Alibaba окажутся правдой. Это открытый исходный код, поэтому я проверил его. Вы также можете попробовать его бесплатно, хотя неудивительно, что вы обнаружите, что есть некоторые вещи, о которых он вам не расскажет.
Новая модель, получившая название QwQ-32b (Quan-with-Questions), работает с гораздо меньшим количеством параметров, а это означает, что она требует меньше ресурсов, но Alibaba утверждает, что она работает на том же уровне, что и DeepSeek или o1-mini от OpenAI.
Модель большого языка R1 (LLM) DeepSeek была в моде в начале февраля, когда она вышла, внезапно способная конкурировать с золотым стандартом, установленным ChatGPT и другими альтернативами, но по гораздо более низкой цене. Похоже, что Alibaba может пойти еще дальше.

Как пояснил VentureBeat , для запуска DeepSeek-R1 требуется 671 миллиард параметров, 37 миллиардов из которых активированы. Между тем, новый QwQ-32b от Alibaba может обойтись 32 миллиардами параметров. Для многих эти цифры совершенно абстрактны, но существует огромная разница в вычислительной мощности; в то время как для работы DeepSeek R1 требуется 1600 ГБ видеопамяти, QwQ-32b может обойтись всего 24 ГБ видеопамяти. В большинстве случаев это будет означать H100 от Nvidia или его эквиваленты, но даже ориентированная на игры RTX 4090 имеет 24 ГБ. Последняя версия RTX 5090 увеличивает этот показатель до 32 ГБ.
QwQ-32b от Alibaba доступен по лицензии Apache 2.0, а это означает, что его могут использовать компании и исследователи. Что еще более важно, мы можем использовать его, опробовав Qwen Chat от Alibaba. Как и DeepSeek, он имеет некоторые ограничения , но также имеет несколько преимуществ, которые я заметил довольно быстро.
Кажется, он дает весьма подробные ответы даже на быстрые и простые вопросы. Это может быть хорошо, но в каком-то смысле это больше всего раздражало, поскольку давало много ненужного контекста, о котором вы не просили. Мне нравится, что он показывает вам весь процесс рассуждения, который похож на функцию глубокого мышления ChatGPT, но с гораздо меньшей глубиной.
Когда его спрашивают о политических вопросах, Квен Чат отмечает это как неуместное. Возможно, есть способы взломать его — в конце концов, это было возможно с DeepSeek — но мне пока это не удалось.
Окажутся ли утверждения Alibaba правдой, еще неизвестно, но похоже, что у ChatGPT и DeepSeek теперь появился новый конкурент.