Тестировал версию DeepSeek для Huawei Xiaoyi, есть ли отличия от полноценной версии R1?

Во время Праздника Весны самой популярной вещью в Интернете являются не скетчи Гала-концерта Весны и не фильмы о Празднике Весны, а DeepSeek.

Эта темная лошадка искусственного интеллекта из Китая достигла производительности, сравнимой с OpenAI o1, с чрезвычайно низкими затратами на обучение. Благодаря своим сильным знаниям китайского языка, моменту киберпробуждения и духу открытого исходного кода, он быстро всколыхнул круг ИИ, возглавляемый ChatGPT.

Когда собственная семья становится успешной, другие члены семьи должны поддерживать себя, поэтому, пока люди по всей стране наслаждаются праздниками, программисты снова заняты.

Поскольку Tencent Cloud, MiTa AI, Alibaba Cloud, Baidu Smart Cloud и Национальная суперкомпьютерная интернет-платформа объявили о своем доступе к DeepSeek, мобильные телефоны, как наиболее часто используемый персональный интеллектуальный терминал, также открыли его присутствие.

Среди них Huawei движется быстрее всех.

Сказать особо нечего, поскольку DeepSeek — первый продукт, интегрированный в смартфон, мы сразу же провели практическое тестирование, чтобы увидеть, как он на самом деле работает.

После обновления Xiaoyi Assistant до версии 11.2.10.310 DeepSeek официально появился в Xiaoyi Assistant’s Agent Plaza.

Войдите в основной интерфейс приложения Xiaoyi Assistant, нажмите «Обнаружить» на панели навигации, и вы сразу увидите наличие DeepSeek. Судя по обложке, подключенный в настоящее время DeepSeek является бета-версией R1.

По сравнению с официальным приложением, DeepSeek-R1 Beta, подключенная к Huawei Xiaoyi, в целом сохраняет единый стиль дизайна и логику Xiaoyi Assistant. Интерфейс прост и интуитивно понятен, разделен на верхнюю и нижнюю части.

Первая половина представляет собой знакомство с бета-версией DeepSeek-R1 и показывает некоторые предустановленные общие проблемы, которые новички могут выбрать и попробовать. Нижняя часть представляет собой диалоговое окно, поддерживающее голосовой ввод. Голосовой контент пользователя автоматически преобразуется в текст и мгновенно отправляется, что удобно и быстро.

▲ Слева: версия DeepSeek Xiaoyi / Справа: официальное приложение DeepSeek

Нажмите на аватар DeepSeek-R1 Beta, чтобы перейти на страницу сведений с более подробным описанием:

Я агент, развернутый на основе версии DeepSeek с открытым исходным кодом и призванный помочь пользователям Hongmeng получить опыт глубокого мышления.

Кроме того, версия Xiaoyi DeepSeek-R1 Beta поддерживает только простые настройки, включая тембр агента, очистку контекста и удаление записей разговора. Это означает, что вы не можете открыть новое диалоговое окно. Если вы хотите начать заново, вы можете только очистить контекст и удалить записи разговора.

▲ Самая богатая настройка — это собственный тон Сяои.

Прежде чем начнется подробный тест, у нас еще есть некоторые меры предосторожности и детали, которые вам необходимо знать заранее:

  • Бета-версия DeepSeek-R1, доступная для Huawei Xiaoyi, доступна только в чистой версии Hongmeng Xiaoyi Assistant 4.3. Пользователи Hongmeng 4.3 временно не могут ею пользоваться.
  • Версия DeepSeek от Xiaoyi поддерживает углубленное мышление благодаря своей фирменной функции, но не обеспечивает подробный процесс мышления.
  • Версия Xiaoyi DeepSeek в настоящее время не предоставляет функцию поиска в Интернете в диалоговом окне, но иногда в ответе отображаются ссылки на веб-страницы в Интернете.
  • Версия DeepSeek для Xiaoyi предоставит некоторые возможности расширения после ответов на вопросы, чтобы подготовить пользователей к дальнейшим вопросам. Это недоступно в официальном приложении.

Длина контекста немного коротка, достаточна для ежедневного использования.

При измерении производительности ИИ есть важный фактор — большая длина контекста.

Длина контекста (Context length) относится к длине текста, которую большая языковая модель может одновременно учитывать и запоминать при обработке текста.

Например, если длина контекста модели составляет 2048 токенов, то при генерации или понимании текста она может «видеть» только информацию длиной до 2048 токенов, а информация, превышающая эту длину, будет игнорироваться или теряться моделью.

Другими словами, если контекст недостаточно длинный, ИИ может забыть то, что вы говорили ранее во время чата.

Хотя бета-версия DeepSeek-R1, к которой получил доступ Xiaoyi, не раскрывает данные о длине контекста, мы можем разработать простой метод для предварительного тестирования.

Я подготовил первые три главы «Романа трех королевств», около 15 000 слов, ввел их в DeepSeek-R1, подключенный к Huawei Xiaoyi, и попросил его вывести последние 100 слов.

Повторялось много раз, DeepSeek-R1 подключился к Huawei Xiaoyi, все подсказки:

Подожди, подожди немного и попробуй еще раз.

Когда я сократил статью до первой главы, примерно 4500 слов, все равно не получилось.

В отчаянии я изменил написанный мной пресс-релиз, извлек из него около 700 слов содержания и, наконец, получил успешный результат.

Этой длины в принципе достаточно для общения по простым повседневным вопросам, но если вы хотите пообщаться с ним о жизни, вы можете быть репетитором по философии, склонным к амнезии.

Есть ли разница между качеством вывода и полной работоспособной версией R1?

Пришло время всем услышать об этом снова. С момента разработки ИИ существовали различные методы тестирования. Мы выбрали ряд вопросов, от тех, которые легко понять людям, но которые ИИ легко может неправильно понять, до возможности реагирования на повседневные потребности, и провели подробные тесты.

Классические вопросы, которые когда-то расстраивали большую часть сообщества ИИ: «Что больше, 9,11 или 9,8?» и «Сколько букв r в Strawberry?», теперь включены в регулярные сеансы тестирования.

▲ Слева: версия DeepSeek Xiaoyi / Справа: официальное приложение DeepSeek

Удивительно, но когда дело дошло до вопроса о том, сколько букв r в Strawberry, DeepSeek-R1 Beta, подключенная к Huawei Xiaoyi, фактически перевернулась. Даже когда был указан справочный источник, он все равно давал ответ на две буквы r, а также была ошибка в позиции, где появлялась r.

В официальном приложении DeepSeek сюрпризов нет, оно не только дает правильный ответ, но и точно указывает положение r.

Кроме того, по сравнению с официальным приложением DeepSeek, подключенный к Huawei Xiaoyi, имеет еще одно существенное отличие — мыслительный процесс модели R1 скрыт.

Хотя этот процесс в большинстве случаев не мешает ответу, ИИ, который может демонстрировать процесс мышления, очевидно, делает людей более уверенными. В то же время, если пользователь хочет скорректировать вопрос, он может помочь понять, просматривая логику мышления, отображаемую ИИ, чтобы ИИ не смог точно уловить мышление пользователя.

▲ Судя по мыслительному процессу, представленному в официальном приложении, есть несколько проблем, с которыми ИИ все еще приходится бороться.

Я привык использовать официальное приложение DeepSeek, но внезапная потеря мыслительного процесса заставила меня почувствовать некоторую неуверенность.

Итак, я дал задачу о тележке двум DeepSeeks. Этот классический вопрос о мышлении, включающий моральную этику, проверял их глубину понимания сложных моральных проблем. Посмотрите, можно ли скрыть этот мыслительный процесс, чтобы дать методичный и исчерпывающий ответ и избежать ловушки «как вы выбираете», которую я предусмотрел.

В этом вопросе DeepSeek-R1 Beta не допустила никаких ошибок и не попала в яму моего замысла. Последствия двух вариантов были подробно представлены в ответе и подробно проанализированы с различных точек зрения и точек зрения. Это напомнило, что независимо от того, какой выбор будет сделан, необходимо тщательно рассмотреть его этические последствия, потенциальные последствия и последствия.

Если простых моральных и этических вопросов недостаточно, попробуйте задать более сложные вопросы, чтобы проверить свои способности к рассуждению, суждениям и пониманию логических взаимосвязей:

«На одном конце моста стоят три человека. Им нужно перейти на другую сторону моста, но мост может выдерживать одновременно только двух человек, и на мосту только один фонарик. Три человека пересекают мост с разной скоростью: один человек пересекает мост за 1 минуту, другой за 2 минуты, а последний за 5 минут. Одновременно по мосту могут переходить только два человека, и на мосту должен быть фонарик. Вопрос: Как мы можем заставить их перейти мост за самое короткое время?»

Этот тест более интересен. Бета-версия DeepSeek-R1, к которой получил доступ Xiaoyi, пришла к выводу, что это занимает 12 минут. Этот ответ такой же, как и вывод ChatGPT, в то время как официальное приложение DeepSeek дало более короткий ответ, и в то же время оно также дало достаточный контекст для дискуссии с точки зрения логики мышления.

▲ Слева: версия DeepSeek для Xiaoyi. В центре: официальное приложение DeepSeek. Справа: ChatGPT-4o.

После тестирования этики, логики и математики мы, наконец, протестировали тест, который ближе к сценариям обычного использования, но для ИИ сложно быть естественным — китайское письмо.

Я разработал тему видео и попросил DeepSeek-R1 Beta, подключенную к Xiaoyi, помочь мне вывести простую строку. Учитывая дизайн экрана, я также представил внешний вид складного экрана Huawei Mate X6 в виде эскиза, чтобы посмотреть, как он ведет себя, когда пользователи выдвигают сложные требования к задачам:

«Я хочу снять видео о складном экране Huawei Mate X6. Я продемонстрирую внешний вид складного экрана, дав нейтральную оценку. Все видео будет представлено в виде эскиза для двух человек. Пожалуйста, помогите мне разработать линии. Линии должны быть юмористическими и интересными, сохранять разговорный тон. При этом необходимо учитывать дизайн экрана».

Бета DeepSeek-R1, доступная к Xiaoyi, дала мне полный дизайн диалога. Проблема для ежедневной работы по обработке текста.

Следует отметить, что если разговорный язык не требуется, ответы, которые он дает, будут слишком формальными и строгими и все равно будут иметь некоторый оттенок ИИ.

В целом, производительность длины контекста и точность ответа бета-версии DeepSeek-R1, в настоящее время подключенной к Xiaoyi, все еще находятся в относительно базовом состоянии, которое может быть ограничено такими факторами, как скорость выпуска, компромиссы в интеграции и т. д., и нам нужно дождаться последующих итераций.

Однако, учитывая, что текущие условия подключения официального веб-сайта DeepSeek и официальных приложений действительно плохие, а различные другие облачные платформы и локальные развертывания предъявляют строгие требования к среде использования и пороговым значениям, при возникновении некоторых менее сложных проблем прямое использование DeepSeek, подключенного к Huawei Xiaoyi, является хорошим выбором.

Позволь мне счастливого пути

# Добро пожаловать на официальную общедоступную учетную запись WeChat Aifaner: Aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.

Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo