Xiaohongshu запускает функцию перевода, которую можно назвать энциклопедией мемов
Люди по всему миру с нетерпением ждали этого, и, наконец, на прошлых выходных была выпущена функция перевода Xiaohongshu!
Некоторые методы открытия и инструкции следующие: :
– Обновитесь до последней версии
– Попробуйте изменить свои языковые настройки, включая настройки Xiaohongshu и настройки системы мобильного телефона.
– В настоящее время поддерживается перевод только на один язык. Если он представляет собой смесь китайского и английского языков или содержит смайлы, его невозможно запустить.
– Если ответа по-прежнему нет, некоторые пользователи сети предложили «метод уничтожения фонового режима»: опубликуйте любое английское предложение в области комментариев, затем выйдите из фонового режима, затем снова откройте Xiaohongshu, и появится функция перевода.
▲ Скриншот этой статьи предоставлен пользователем Xiaohongshu. Имя пользователя показано на рисунке ниже.
Это слишком быстро, Сяохуншу, у вас в компании приходят программисты с такими быстрыми руками, тт пользователи говорят, что такого быстрого обновления они еще не видели. Это легендарная китайская скорость?
Люди во всем мире счастливы, кроме Юдао.
Хотя он был запущен всего за одну неделю, качество перевода было на удивление хорошим, и путешествовать по странам было похоже на чудо.
U1s1, yyds, cpdd — все эти аббревиатуры на основе пиньинь можно точно понять и обозначить.
Однажды моя соседка сказала, что даже не знает, что означает cpdd — еще одно железное доказательство того, что люди уступают GPT.
Сяохуншу, ты переводишь или делаешь энциклопедию мемов?
Дополнительным эффектом этой волны является то, что диалекты также переводятся кстати.
Даже если в исходном тексте есть ошибки, это не только не повлияет на перевод, но и Сяохуншу еще и тщательно прокомментирует его.
Ты действительно думаешь о том, чтобы выучить английский для меня, со слезами на глазах.
Очевидно, что на этот раз функция перевода Xiaohongshu поддерживается большой языковой моделью , и пользователям сети не терпится начать дразнить модель, стоящую за ней.
Например, сначала сделайте краткий перевод, а потом напишите несколько стихов.
После того, как Цяньцянь переведет, я подведу итог сегодняшним новостям.
Есть даже люди, которые набирают строку азбуки Морзе и переводят ее — это «Красная книжка», а не «Шум ветра».
Одностороннее объявление: самым мощным многофункциональным программным обеспечением для перевода на данный момент является Xiaohongshu.
Хотя модель большого языка уже очень хорошо справляется с задачами перевода, все еще остается много проблем, когда речь идет о социальной платформе с чрезвычайно богатым контентом, такой как Xiaohongshu.
Разнообразие языков является самой сложной задачей. Некоторые специфические для культуры термины, общепринятые выражения или метафоры, такие как идиомы и сленг, трудно точно перевести.
Также есть некоторые имена и прозвища, и модель может быть не в состоянии хорошо различить, какие слова необходимо перевести, а какие — сохранить.
Например, «оранжевый человек» здесь напрямую переводится как «оранжевый человек», но на самом деле оно относится к Трампу.
Помимо точности, рядовым пользователям труднее воспринимать вычислительные ресурсы, необходимые для перевода.
На такой насыщенной контентом платформе, как Xiaohongshu, пользователи могут публиковать заметки, состоящие всего из нескольких букв или сотен слов. Напротив, перевод длинного контента будет занимать больше ресурсов и увеличивать нагрузку на систему.
В то же время, после размещения пользователей из разных стран, часовые пояса широко распределяются, в результате чего время загрузки системы практически отсутствует.
Когда обе стороны просыпаются, количество запросов на перевод может мгновенно возрасти в пределах короткого перекрытия часовых поясов. Системе необходимо обрабатывать большое количество одновременных запросов за короткий период времени, что является отличным испытанием для возможностей одновременной обработки.
Предсказывая будущее, волна Сяохуншу находится в атмосфере.
Пока нет точной информации о том, какая модель стоит за новой функцией перевода. Судя по «принудительному допросу» некоторых пользователей сети, это, похоже, GPT.
Некоторые пользователи сети «заставили себя спросить» и выяснили, был ли это спектр мудрости.
Но, учитывая вопрос стоимости, это действительно сложно сказать. GPT имеет большое количество параметров и высокие вычислительные затраты, что делает его непригодным для развертывания в средах с ограниченными ресурсами.
Более реальная возможность — выбрать модель ученика и превратить GPT в модель учителя. Модели учеников обычно имеют меньше параметров и более быстрый вывод, но стараются сохранить возможности модели учителя.
В то же время этот маршрут может быть более надежным для Сяохуншу.
Исследование Xiaohongshu технологий искусственного интеллекта, таких как большие языковые модели и мультимодальность, началось уже давно, но оно всегда было сосредоточено на оптимизации алгоритмов. Мы также создали несколько небольших функций ИИ, и многие из них мы написали раньше.
Мало кто знает, что на AAAI в 2024 году команда поисковых алгоритмов Сяохуншу предложила новую идею для дистилляции больших моделей.
Команда алгоритмов поиска Xiaohongshu предложила инновационную структуру, которая полностью использует знания отрицательной выборки в процессе выявления логических способностей больших моделей .
«Отрицательный образец» — очень интересная концепция. Традиционная дистилляция обычно фокусируется только на положительных образцах, что нетрудно понять: когда учителя учат студентов, они должны учить правильному способу решения проблем, чтобы ученики могли понимать и подражать.
Однако, когда они учились в школе, каждый, должно быть, составил «неправильный набор вопросов», записывая допущенные ошибки и области, в которых они были недостаточно сильны. Эти неправильные вопросы являются «отрицательными образцами» . В области комментариев Сяохуншу те переводы, которые недостаточно точны, являются отрицательными образцами.
Например, «справедливая точка» ниже была до запуска функции перевода, и перевод был слишком машинным. В этой области комментариев правильнее перевести это слово как «разумное».
Точно так же, как «неправильные вопросы» также содержат важную информацию, «отрицательные образцы» могут помочь модели ученика определить, какие прогнозы неверны, улучшить ее способность к распознаванию, улучшить обработку сложных образцов и в то же время иметь возможность выражаться сложным языком. , сохраняйте последовательность.
Например, если вы теперь хотите связаться с зарубежными друзьями в области комментариев — ах нет, проверьте — могут появиться некоторые слова, связанные с финансовым менеджментом.
Например, слово банк может встречаться часто, но оно имеет и другое значение: «русло реки», а также может использоваться как глагол.
Посредством обучения на отрицательной выборке мы обучаем модель распознавать многозначные выражения, исправлять логику перевода и генерировать более естественный контент.
Преимущество отрицательных выборок также отражается в поддержке малых языков. Знаете, на этот раз это не только американские пользователи, но и пользователи со всего мира: Сербии, Перу и аборигенов в некоторых районах Австралии.
Используя негативные примеры, в том числе типичные ошибки перевода, модели учащихся способны выявлять и избегать часто встречающихся ошибок, улучшая возможности перевода на языки с ограниченными ресурсами.
Эта структура, предложенная командой Xiaohongshu , представляет собой инновационное применение дистилляции . Она была предназначена для извлечения сложных логических возможностей из больших языковых моделей и переноса их в специализированные небольшие модели. В то время было неясно, какие именно задачи можно решить. По крайней мере, казалось, что перевод не был в центре внимания.
В то время, возможно, никто не знал, что эта структура поможет Сяохуншу год спустя стать мостом для международных обменов.
Как гласит старая поговорка: возможности всегда приходят к тем, кто к ним готов.
# Добро пожаловать на официальную общедоступную учетную запись WeChat Aifaner: Aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.
Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo