Google Translate только что получил самое большое обновление за всю историю
Для тех, кто любит использовать Google Translate, есть несколько интересных новостей: приложение для перевода скоро будет поддерживать еще 110 языков. До этого обновления Google Translate поддерживал 133 языка. Другими словами, Google почти вдвое увеличивает языковую библиотеку Translate.
В недавнем обновлении блога Google упомянул об использовании моделей искусственного интеллекта для увеличения количества языков, поддерживаемых приложением Google Translate. В частности, большая языковая модель PaLM 2 делает возможным добавление этих языков.
В Google Translate появятся новые языки: афарский, кантонский, мэнский, нко, панджаби (шахмукхи), тамазигт (амазиг) и ток-писин — и это лишь некоторые из них.
Афар — тональный язык, на котором говорят в Джибути, Эритрее и Эфиопии. Кантонский диалект уже давно является одним из самых востребованных языков для Google Translate. Мэнский язык — кельтский язык острова Мэн, а НКо — стандартизированная форма западноафриканских языков мандинг, объединяющая многие диалекты в общий язык. Пенджаби (Шахмукхи) — это разновидность пенджаби, написанная персидско-арабской письменностью (Шахмукхи), и является наиболее распространенным языком в Пакистане. Тамазайт (амазиг) — берберский язык, на котором говорят по всей Северной Африке, а ток-писин — креольский язык английского происхождения и лингва-франка Папуа-Новой Гвинеи.
Около 25% новых языков происходят из Африки, что представляет собой крупнейшее расширение Google африканских языков на сегодняшний день. К ним относятся Фон, Киконго, Луо, Га, Свати, Венда и Волоф.
Как объясняет Google: «От кантонского диалекта до кекчи на этих новых языках говорят более 614 миллионов человек, что делает перевод доступным примерно для 8% населения мира. Некоторые из них являются основными языками мира, на которых говорят более 100 миллионов человек. На других говорят небольшие общины коренных народов, а некоторые почти не имеют носителей языка, но ведут активную работу по возрождению».
PaLM 2, сокращение от Pathways Language Model 2, является следующей версией исходного PaLM и содержит значительные улучшения в нескольких областях. Эти улучшения включают многоязычный опыт, возможности кодирования и улучшенные способности к рассуждению. С PaLM 2 Google Translate может более эффективно изучать близкородственные языки. Кроме того, Google сотрудничает с опытными лингвистами и носителями языка для дальнейшей поддержки более широкого спектра языковых разновидностей и правил правописания в будущем.
В рамках инициативы «1000 языков» Google надеется создать модели искусственного интеллекта, поддерживающие 1000 самых распространенных языков во всем мире.