Meta создает «универсальный языковой переводчик» космической эры

Когда вы думаете об инструментах, оснащенных искусственным интеллектом (ИИ) в наши дни, естественно, на ум приходят ChatGPT и Bing Chat . Но владелец Facebook Meta хочет изменить это с помощью SeamlessM4T, «универсального языкового переводчика» на базе искусственного интеллекта, который может мгновенно конвертировать любой язык в мире в любой желаемый результат.

Meta описывает SeamlessM4T как «первую универсальную многоязычную мультимодальную модель перевода и транскрипции с использованием искусственного интеллекта». Это довольно громоздко, но, проще говоря, это означает, что он может преобразовывать языки разными способами, например, брать речевой звук и превращать его в текст на другом языке.

Силуэт человека держит смартфон с логотипом Facebook. Они стоят перед вывеской с логотипом Meta.

По словам Меты, функции распознавания речи и перевода этого инструмента могут работать несколькими разными способами:

• Распознавание речи почти на 100 языках.
• Преобразование речи в текст почти для 100 языков ввода и вывода.
• Преобразование речи в речь почти для 100 языков ввода и 36 языков вывода (включая английский).
• Текстовый перевод почти на 100 языков.
• Преобразование текста в речь почти для 100 языков ввода и 35 языков вывода (включая английский).

Мета говорит, что это «позволит людям легко общаться посредством речи и текста на разных языках».

Скоро появится в Facebook?

Инструмент искусственного перевода Meta SeamlessM4T преобразует ввод с испанского языка на вьетнамский как в текстовой, так и в аудиоформе.

SeamlessM4T выпускается под исследовательской лицензией, и Meta заявляет, что делает это, чтобы «позволить исследователям и разработчикам развивать эту работу». Кроме того, публично публикуются метаданные набора данных, который использовался для обучения модели перевода, называемой SeamlessAlign. Это состоит из «270 000 часов добытой речи и выравнивания текста», утверждает Мета.

Однако Мета не уточнила, откуда были взяты эти 270 000 часов «заминированной речи». Высказывались опасения по поводу последствий для конфиденциальности работы Meta над чат-ботами с искусственным интеллектом , в то время как другие инструменты искусственного интеллекта уже были уличены в краже защищенной работы . Несомненно, будут опасения, что Meta могла сделать что-то подобное, когда обучала SeamlessM4T.

Уже существуют другие инструменты перевода, такие как Google Translate, которые могут преобразовывать текст в текст и речь в текст, но Meta утверждает, что ее собственные усилия превосходят их. Как утверждает Meta, SeamlessM4T «уменьшает количество ошибок и задержек, повышая эффективность и качество процесса перевода».

Meta не сообщила, будет ли новый инструмент интегрирован в ее приложения, такие как Facebook и Instagram, но компания сообщила, что намерена «изучить, как эта основополагающая модель может обеспечить новые коммуникационные возможности» в будущем. Нам придется посмотреть, что это влечет за собой.