Как работают приложения для перевода речи Cat?
Вы, наверное, видели приложения, которые утверждают, что переводят то, что говорит ваша кошка. Но могут ли они действительно перевести мяуканье вашей кошки на английский язык? Короткий ответ – вроде как. Это сложно из-за того, насколько уникален «язык» каждой кошки, но они могут довольно близко познакомиться с современными технологиями.
Приложения для кошачьего перевода, такие как MeowTalk, используют форму распознавания речи с упором на машинное обучение. Посмотрим поближе.
Распознавание речи и машинное обучение
Распознавание речи работает путем записи речи и преобразования звука в файл цифровых данных. Он кодирует такие данные, как высота и громкость, как точки данных, которые приложение может анализировать и сопоставлять со значениями. DPA Microphones объясняет, что эти точки данных могут выглядеть по-разному в зависимости от фоновых звуков и того, как произносится слово.
Иногда мы воспринимаем распознавание голоса как должное, но это невероятный технологический подвиг. Особенно учитывая сложность человеческой речи. Как объясняет Ученый , каждое слово включает в себя широкий спектр звуков или «фонем», смешанных друг с другом. Заставить компьютер понимать речь очень сложно. Новый рубеж кошачьих звуков будет еще сложнее.
Приложения, использующие распознавание речи, запрограммированы с использованием «словаря» слов, называемого набором данных. Затем приложение сопоставляет вашу речь с ближайшим вариантом в своем словаре данных.
Когда он делает ошибку, вы ее исправляете, и он сохраняет эти данные для следующего раза. Это часть машинного обучения. Так программа учится распознавать речь, даже если она не совпадает с набором данных, с которого она была запущена.
Распознавание голоса по-прежнему имеет проблемы, особенно с дефектами речи и акцентами. Однако некоторые компании совершенствуют машинное обучение, чтобы решить эти проблемы . Со временем машинное обучение может превратить распознавание речи в мощный инструмент.
Вот как работает распознавание речи у людей. Но работает ли это для кошек?
Распознавание речи против распознавания мяу
Во-первых, нам нужно понять, почему перевод определенного типа мяуканья как «Я голоден» отличается от анализа человеческой речи. Проблема в основном в том, что кошачье общение в большей степени зависит от невербальных сигналов, таких как осанка. Еще одна проблема – отсутствие универсального «кошачьего языка».
Согласно ASPCA , взрослые дикие кошки никогда не мяукают друг на друга, только на людей. Другое исследование Humane Society добавляет, что эти звуки «не возникают в вакууме». Мы должны интерпретировать их вместе с языком тела и другими контекстами. Во многих случаях эти тихие сигналы – единственное различие между мяуканью, означающим «Я голоден», и «Я хочу поиграть».
В дополнение к этой проблеме, нет двух кошек, говорящих на одном языке. Кошки развивают для своих владельцев индивидуальные «языки». Частично они основаны на имитации голоса хозяина, а частично – на личности кошки. Никакие две кошки не звучат одинаково, даже когда они выражают одно и то же желание или потребность. Так как же можно перевести словарный запас одного приложения для всех?
Гибкое машинное обучение для кошек
Хотя некоторые виртуальные помощники, такие как Ото, пытаются понять тон и эмоции, распознавание речи по-прежнему ужасно при невербальных сигналах. Но это не значит, что их невозможно интерпретировать.
MeowTalk использует более гибкий вид машинного обучения, чтобы помочь преодолеть эти проблемы.
Скачать: MeowTalk для Android | iOS (бесплатно)
Meowtalk был создан Хавьером Санчесом, который также работал в команде Alexa. Он представлял приложение как шаг к умным ошейникам. Эти ошейники будут переводить кошачьи звуки в человеческую речь, опираясь на сложные стратегии машинного обучения, чтобы помочь людям лучше понимать своих кошек и заботиться о них.
Команда MeowTalk компенсировала проблемы с уникальностью, создав более конкретные профили для каждой кошки. В приложении вы регистрируете каждую кошку отдельно. Science Norway сообщает, что котята мяукают не так, как взрослые кошки, поэтому приложение также запрашивает день рождения кошки. Каждый профиль создает для кошки уникальную сеть передачи данных, включающую в себя немного глубокого обучения в машинном обучении.
Что касается словарного запаса, MeowTalk начинается с 10 звуковых профилей в своем наборе данных. Каждому из них придается разное значение, например, «счастливый» или «охота». Когда приложение слышит звук и ошибается, вы можете исправить его или создать новую интерпретацию.
Исправление говорит приложению заменить базовый словарь новым звуком.
Например, вы можете указать приложению сопоставить «Охота» коротким щебетанием вместо долгого вопля. Этот вид коррекции является более полезным , чем добавление нескольких звуков в соответствии с одним означая способ распознавания речи самку, которая была бы , как говорят приложение , которое долго выть и короткий щебечут как среднее «Мать вызов.»
Машинное обучение в приложениях для распознавания речи обычно сопротивляется такому типу перезаписи. Это все равно что пытаться научить Siri, что когда вы говорите «блог о технологиях», вы действительно имеете в виду «груша». Но более гибкая форма машинного обучения, которую использует MeowTalk, может легче справиться с этой коррекцией.
Создание новой интерпретации добавляет смысл, который ранее не кодировался. Например, если у вашей кошки особый звонок, когда она хочет свою любимую игрушку, вы можете добавить в качестве опции «Я хочу свою мышь». Это похоже на добавление слова в словарь автозамены.
Со временем вы сможете разработать индивидуальный речевой профиль для своей кошки. В конце концов, он может быть даже достаточно сложным, чтобы быть полезным для домашних питомцев или для решения поведенческих проблем. По крайней мере, это помогает владельцам кошек стать более внимательными к своим питомцам.
Вердикт: работают ли приложения для перевода Cat?
В конце концов, «кошачий перевод» по-прежнему во многом зависит от того, как пользователь учит приложение тому, как разговаривает их кот. Вероятно, так будет всегда из-за того, насколько уникально общение каждой кошки.
Но тот факт, что машинное обучение зашло так далеко, что разработчики могут даже частично преуспеть в этом, невероятен. Машинное обучение и ИИ развиваются с головокружительной скоростью, и нам не терпится увидеть, куда они пойдут дальше.