Алекса скоро может стать делом прошлого

Исследователи из Университета Карнеги-Меллона разработали систему для взаимодействия с интеллектуальными динамиками и другими устройствами с голосовым управлением без использования слов для пробуждения.

Система, основанная на машинном обучении, может стать основой для безопасной альтернативы постоянным домашним помощникам.

Как работает новая система?

Новые результаты были опубликованы в исследовательском документе [PDF] исследовательской группой из четырех человек, которые также предоставили видео, объясняющее, как может функционировать новая модель.

Исследование сосредоточено на Направлении голоса , методе, который определяет как положение, так и угол, откуда исходит речь. Это отличается от современных интеллектуальных устройств, которые, как правило, сосредотачиваются только на исходной позиции звука.

Текущий подход также основан на конкретном слове пробуждения, поэтому изменение слова пробуждения Alexa на что-то другое дает вам только один или два дополнительных варианта.

Когда человек говорит, его голос создает эхо по комнате, которое в разное время достигает умного динамика. Анализируя синхронизацию, громкость и частотный спектр звука, издаваемого каждым отраженным эхом, новая система может предсказать, говорит ли пользователь в направлении смарт-объекта или смотрит в сторону от него.

Наряду с исследовательской работой команда также предоставила ссылку GitHub на набор данных, используемый для обучения нейронной сети. 11520 уникальных фраз в наборе данных было достаточно, чтобы научить умного динамика предсказывать угол, под которым смотрит пользователь, с точностью до 90 градусов.

Вычисления, необходимые для определения направления, достаточно легкие, чтобы их можно было выполнять на устройстве локально без подключения к удаленному серверу. Исследовательская группа, стоящая за новыми выводами, надеется, что этот подход позволит более гибко взаимодействовать со смарт-устройствами и предложит пользователям большую конфиденциальность, чем облачные альтернативы.

Нет графика того, когда эта технология может появиться для публичного использования, но есть задел, чтобы со временем отменить необходимость в словах для пробуждения. Когда больше не нужно называть умную колонку по имени, действительно ли она нужна? Может Алекса знает ответ.

Конец персонифицированным домашним помощникам?

Хотя это исследование открывает новые захватывающие возможности для взаимодействия со смарт-устройствами, вряд ли оно полностью заменит слова пробуждения. В конце концов, одним из основных достоинств умных динамиков является то, что вы можете взаимодействовать с ними только голосом, выполняя другие задачи.

Возможно, это обещает будущее, в котором несколько интеллектуальных устройств можно будет использовать в одном пространстве. Вместо того, чтобы будить все интеллектуальные устройства в пределах слышимости, вы можете попросить одно устройство незаметно предоставить вам прогноз погоды.

Пока еще рано, но такие технологии могут сделать беспрепятственное взаимодействие человека и компьютера из научной фантастики реальностью в не столь отдаленном будущем.