Этот гаджет с искусственным интеллектом позволяет мне говорить на языках, которых я не знаю и не понимаю
В «Автостопом по Галактике » рыба «Вавилонская» названа «вероятно, самым странным существом во Вселенной». Ее описывают как рыбу, похожую на пиявку, которая помещается в ваше ухо, питается мозговыми волнами из окружающей среды, а затем испражняется внутри вашего уха, издавая звуки на языке, который вы понимаете. По сути, это очень грубое и вопиющее, но чрезвычайно сложное устройство для перевода в реальном времени.
Спустя почти полвека после того, как Дуглас Адамс написал умопомрачительную и потрясающую (в буквальном смысле) конвульсивную сагу, концепция вавилонской рыбы все еще кажется завораживающей. Хотя мы все еще не так близки к уровню немедленного перевода, при котором мозговая волна превращается в дефекацию, множество гаджетов решают эту проблему гораздо менее отвратительным способом. Режим переводчика Google и Galaxy AI от Samsung являются яркими примерами технологий перевода, которые легко доступны, но некоторые бренды хотят решать эту проблему отдельно от смартфона. Timekettle — один из таких брендов, а его последний хаб X1 Interpreter — это портативное устройство, которое, как утверждается, делает это по-другому (читай: лучше) с использованием искусственного интеллекта.
Я говорю на трех языках и с удовольствием активно тестировал X1 AI Interpreter Hub от Timekettle. Но помимо небольшого развлечения, я также использовал его для общения с основателем компании из Гонконга на китайском языке и во время поездки в Малайзию в прошлом месяце. Я даже вызвался сопровождать свою жену в просмотре ее любимых корейских дорам без субтитров, и ниже я подробно расскажу, как это произошло.
Что отличает Timekettle X1 от других?
Нет недостатка в специализированных гаджетах, специально предназначенных для перевода. Сам Timekettle предлагает множество аксессуаров (некоторые из которых портативные), позволяющих устранить разрыв в общении между двумя очень далекими языками. Вы, вероятно, даже слышали об искусственном интеллекте и переводе в одном предложении после того, как ChatGPT действительно ворвался на сцену в конце 2022 года.
Но X1 AI Hub, по словам компании, использует лучший подход, чем многие существующие варианты. Это независимое решение, которое в настоящее время поддерживает до 40 языков и 93 акцентов, и ожидается, что в будущих обновлениях программного обеспечения будет добавлено еще больше. Он даже работает в автономном режиме (для некоторых языков) и поддерживает перевод через громкоговоритель или наушники (которые входят в комплект поставки).
Каждый концентратор X1 имеет уникальный номер телефона, который можно использовать для прямых звонков бесплатно и без каких-либо географических ограничений, если у вас есть подключение к Интернету. Самое главное, что любой перевод, будь то в режиме реального времени или по телефону, шифруется сквозным шифрованием, что предотвращает его перехват и интерпретацию кем-либо на этом пути. Все эти функции упакованы в довольно массивный, но все же карманный гаджет, работающий на Android, что упрощает обновление программного обеспечения для компании и пользователей. Он также поддерживает взаимодействие через сенсорный экран.
Уникальное и необычное оборудование
Говоря о физических характеристиках, Timekettle X1 представляет собой прямоугольный блок почти такой же длины, но в два раза шире обычного плоского телефона. Благодаря таким размерам его довольно легко держать и использовать одной рукой.
Первое, на что следует обратить внимание, — это 3,4-дюймовый сенсорный экран, который служит основным, но не единственным средством взаимодействия с переводчиком. Рядом с дисплеем находится многофункциональная, емкостная, бестактная кнопка, которая обычно вызывает жест «назад», но ее также можно коснуться и удерживать, чтобы активировать режим мгновенного перевода, о котором я расскажу позже. Два набора тактильных кнопок расположены сбоку для стандартных функций, таких как питание, увеличение и уменьшение громкости. Рядом с ними находится крошечный микрофон.
В нижней части концентратора X1 имеется порт USB-C для зарядки и полоса динамика. Здесь также есть несколько контактных площадок для штырей Pogo, что удобно при использовании специальной док-станции (продается отдельно), которая может заряжать до пяти концентраторов X1 одновременно. Эта часть концентратора X1 также служит лотком, открывающимся или закрывающимся с помощью толкающего механизма. Лоток используется для хранения наушников, которые являются частью гаджета и используются для передачи переведенных голосов прямо в ваши уши.
На противоположном краю находятся еще два выреза — предположительно для большего количества динамиков — и точка контакта NFC, которую можно использовать для мгновенного сопряжения двух концентраторов X1.
Наушники, входящие в комплект поставки, частично выполнены в форме вкладышей и, следовательно, не обеспечивают никакой шумоизоляции. Хотя это может немного отвлекать, это сознательный выбор, позволяющий гарантировать, что голоса других людей не будут приглушены. Благодаря дизайну «половина в ухе» вкладыши легче выпадают, а жест Timekettle, включающий в себя заушные крючки и силиконовые накладки для их устойчивости, кажется продуманным. Однако тот факт, что наушники необходимо помещать обратно в устройство, когда они не используются, приводит к тому, что вы теряете крючки гораздо раньше, и в итоге я вообще ими не пользовался.
Мне все еще хотелось бы, чтобы был способ соединить специальные наушники с концентратором, но компания сообщает мне, что специально настроила алгоритмы шумоподавления на основе драйверов этих наушников. Следовательно, выбор не поддерживать сторонние решения для прослушивания также является осознанным, поскольку это может помешать приему.
Интерфейс действительно прост для понимания и взаимодействия. Несмотря на то, что он по-прежнему основан на устаревшем Android 10, компания сообщила мне, что будет продолжать регулярно выпускать обновления интерфейса на протяжении многих лет, в первую очередь для улучшения словарного запаса алгоритма и понимания сленга и акцентов. Хотя было бы неплохо увидеть некоторые визуальные изменения в интерфейсе, компания не предъявляет претензий по этому поводу.
Как работают функции перевода
Timekettle Interpreter можно использовать несколькими способами, чтобы сделать многоязычное общение легким и легким. Хотя все режимы в основном служат одной и той же цели — переводу произнесенных слов на предпочитаемый вами язык — каждый из них оптимизирован для разных сценариев. В зависимости от режима вы можете использовать один или несколько хабов Timekettle X1 для взаимодействия с другими людьми.
Один на один
Первый режим предназначен для задушевных личных бесед всего двух человек. Вы вставляете один из наушников в ухо и делитесь другим с другим человеком. Вы можете назначить разные языки для каждого наушника и, по сути, оставить концентратор в стороне (но в пределах досягаемости, чтобы наушники оставались подключенными).
Наушники прослушивают, а затем передают сообщение обратно в хаб, на перевод которого уходит около секунды. Переведенные слова мгновенно передаются обратно на другой наушник. Все это происходит, пока весь разговор записывается и отображается на дисплее хаба X1.
Переводы в этом режиме обычно точны, но не убедительны. Этот режим требует, чтобы между двумя участниками было достаточное расстояние, чтобы голоса друг друга не проникали в наушники другого. Если они сидят рядом, хаб имеет тенденцию неправильно регистрировать слова — или иногда понимает правильно, но затем перезаписывает их чем-то менее значимым.
Слушай и играй
Следующий режим предназначен исключительно для прослушивания речи другого человека без необходимости говорить самому. В этом режиме вы выбираете языки, размещаете концентратор ближе к источнику звука, а затем вкладываете оба наушника в уши.
Приложение простое, и результаты так же хороши, как и ожидалось. Поскольку микрофоны в наушниках не задействованы и, следовательно, не борются друг с другом, речь проходит более плавно.
Стоит отметить, что хотя трансляция начинается мгновенно (и ее можно просмотреть на дисплее), хабу X1 требуется пауза в одну-две секунды, чтобы начать воспроизведение в наушниках. Это может немного затруднить понимание контекста, особенно когда говорящий не знает, что вам нужно, чтобы он немного отступил, чтобы ваше устройство перевода включилось. Однако, как только оно начнется, оно может продолжаться без перерывов. Но переведенная речь доходит до ваших ушей с опозданием на несколько секунд, что опять-таки вызывает легкую нервозность.
Честно говоря, это быстрее и точнее, чем то, что предлагает большинство смартфонов. Как я уже писал, работает нормально, когда динамик делает небольшой перерыв. Таким образом, этот режим эффективен для любых онлайн-выступлений или презентаций, которые вы посещаете. Для просмотра фильма или телепередачи на другом языке это не очень удобно, потому что переведенная речь звучит очень механически, без каких-либо эмоций или языковых различий для разных персонажей. Компания заявляет, что эти функции появятся в будущем обновлении, но я воздержусь от своих мыслей, пока не воспользуюсь ими сам.
Спроси и пойди
В отличие от двух предыдущих режимов, которые облегчают перевод в более тихой обстановке, Ask & Go лучше подходит для более громких и уличных условий. Что еще более важно, он действительно использует портативный дизайн, что обеспечивает быстрое и простое использование.
Вы можете установить язык один раз и запустить режим взаимодействия без каких-либо суетливых требований к совместному использованию наушников. Концентратор Timekettle X1 будет использовать внешний микрофон для прослушивания обоих языков, а затем воспроизводить переведенную версию через громкоговорители. После установки языка вы даже можете переключить этот режим, просто удерживая емкостную кнопку на передней панели, что делает его самым быстрым и простым режимом для использования в переводчике.
Что еще более важно, этот режим позволяет участвовать в разговоре более чем двум пользователям и автоматически определяет, когда говорят на одном из двух выбранных языков. Это особенно полезно, когда вы путешествуете в чужую страну и вам необходимо пообщаться с местным жителем в социальной среде, например на улице.
Хотя функциональность аналогична той, которую вы можете достичь с помощью телефона, скорость — и удивительно повышенная точность по сравнению с режимами, требующими наушников — делают эту функцию очень привлекательной.
Голосовой вызов
Еще одна примечательная и, возможно, выдающаяся особенность концентратора Timekettle X1 Interpreter — это его способность совершать многоязычные голосовые вызовы, как обычные интернет-вызовы. Каждому устройству присвоен шестизначный телефонный номер, который можно использовать для вызова другого устройства в любую точку Земли, если оно подключено к Интернету. В настоящее время эта возможность доступна бесплатно и обеспечивает практически мгновенный перевод.
Чтобы протестировать эту функцию, я поговорил с Леалом Тианом, генеральным директором и соучредителем Timekettle, используя функцию голосового вызова наряду с отключенным вызовом Zoom. Во время этого разговора Тиан говорил по-китайски, а я — по-английски. Наш разговор, охватывающий такие темы, как полезность этого гаджета, использование машинного обучения и будущее компании, происходил полностью на двух разных языках. Поток перевода был в основном плавным, но было несколько случаев повторения, особенно когда устройство пыталось перевести что-то в середине предложения. Это привело к некоторым разногласиям, но 90% нашего чата проходило без усилий.
Как и следовало ожидать, это может изменить правила игры для предприятий, особенно если вы работаете с командой людей из разных регионов.
Что делает «ИИ»?
Хаб Timekettle X1 AI Interpreter выглядит как практичное решение, позволяющее заполнить пробелы в общении, особенно в корпоративных условиях. Ключевым аспектом, должным образом отраженным в его названии, является его зависимость от искусственного интеллекта. Во время разговора с основателем Timekettle я спросил о роли искусственного интеллекта в устройстве, чтобы понять, является ли это на самом деле функцией или компания просто наживается на этой функции. Вот что мне сказали:
Хаб X1 AI Interpreter преимущественно опирается на две языковые модели. Первый из них известен как TurboFast и позволяет осуществлять одновременный дословный перевод на оба языка. Согласно Timekettle, он выбирает пословный маршрут вместо маршрута по каждому предложению, чтобы сократить время ожидания, пока один из пользователей говорит. Другая модель называется BoostClean . Это статистическая модель, предназначенная для устранения ошибок в наборе данных и используемая для подавления фонового шума.
Эти модели данных, по словам Тиана, постоянно обновляются на стороне сервера, но без использования каких-либо личных данных пользователей — чтобы добавить уверенности в том, что гаджет не подслушает ваши конфиденциальные разговоры. Меня также проинформировали, что компания в настоящее время рассматривает возможность использования индивидуальных переводов на каждом устройстве, чтобы позволить пользователям регистрировать и переводить технический жаргон или любые профессиональные термины, используемые в очень специфических контекстах. Это может быть добавлено как часть будущего обновления.
Отличное устройство, которому не хватает
Люди обычно наиболее выразительны на своем родном языке, и именно поэтому перевод остается жизненно важным для понимания других точек зрения. В то же время неизмеримо большая и постоянно развивающаяся библиотека разных языков при помощи искусственного интеллекта решает многие проблемы с инструментами прямого перевода, особенно на телефонах .
Обширный список функций Timekettle еще больше облегчает общение в различных сценариях. Это становится еще более интересным, если принять во внимание скорость перевода. Теоретически это звучит как незаменимый инструмент, особенно для бизнеса. Однако некоторые недостатки не позволяют ему показаться столь эффективным, как проектирует компания.
Хаб X1 по-прежнему страдает некоторыми эксплуатационными проблемами, особенно повторением фраз и переводом вне контекста. Это может помешать разговору и даже отрицательно повлиять на результат. Еще одна вещь, вызывающая беспокойство, — это высокая цена: одно устройство стоит 699 долларов , что может привести к значительным расходам, независимо от того, являетесь ли вы небольшим стартапом, стремящимся просто произвести впечатление на международных клиентов, или крупной корпорацией, стремящейся привлечь руководителей высшего звена более легким смехом. за которым последовало крепкое рукопожатие.
Конечно, это обходится гораздо дешевле, если учесть пожизненные затраты и языковые ограничения, связанные с наймом переводчика-человека. Однако опыт человека, даже если он говорит на одном языке, не может быть превзойден портативным гаджетом. Человек может привнести в разговор больше нюансов или даже отказаться от прямого перевода, чтобы избежать конфликта после того, как почувствует эмоции, стоящие за речью — то, в чем технологии в настоящее время не могут преуспеть. Хаб Timekettle в лучшем случае может помочь переводчикам-людям.
Помимо функциональных проблем, Timekettle AI Interpreter все еще может показаться тусклым, и у меня есть две идеи, которые бренд должен реализовать, чтобы это исправить. Во-первых, гаджету нужна функция автоопределения, чтобы пользователям не всегда приходилось вручную выбирать языки перед началом разговора. Во-вторых, мне бы очень хотелось использовать его с голосовым помощником, чтобы мне не приходилось возиться с опциями меню, тем более что на этом маленьком экране ограничено пространство.
Хотя я не буду так безжалостен по отношению к ИИ-центру Timekettle X1, как многие обозреватели к выводу Humane AI — просто потому, что он не достигает такого уровня теоретического новаторского мастерства, — я надеюсь, что компания устранит некоторые проблемы. Таким образом, было бы легче оправдать такую высокую цену и порекомендовать ее своим друзьям и коллегам, которые любят общаться на корпоративной речи.