Они больше не могут жить без забытой функции умных очков.
Субтитры стали «плагином» для современных людей. В дороге шумно, и ваши секреты легко раскрыть, пытаясь что-то поймать, и вы будете отвлекаться во время учебы. Только слушая и наблюдая, вы сможете избежать напрасного исчезновения индикатора выполнения.
Однако для некоторых субтитры — это больше, чем просто вишенка на торте.
Когда главный герой-мужчина «Вышедшего из-под контроля игрока» надел очки, он увидел информацию, которая изначально была незаметной и больше не была пассивным NPC.
На самом деле существует еще и разновидность умных очков, способных обеспечить «ходячий заградительный огонь». Хотя это и менее научно-фантастическое, оно также ведет к миру с большим количеством информации.
Я вижу, что ты сказал
Значение технологии в том, что когда Бог закрывает дверь, он открывает окно.
Видео распаковки слабослышащего блогера набрало 800 000 лайков в TikTok. Его заветное желание сбылось, и он заплакал от радости. Сила чистейшего всплеска эмоций тронула аудиторию, которая никогда раньше с ним не встречалась.
▲ Изображение взято с: TikTok@chrissymarshall_
Она держала коробку в руке, смеясь и плача одновременно. Она жестикулировала языком жестов и пыталась произнести полное предложение: «Я ждала технологии в этой коробке много лет».
В коробке находятся очки для субтитров, которые выглядят как обычные очки, но позволяют ей «видеть» звуки вокруг себя. Те звуки, которые она не могла слышать раньше, превратились в линии ярко-зеленых субтитров в стиле научной фантастики. .
Судя по информации в видео, очки, которыми пользуется этот блогер, называются Hearview, они созданы специально для слабослышащих. Они выпущены в мае этого года. Они от отечественной технологической компании, но они не для отечественных. использование и рынок находится за рубежом.
Его можно использовать для развлечения, просмотра фильмов, видео и просмотра живой игры «Черный миф: Вуконг».
Судя по опыту просмотра видео «Друзей», текст слегка запаздывает, но точен, а парное мобильное приложение тоже умеет различать разных говорящих.
В то же время его также можно использовать в личных беседах, чтобы облегчить людям с нарушениями слуха заказ еды в ресторанах, покупки в супермаркетах, общение с гидами по магазинам и навигацию во время вождения…
Принцип работы HearView не сложен: он соединяется с мобильным приложением, записывает звук через микрофон смартфона и использует алгоритм искусственного интеллекта для преобразования речи в текст в режиме реального времени, а субтитры отображаются на очках.
Если людям с нарушениями слуха необходимо ответить другим, они могут ввести сообщение в приложение и преобразовать текст в речь. Прошлые субтитры также сохраняются в приложении.
HearView утверждает, что точность преобразования речи в текст достигает 95%, и он может расшифровывать речь на расстоянии до 10 метров. В этот момент возникает вопрос: не ухудшится ли производительность в шумной среде, например, на влажных рынках?
Хотя HearView заявила, что мобильное приложение имеет функцию шумоподавления, я просмотрел различные видеоролики и не смог найти реальных измерений в шумной обстановке, поэтому изучить эффект сложно.
На официальном сайте упоминаются только некоторые параметры. Время автономной работы составляет 7 часов, вес — 52 грамма. Он также оснащен вибрацией и визуальными предупреждениями, напоминающими пользователям о возможных опасностях.
Он легкий и прочный, и кажется, что его стоит покупать, но он настолько дорогой, что с ним сложно завести друзей — 1799 долларов, около 12 800 юаней.
Более того, у Hearview есть много возможностей для улучшения. В настоящее время он поддерживает только английский и испанский языки и планирует поддерживать немецкий и французский языки. Он пока не может реализовать взаимный перевод между языками.
Цвет текста только ярко-зеленый, что обеспечивает читаемость на различных экранах и условиях освещения. Однако выбора у пользователя нет, что является ложкой дегтя.
Но существование означает ценность. Субтитры уже давно вошли в жизнь многих людей. Этого недостаточно. Они должны сопровождаться теми, кто в них больше всего нуждается, в более удобной и интуитивной форме.
Несмотря на то, что очков с субтитрами много, в жизни больше проблем.
Очки с субтитрами в реальном времени на самом деле не являются чем-то новым. Два года назад они были даже повальным увлечением, было запущено много интересных проектов, но им сложно быть идеальными.
Британский AR-стартап XRAI разработал XRAI Glass, приложение для преобразования голоса в текст, совместимое с различными AR-очками.
Однако репортер журнала Wired надел AR-очки, совместимые с XRAI Glass, и обнаружил, что, хотя передача голоса в текст хорошая, во время использования всегда возникают те или иные трения.
Прежде всего, с точки зрения пользовательского опыта: если вы носите кохлеарные импланты и слуховые аппараты, вам может быть неудобно носить очки. Хотя эти AR-очки и так очень легкие, они все же толще обычных очков.
Более того, преобразование речи в текст не работает должным образом при громком фоновом шуме или когда много людей разговаривают, что значительно снижает его практичность.
Цена также является проблемой. Очки AR стоимостью более 300 долларов США уже причинили боль в кошельке. XRAI Glass также требует ежемесячной подписки на десятки долларов. это неудивительно.
В Китае также существует продукт, аналогичный Hearview — очки с субтитрами для слушателей Liangliang Vision, которые разделены на версию для слухового аппарата и версию для перевода, которые могут понимать мандаринский диалект, диалекты и иностранные языки и поддерживать межъязыковый перевод.
Его использование аналогично Hearview. Загрузите приложение Translator, подключите очки к телефону через Bluetooth, подключитесь к Интернету через Wi-Fi или точку доступа, преобразуйте речь в текст в реальном времени на телефоне и отображайте текст на экране. очки.
Однако некоторые пользователи сообщили в App Store, что слушателям по-прежнему недостаточно поддержки диалектов. Это очень нужное, но сложное направление оптимизации, в этом виде продукта больше всего нуждаются пожилые люди, которые плохо слышат и привыкли говорить на диалектах.
Некоторые YouTube-блогеры также отметили, что скорость распознавания речи слушателя высокая и скорость тоже высокая, но если акцент сильный, скорость распознавания станет ниже.
▲Изображение: YouTube@Technology Assistant
Если не придерживаться формы очков, очень интересен прототип продукта, разработанный студентами Йельского и Стэнфордского университетов, под названием Transcribe Glass.
Это не очки, а проекционный дисплей, который крепится к оправе очков и работает прямо из коробки, подключая устройство к сопутствующему приложению для iOS и Android, позволяя пользователям выбирать предпочтительный вариант речи. текстовое программное обеспечение.
Сгенерированные субтитры передаются на устройство через Bluetooth Low Energy и накладываются на реальное поле зрения пользователя в реальном времени. Что редкость, так это то, что цена очень дружелюбная и составляет 95 долларов, но даже бета-версия все еще находится в списке ожидания, и до сих пор никакой информации о ее запуске не было.
В дополнение к продуктам, ориентированным на преобразование речи в текст, многофункциональные умные очки AR для всех часто также включают функции субтитров.
Беспроводные интеллектуальные очки «все в одном» стоимостью от 2000 до 3000 юаней в Китае в основном поддерживают преобразование речи в текст и перевод в реальном времени на несколько языков, но эффективность перевода может быть не такой хорошей, как у очков AR, предназначенных для людей со слухом. Если функция преобразования речи в текст постоянно включена, срок службы батареи также становится проблемой.
Когда я спросил о марке умных очков для головы, мне ответили: «Не рекомендуется людям с нарушениями слуха».
▲22 октября проконсультировалась со службой поддержки бренда умных очков.
Фактически, этот тип продукта больше всего подходит крупным производителям, особенно Google, который имеет глубокие технические накопления в области распознавания речи, машинного перевода и дополненной реальности, а также далеко впереди в возможностях преобразования речи в текст и перевода в реальном времени.
На I/O в 2022 году Google представила AR-очки, которые можно переводить в реальном времени, поддерживая 24 языка и даже американский язык жестов. Субтитры находятся рядом с собеседником, но это всего лишь демонстрация прототипа и есть. никакого последующего наблюдения.
Технологии во благо – основная предпосылка очков с субтитрами. Всякие «придирки» на самом деле происходят от горячего настроения, в надежде, что продукт не удовлетворится существующим положением вещей, продолжит развиваться, сделает это снова, улучшит его снова и снова. стать лучше.
Субтитры — это право, смотрите на мир, как будто смотрите фильм.
По данным Всемирной организации здравоохранения, около 466 миллионов человек во всем мире страдают потерей слуха, из них более 9 миллионов являются глубоко глухими.
Даже если они используют кохлеарные имплантаты или слуховые аппараты, людям с нарушениями слуха все равно необходимо сосредоточиться, чтобы понять, что говорят другие. В то же время некоторые слова со схожим произношением трудно различить только при чтении по губам. 40% слов английского языка Речевая информация может быть уловлена посредством движений губ говорящего.
Вот почему миру с нарушениями слуха слова нужны как дополнение. Кто-то давным-давно усердно работал над этим.
Кубино-американский актер немого кино Эмерсон Ромеро, который также был слабослышащим, впервые в 1947 году применил субтитры для звуковых фильмов.
В эпоху немого кино зрители могли понять сюжетную линию через изображения из фильма и вставленный текст. Однако, когда появилось звуковое кино, многие зрители с нарушениями слуха, такие как он, потеряли возможность смотреть фильм, потому что они не могли слышать строки, а в фильме отсутствовали субтитры. .
Поэтому Ромеро решил сделать свои собственные субтитры вручную: поскольку в то время фильмы проигрывались на пленке, он нарезал пленку и вставлял изображения с субтитрами между кадрами.
Последующую технологию субтитров можно рассматривать как продолжение духа Ромеро. В то же время существует больше проектов, облегчающих просмотр фильмов людям с нарушениями слуха. Например, некоторые американские кинотеатры предоставляют очки с готовыми субтитрами.
В 2012 году Sony выпустила очки субтитров CC для некоторых кинотеатров. В отличие от обычных субтитров, субтитры CC включают не только диалоговый контент, но и невербальную информацию, такую как фоновая музыка, звуковые эффекты и звуки окружающей среды.
Очки оснащены небольшими проекторами с каждой стороны, а зеленые субтитры кажутся парящими перед большим экраном.
Зрители могут четко видеть субтитры, где бы они ни находились в кинотеатре. Пользователи также могут регулировать яркость, расстояние отображения и угол субтитров, а также переключаться между шестью языками.
Очки даже поддерживают 3D, поэтому пользователям не придется носить дополнительные очки для просмотра 3D-фильмов. Это важно, чтобы избежать ситуации, когда переносица очень занята: просмотр фильмов в обычных очках, 3D-очках и очках субтитров CC одновременно.
▲ Изображение взято с: Reddit@ellowTonkaTrunk, опубликовано в 2022 г.
Эта сцена несколько иронична, но она похожа на метафору — чтобы понять мир с обычной точки зрения, некоторым людям всегда нужно платить больше.
Очки субтитров в реальном времени, которые еще не идеальны, но обещают будущее, по крайней мере позволяют нам увидеть замечательную возможность.
Пон Джун Хо, режиссер корейского фильма «Паразиты», однажды сказал на церемонии вручения «Оскара»: «Как только вы преодолеете барьер субтитров высотой в 1 дюйм, вы увидите еще больше замечательных фильмов».
Когда в жизни появляются распространенные в кино субтитры, это позволяет людям, которым они нужны, увидеть больше информации и иметь право не прекращать разговор.
В рекламном ролике AR-очков Google Translate есть очень трогательная фраза: «Я смотрю тебе прямо в глаза, а ты, кажется, смотришь прямо мне в глаза».
Ощущения существования почти нет, что является лучшим состоянием технологии.
При условии обеспечения эффективности и точности общение может вернуться к естественности. Нет необходимости занимать обе руки, не нужно опускать голову, чтобы посмотреть на мобильный телефон, и не нужно постоянно смотреть на губы. , лицом к лицу и зрительным контактом, точно так же, как и внешний вид, существовавший тысячи лет назад.
# Добро пожаловать на официальную общедоступную учетную запись WeChat aifaner: aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.
Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo