Google Gemini облегчает веб-серфинг для пользователей с проблемами зрения и слуха

Устройства Android уже много лет предлагают встроенную функцию чтения с экрана под названием TalkBack . Она помогает людям с проблемами зрения понимать, что появляется на экране их телефона, и позволяет им управлять им с помощью голоса. В 2024 году Google добавила в этот микс свой Gemini AI, чтобы давать пользователям более подробное описание изображений.

Google теперь усиливает его совершенно новым уровнем интерактивного удобства для пользователей. До сих пор Gemini описывал только изображения. Теперь, когда пользователи просматривают изображения, они могут даже задавать дополнительные вопросы о них и вести более подробную беседу.

Как это помогает пользователям с проблемами зрения?

«В следующий раз, когда друг пришлет вам фото своей новой гитары, вы сможете получить описание и задать уточняющие вопросы о марке и цвете, или даже о том, что еще изображено на изображении», — говорит Google. Это основано на обновлении доступности, которое интегрировало Gemini в систему Talkback в конце прошлого года.

Меню Talkback на Android теперь отображает специальную функцию Describe Screen, которая ставит Gemini на место водителя. Так, например, если пользователи просматривают каталог одежды, Gemini не только опишет то, что появляется на экране, но и ответит на соответствующие вопросы.

Например, пользователи могут задавать такие вопросы, как «Какое платье лучше всего подойдет для прогулки холодным зимним вечером?» или «Какой соус лучше всего подойдет к сэндвичу?» Gemini также сможет анализировать весь экран и информировать пользователей о подробных сведениях о продукте или о доступных скидках.

Создание выразительных титров и улучшение масштабирования текста

В браузере Chrome Google немного улучшает автоматически генерируемые субтитры для видео. Допустим, вы смотрите футбольный матч. Субтитры больше не будут просто следовать словам комментатора, но также будут соответствовать его эмоциям и выражениям.

Например, вместо «goal» пользователи с проблемами слуха увидят звучное «goooaaal» для дополнительного эмоционального акцента. Google называет их Expressive Captions.

В дополнение к человеческой речи, они теперь также будут охватывать важные звуки, такие как свист, ликование или даже просто прочищение горла говорящим. Выразительные субтитры будут доступны на всех устройствах под управлением Android 15 или более поздней версии в США, Великобритании, Канаде и Австралии.

Еще одно значимое изменение, которое появится в браузере Chrome, — это адаптивный текстовый зум, который по сути является обновлением системы Page Zoom, доступной на телефонах Android. Теперь, когда пользователи увеличивают размер текста, это не повлияет на макет остальной части веб-страницы.

«Вы можете настроить масштаб и легко применить настройки ко всем посещаемым вами страницам или только к определенным», — говорит Google. Пользователи смогут изменять диапазон масштабирования с помощью ползунка в нижней части страницы.