Facebook улучшает описания изображений AI для слабовидящих пользователей

Facebook значительно улучшил модель искусственного интеллекта, которую он использует, чтобы помочь слепым и слабовидящим распознавать изображения на платформе. Обновления этого инструмента AI сделали его еще более надежным в предоставлении точных описаний изображений.

Facebook представляет новое поколение автоматического альтернативного текста

В сообщении блога About Facebook Facebook описал изменения, внесенные в свой инструмент AI для распознавания изображений. Facebook называет эту технологию автоматическим альтернативным текстом (AAT).

По теме: Новый AI от Facebook переводит на 100 языков

Эта система искусственного интеллекта была первоначально развернута в 2016 году и с тех пор позволяет слабовидящим людям слышать описания изображений, созданные искусственным интеллектом, с помощью программ чтения с экрана. Теперь Facebook представляет «следующее поколение» AAT.

Facebook улучшил количество элементов и концепций, которые его ИИ может надежно распознавать. Он также работал над тем, чтобы сделать эти описания более конкретными, поскольку теперь ИИ может распознавать животных, действия и ориентиры на фотографии. Например, одно описание может гласить: «Это может быть селфи двух человек на открытом воздухе, Пизанская башня».

Инструмент искусственного интеллекта может даже определить местоположение и размер элементов на фотографии. Это позволяет инструменту лучше понять, как на самом деле выглядит фотография. Раньше система ограничивалась предоставлением расплывчатых описаний, которые не включали положения людей и объектов на изображении.

Facebook достиг этого нового уровня детализации, используя модель, «обученную на слабо контролируемых данных в виде миллиардов общедоступных изображений Instagram и их хэштегов». Это позволяет ИИ точно распознавать более 1200 концепций, что намного больше, чем мог бы сделать оригинальный инструмент.

Несмотря на эту повышенную точность, Facebook по-прежнему оставляет место для ошибок. Вот почему фраза «может быть» стоит перед каждым описанием фотографии на тот случай, если инструмент неточно сообщает содержание изображения.

Facebook отметил положительное влияние, которое это обновление окажет на сообщество, заявив:

Эти усовершенствования помогают слепым или слабовидящим пользователям лучше понимать, что изображено на фотографиях, опубликованных их семьей и друзьями, а также на их собственных фотографиях, путем предоставления дополнительной (и более подробной) информации.

Прокладывая путь к доступности в Интернете

Новый и улучшенный инструмент искусственного интеллекта Facebook обещает рост числа инструментов доступности в сети и устанавливает новый стандарт доступности в социальных сетях. Будем надеяться, что на других платформах будет реализован аналогичный инструмент, поскольку он будет огромным подспорьем для пользователей с ослабленным зрением.