Facebook начал озвучивать картинки для слепых при помощи искусственного интеллекта

Николай Овчинников

Facebook добавила в свои приложения функцию голосового описания содержания фото для слепых. Об этом компания сообщила в понедельник в своём блоге. Обновлённая версия приложения уже доступна для iOS и в скором времени появится в Play Market, пишет The Verge.

Функция называется Automatic alt text. Её разработала команда разработчиков Facebook Accessibility, которая адаптирует функции соцсети для людей с ограниченными возможностями. Один из авторов — инженер-программист Мэтт Кинг, потерявший зрение в колледже. На протяжении 20 лет Мєтт работает над созданием «доступной среды» для тех, кто не может в полной мере воспользоваться всеми функциями своих устройств из-за физического недуга.

Когда пользователь открывает пост с картинкой, Alt Text сообщает, что за предметы там изображены. Так, фото с пиццей Alt Text определяет как «пицца, еда». Сейчас программа может распознавать различный транспорт («лодка», «трактор», «автомобиль»), животных («кот», «собака»), элементы природы («море», «лес», «восход»), части тела и лица («рука», «борода»), эмоции («улыбка», «грусть»), еду («суши», «пицца»). Кроме того, программа может определить селфи. ALt Text имеет функцию машинного обучения: это означает, что его способности к распознаванию предметов и живых существ будут постепенно усовершенствоваться.

При этом Facebook будет сообщать о содержимом его фотографий, только если Alt text более чем на 80% уверен в том, что там на самом деле изображено. Это позволит избежать конфузов, вроде того, что случился с функцией автоматического теггинга в Google: та определяла чернокожих пользователей, как «горилл».

Facebook планирует разработать также программу по распознаванию объектов в видео, прототип которой был представлен в ноябре 2015 года. Кроме того, компания будет работать над «Visual Q&A»: пользователи смогут задавать ИИ соцсети вопросы о картинках и фотографиях и получать на них ответы.

Загрузить еще