Microsoft научила софт распознавать речь почти на уровне обычного человека

Николай Овчинников

Компания Microsoft сообщила, что её разработчикам удалось снизить процент ошибок при распознавании речи до 6,3%. По словам ведущего специалиста по разработке систем распознавания речи в Microsoft Сюдона Хуана, это один из самых низких показателей в индустрии на данный момент. Эти наработки используют в том числе при усовершенствовании голосового ассистента Cortana, представленного компанией год назад.

Ранее IBM сообщила, что процент ошибок в её системе распознавания голоса снизился до 6,6%. По данным IBM, такой же показатель у человека составляет 4%. У голосового поиска Google он равен 8%, причём в 2013 году он был почти в три раза больше. В китайском Baidu говорят о проценте ошибок ниже 5%.

По словам представителей Microsoft, 20 лет назад минимальный показатель составлял 43%, а у Windows 95 он был близок к 100%.

Как отмечает издание Digital Trends, таких показателей компаниям удалось достичь благодаря внедрению машинного обучения и нейронных сетей в системы распознавания голоса. Благодаря графическим процессорам (GPU) выросло быстродействие таких программ. У Cortana обработка информации из-за GPU происходит в 10 раз быстрее, чем у предыдущих похожих продуктов компании.

Загрузить еще