Компания Baidu выпустила приложение для голосового набора

Татьяна Новак

Китайская компания Baidu Research 3 октября запустила приложение для голосового набора TalkType, сообщает Techcrunch.

По словам разработчиков, от других приложений голосового набора TalkType отличается специальным дизайном сенсорной клавиатуры. «В отличие от обычных конструкций клавиатуры для смартфона, где голосовой режим предназначен для случайного использования и представлен небольшим значком микрофона, TalkType разработан, чтобы сделать голосовой режим основным», — говорит руководитель Baidu Research Биджит Гальдер.

Приложение TalkType

Приложение позволяет также добавлять знаки препинания с помощью голосовых команд: «запятая», «точка», «знак вопроса» и «восклицательный знак».

Приложение разработали сотрудники Baidu на основе алгоритма распознавания речи Deep Speech 2. В августе его протестировали специалисты из Стэнфордского университета и Университета штата Вашингтон. Во время теста программа соревновалась с 32 людьми, из которых 16 — носители английского, и 16 — китайского языков. Участники должны были воспринять на слух, а затем набрать на клавиатуре iPhone короткие фразы без контекста, например «пристегнуть ремень безопасности» или «носить корону с множеством драгоценных камней». Для текстинга на английском люди использовали сенсорную стандартную QWERTY-клавиатуру, а на китайском — клавиатуру пиньинь для iOS. По словам исследователей, эти раскладки являются наиболее популярными и участники эксперимента привыкли на них печатать.

Оказалось, что скорость Deep Speech 2 значительно превышает скорость человеческого набора: с сообщениями на английском языке программа справляется в 3 раза быстрее, а на китайском — в 2,8 раз быстрее, чем люди. Кроме того, печатая фразы на английском языке, программа допускает на 20,4% меньше ошибок, чем люди, а на китайском — на 63,4% меньше.

Загрузить еще