Google представил новый синтезатор речи для интернета вещей

Татьяна Новак

Компания Google предложила разработчикам интернета вещей использовать свою программу для преобразования текста в речь, которая уже работает в Google Maps и Google Assistant. Об этом пишет Engadget.

Программа под названием Cloud Text-to-Speech доступна через облачную платформу Google. Она работает на базе речевого синтезатора WaveNet, созданного британским подразделением компании DeepMind. По словам разработчиков, WaveNet «сократил разрыв между уровнем техники и человеческим уровнем более чем на 50%». В отличии от популярных TTS-программ, которые синтезируют речь из фрагментов записей человеческого голоса, программа WaveNet воспроизводит непосредственно звуковые волны, анализируя их с помощью нейронных сетей.

В Cloud Text-to-Speech есть 32 разных голосов и 12 языков, включая английский, французский, португальский, немецкий и турецкий. Некоторые параметры, такие как скорость речи, высота тона и громкость, пользователи могут настраивать самостоятельно. Google пишет, что использовать этот синтезатор голоса можно не только в приложениях и мессенджерах, но и в любых подключаемых устройствах, в том числе, беспилотных автомобилях.

Недавно компания IBM выпустила Watson Assistant — интеллектуальную платформу, позволяющую компаниям создавать собственных голосовых помощников для мобильных приложений, мессенджеров и даже роботов.

Загрузить еще