Алгоритм-переводчик от Google создал собственный язык

Татьяна Новак

Разработчики нового алгоритма перевода под названием Google Neural Machine Translation предполагают, что ИИ в процессе обучения создал собственный секретный язык-посредник.

В сентябре Google сообщила, что Google Neural Machine Translation уже допускает на 55-85% меньше ошибок, чем текущая версия переводчика.

Учёные тренировали многоязычную систему GNMT на примерах перевода в четырёх языковых парах: японский-английский, английский-японский, корейский-английский и английский-корейский. После этого они решили проверить: сможет ли нейросеть осуществить перевод в языковых парах корейский-японский и японский-корейский, примеры которого не были показаны системе?

Предположение исследователей оказалось верным: ИИ действительно может генерировать осмысленные переводы с корейского на японский и наоборот, хотя он и не обучался этому. Учёные назвали это явление «zero-shot translation». На анимации оно показано жёлтыми пунктирными линиями.

«Насколько нам известно, это первый раз, когда такой тип обучения сработал для машинного перевода», — утверждают в Google. Исследователи уверены, что искусственный интеллект не использовал при этом английский язык, поэтому предполагают, что он самостоятельно создал собственный язык-посредник — «интерлингву», который на глубинном уровне устанавливает связи между словами и фразами в новой паре языков. Подробнее об этом можно прочитать в документе на Arxiv.

Визуализация работы нейросети при переводе одного предложения на разные языки. Google Brain Team
Загрузить еще