Яндекс.Переводчик начал переводить эмодзи

Татьяна Новак

В российском сервисе Яндекс.Переводчик заработала функция перевода текстов на любом языке в язык эмодзи и наоборот. Об этом сообщается в блоге «Яндекса».

«Введите в Переводчик отдельное слово, словосочетание или целую фразу, и он представит их в виде эмодзи. Или наоборот: можно перевести на русский набор картинок, который вам прислали в чат, — возможно, при этом откроется новый смысл послания», — пишут разработчики.

Как правило, алгоритм машинного перевода осваивает новый язык с помощью анализа параллельных текстов — то есть текстов, написанных как на незнакомом языке, так и на уже известном. Таким образом Яндекс.Переводчик выучил 94 языка, в том числе, эсперанто и язык эльфов. Однако параллельных текстов на языке эмодзи очень мало, поэтому алгоритм пришлось обучать на «словарях» — сайтах, где собраны все известные эмодзи (пиктограммы) и их значения.

«Когда вы хотите перевести на эмодзи ту или иную фразу, Переводчик разбивает её на отдельные элементы: слова и комбинации слов. Каждый элемент представляется в виде вектора — иными словами, записывается в виде набора чисел. Аналогичная операция проводится и с описаниями эмодзи. Затем векторы сопоставляются. Чем ближе друг к другу находятся векторные представления, тем точнее смысловое соответствие между словами и эмодзи», — объясняет «Яндекс». Так как на данный момент количество эмодзи ограничено несколькими тысячами, программа может подобрать точный перевод далеко не к каждому слову. В таких случаях она ищет пиктограммы, близкие по смыслу. Например, слово «квас» может быть изображено как бокал с неким напитком.

Перевод на язык эмодзи работает в веб-версии Яндекс-Переводчика, а также в мобильных версиях для iOS и Android.

Загрузить еще