Португальские учёные научили нейросеть определять сарказм в Twitter

Татьяна Новак

Учёные из Лиссабонского университета создали нейросеть, которая определяет, стоит ли буквально понимать смысл сообщений в Twitter. Об этом пишет New Scientist.

Технология основана на обработке данных, которые помогут понять контекст каждого твита — в первую очередь, всех предыдущих твитов и действий пользователя в соцсети. «Лексические реплики сами по себе не несут достаточной информации для распознавания иронических интонаций. Критически важно понимать контекст высказывания, даже для людей», — говорит автор исследования Сильвио Амир.

Например, сообщение «Разве Обама не крут?!» может выражать совершенно противоположные эмоции в зависимости от того, кто его пишет — демократ или республиканец. Чтобы определить, стоит ли понимать её буквально, нейросеть отслеживает, кого фоловит пользователь: республиканцев или демократов, и таким образом вычисляют его политические предпочтения. Программа также наносит данные о каждом пользователе на карту политических предпочтений.

Карта показывает, кого фоловят пользователи - республиканцев или демократов. Синими точками обозначены пользователи, которые подписаны хотя бы на один аккаунт демократов:@BarackObama , @HillaryClinton и @BernieSanders. Красными - те, кто подписаны на аккаунты республиканцев: @marcorubio , @tedcruz и @realDonaldTrump. Иллюстрация: Silvio Amir

Если программа определяет, что высказывание в твите идет вразрез с тем, что пишут большинство людей из той же группы, то, скорей всего, это — сарказм. Такой вывод программа делает и в том случае, если находит в бекграунде пользователя твиты с противоположным смыслом. Подробнее о технологии можно прочитать тут.

Амир говорит, что эту программу можно использовать для изучения сообщений на любом языке и на любой платформе, где открыта информация о пользователе и его активности. Исследователь Марк Карман из Университета Монаша считает, что такую технологию определения сарказма можно легко объединить с другими — например, с отслеживанием эмоций, и она станет находкой для маркетологов и разработчиков ботов-ассистентов.

На следующей неделе команда представит свои наработки на CoNLL, конференции по обработке естественного языка в Берлине, которую спонсирует Google. По словам Амира, программа верно определяет сарказм в 87% случаев. Это немного выше, чем результат, которого добились учёные из Университета Карнеги-Меллон в США. В январе они тоже представили алгоритм, который находит сарказм в письменно речи с точностью 85%.

Недавно специалисты из Yahooo заявили, что разработали нейросеть, которая умеет находить в комментариях язык вражды ив 90% случаев верно определяет сообщения с оскорбительными коннотациями.

Загрузить еще