Ученые из МТИ научили нейросети предугадывать жесты

Лев Шевченко

Исследователи из Лаборатории ИИ и информатики Массачусетского технологического института разработали алгоритм машинного обучения, который может предсказать, когда два человека «дадут пять», обнимутся, поцелуются или пожмут друг другу руки. Об этом пишет MIT News.

«Люди научились предвидеть действия через опыт, — говорит главный автор исследования аспирант Карл Вондрик, — и мы решили попробовать научить компьютеры этому. Мы хотим показать, как алгоритм научился распознавать окружающие его объекты, «просмотрев» огромное количество видеоматериалов». Доклад будет представлен на этой неделе на Международной конференции по компьютерному зрению и распознаванию образов (International Conference on Computer Vision and Pattern Recognition, CVPR).

Суть алгоритма заключается в том, чтобы несколько нейросетей предугадывают разные повадки людей и анализируют свои заключения в широком смысле. Нейросети тренировались распознавать жесты на телешоу «Офис» и «Отчаянные домохозяйки» и с их помощью выделять поцелуи, объятия и «дай пять». Если большинство нейросетей увидят в движениях человека подготовку к определенному жесту, значит он произойдет.

Пока алгоритм работает не эффективнее человека. Он предсказал лишь 43% жестов против 71%, предугаданного людьми. Развитие этой технологии позволит создать роботов, которые смогу отвечать на человеческие жесты, ловить падающих людей, а камеры наблюдения смогут предугадывать действия нарушителей.

Загрузить еще