В США придумали новый метод обучения роботов на основе теста Тьюринга

Татьяна Новак

Учёные из Университета Шеффилда придумали новый метод обучения и формирования моделей поведения роботов, основанный на разработках Алана Тьюринга. Об этом пишет Daily Mail.

Алан Тьюринг в 1949 году придумал тест, позволяющий определить степень «разумности» машины. Искусственный интеллект должен отвечать на вопросы таким образом, чтобы человек-наблюдатель не отличил его поведение от человеческого. В этом эксперименте используется похожая схема, но учёные исключили из неё человеческий фактор. «На наш взгляд, машины лучше справляются с работой наблюдателя. Они могут обнаружить тонкие различия, которые мы, люди, можем не заметить», — утверждает доктор Родерик Гросс.

Он занимается исследованиями в сфере групповой робототехники — разрабатывает технологии управления многочисленной группой роботов, которая выполняет сложные задачи совместными усилиями. Такую группу роботов исследователи называют роем (swarm) — по аналогии с роем насекомых, у которых раньше всего был обнаружен эффект системного (роевого) поведения.

Учёные заставили искусственный интеллект наблюдать за поведением роя роботов с заданной моделью поведения и другим роем, который должен был научиться имитировать их поведение. Компьютер-наблюдатель было определить, какой из роёв является подражающим, а какой оригинальным. Если робот определял верно, его вознаграждали биткоинами, а если ошибался, то награду получал рой подражателей. Благодаря такой системе подкрепления роботы-подражатели от сеанса к сеансу корректировали собственное поведение, чтобы добиться большего сходства с оригинальным роем. Исследование опубликовал журнал Swarm Intelligence.

Схема Обучения Тьюринга. Компьютер наблюдает за поведением робота-агента (красный) и роботов-подражателей (синие). Иллюстрация: Univercity of Sheffield

Учёные назвали этот метод формирования моделей поведения «обучением Тьюринга». Главное преимущество метода состоит в том, что машине не нужно объяснять, чему она должна научиться. «Представьте, что вы хотите научить робота рисовать, как Пикассо. Алгоритмы машинного обучения смогут оценить, насколько картины робота похожи на картину Пикассо, но сначала необходимо, чтобы кто-то объяснил алгоритму, что считается похожим на Пикассо, а что нет. Обучение Тьюринга не требует таких исходных данных. Достаточно просто вознаграждать робота тогда, когда он рисует достаточно похоже», — говорит Гросс.

Он считают, что таким образом можно создавать и корректировать модели поведения в любых естественных или искусственных системах. Для создания обучающей системы достаточно агента (примера для подражания), подражателей, алгоритма сравнения и системы подкрепления. Например, чтобы сделать компьютерные игры реалистичнее, можно обучить искусственный интеллект имитировать поведение игроков-людей.

На данный момент «обучение Тьюринга» протестировали только на роях роботов. В дальнейшем исследователи хотят провести эксперимент, в ходе которого машина будет наблюдать за поведением косяка рыб или роя пчёл. Они считают, что в будущем таким образом можно будет выявлять отклонения в поведении животных, и, возможно, людей.

Загрузить еще