Учёные из Google разработали состязательный метод обучения роботов

Татьяна Новак

Исследователи из Университета Карнеги — Меллона и компании Google придумали новый способ обучения роботизированных систем с использованием состязания. Заставив робота-манипулятора конкурировать с другим манипулятором, учёные смогли повысить его эффективность захвата предметов c 62% до 82%. Об этом пишет IEEE Spectrum.

В своём исследовании учёные использовали промышленного робота Baxter, который имеет два манипулятора. По условиям эксперимента один из этих манипуляторов учился захватывать и удерживать предметы, а другой — мешал ему в этом. Важно, что хотя оба манипулятора формально принадлежат одному роботу, они управляются отдельными конкурирующими нейросетями — то есть речь идёт о состязании двух роботизированных систем.

Благодаря глубокому обучению с каждым актом игры (удачной или неудачной попыткой захвата предмета) обе системы становились сильнее. В результате доля удачных захватов возросла до 82%, тогда как при обучении без соперника она не превышала 62%.

Робот против робота: один манипулятор старается захватить предмет, второй ему мешает. Фото: CMU

Ранее сообщалось, что инженеры из Калифорнийского университета в Беркли разработали робота DexNet 2.0, который умеет с первого раза захватывать и удерживать даже незнакомые предметы. Как пишут авторы разработки, это самый ловкий робот в мире — его попытки взять манипулятором новый предмет успешны в 99% случаев.

Загрузить еще