AlphaGo Zero за несколько часов научилась играть в шахматы и сёги

Татьяна Новак

Разработанная исследователями из DeepMind программа AlphaGo Zero всего за четыре часа научилась побеждать лучший в мире шахматный симулятор Stockfish, и всего за два часа — симулятор игры в сёги Elmo. Об этом пишет Venture Beat.

AlphaGo Zero — это расширенная версия программы AlphaGo, которая ранее обыграла трех игроков-чемпионов в го. Разработчики утверждают, что с помощью обучения с подкреплением она может освоить практически любую настольную игру, а в перспективе ее можно будет использовать и для более важных задач — например, для изобретения новых лекарств.

При обучении игре в шахматы и сёги (японские шахматы) программа получала только список правил, а далее обучалась самостоятельно, разыгрывая миллионы партий сама с собой. Алгоритм сыграл по 100 партий против Stockfish и Elmo. Примечательно, что играя белыми шахматами, AlphaGo Zerо 25 раз выиграл и 25 раз сыграл в ничью. А играя чёрными, он выиграл только 3 раза и 47 раз сыграл в ничью. По словам разработчиков, это подтверждает, что первый ход в шахматах действительно даёт большое преимущество игроку.

Результаты игры в сёги оказались хуже: программа выиграла со счётом 92:8. Играя белыми фиграми, AlphaGo Zerо проиграл 5 раз, а играя черными — 3 раза. Как отмечают авторы, сёги — более сложная игра, чем обычные шахматы, поскольку для игры используется более крупная доска.

Загрузить еще