Новая система искусственного интеллекта (ИИ) DeepCube за 44 часа самостоятельно научилась собирать кубик Рубика.
Раньше ИИ могли самостоятельно обучаться игре в шахматы и в Го. Однако система обучения с подкреплением, которая использовалась в этих случаях, не подходила для решения 3D-головоломок вроде кубика Рубика, пишет Хроника.инфо со ссылкой на Буквы
В случае с шахматами или Го ИИ достаточно легко оценить свой ход как удачный или неудачный и, исходя из этого, сделать выводы для дальнейшей игры. Но в случае с кубиком Рубика ИИ не мог быстро определить последствия принятого решения, не получал условной “награды”, которая стимулирует обучение, и, соответственно, не обучался.
Читайте также: Искусственный интеллект научили предсказывать дату смерти
При создании DeepCube команда программистов во главе со Стивеном Макалиром использовали специальную систему установок. Благодаря ей после каждого хода ИИ “перепрыгивает” к уже собранному кубику и таким образом определяет “силу” ходов. Когда система собирает достаточно данных, она использует классический метод “дерева решений”, проверяя каждое движение чтобы узнать, благодаря какому можно быстрее всего решить головоломку.