Новая система искусственного интеллекта (ИИ) DeepCube за 44 часа самостоятельно научилась собирать кубик Рубика.

Раньше ИИ могли самостоятельно обучаться игре в шахматы и в Го. Однако система обучения с подкреплением, которая использовалась в этих случаях, не подходила для решения 3D-головоломок вроде кубика Рубика, пишет Хроника.инфо со ссылкой на Буквы

В случае с шахматами или Го ИИ достаточно легко оценить свой ход как удачный или неудачный и, исходя из этого, сделать выводы для дальнейшей игры. Но в случае с кубиком Рубика ИИ не мог быстро определить последствия принятого решения, не получал условной “награды”, которая стимулирует обучение, и, соответственно, не обучался.

Читайте также: Искусственный интеллект научили предсказывать дату смерти

При создании DeepCube команда программистов во главе со Стивеном Макалиром использовали специальную систему установок. Благодаря ей после каждого хода ИИ “перепрыгивает” к уже собранному кубику и таким образом определяет “силу” ходов. Когда система собирает достаточно данных, она использует классический метод “дерева решений”, проверяя каждое движение чтобы узнать, благодаря какому можно быстрее всего решить головоломку.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *