Искусственный интеллект Libratus, сыгравший в покер с одними из лучших игроков в мире в техасский холдем, победил их и набрал 1,8 миллиона долларов в фишках. Само соревнование прошло довольно давно, однако теперь ученые Университета Карнеги-Меллон, занимающиеся разработкой ИИ, рассказали о принципах работы их детища.
фото: pixabay.com
Соревнование, о котором идёт речь, стартовало в начале текущего года и длилось 20 дней, в ходе него было отыграно 120 тысяч раздач. ИИ сыграл с каждым из игроков-людей и во всех случаях вышел победителем.
Разработчики отмечают, что алгоритмы, позволившие программе освоить покер, теоретически столь же применимы и к другим играм с неполной информацией, то есть тех, в которой для соперников присутствует элемент неопределённости. Более того, по словам специалистов, те же принципы распространяются и на многие другие аспекты жизни, от бизнес-переговоров до обеспечения кибербезопасности.
Libratus строит свою стратегию при помощи трёх основных модулей. Первый модуль позволяет избрать первоначальную тактику, основываясь на несколько упрощённом анализе игры. Поскольку просчитать и сопоставить абсолютно все варианты развития игры невозможно, компьютер «воспринимает» как идентичные некоторые комбинации, которые почти таковыми на интуитивном уровне воспринимает и человек — скажем, флеш, в котором старшей картой является король, и флеш, в котором старшей картой является дама.
Второй модуль позволяет на базе первоначальных идей и ходов соперника, которые были ими «не учтены», формировать новую, более тонкую стратегию. Наконец, третий модуль пытается внести в неё такие коррективы, которые могли бы извлечь максимум выгоды из характерных для конкретного оппонента ошибок.
Как сообщается, Libratus одолел не только людей, но и другие алгоритмы, созданные для игры в покер и в прошлом продемонстрировавшие свою эффективность.
Самое интересное за день в «МК» – в одной вечерней рассылке: подпишитесь на наш канал в Telegram.