Искусственный интеллект победил профессиональных игроков в покер
Программа Libratus, разработанная в Университете Карнеги — Меллона, победила в 20-дневном покерном турнире «Brains Vs. Artificial Intelligence: Upping the Ante». Компьютер выиграл фишек на сумму более 1,7 миллиона долларов, сообщает n+1.
Компьютеры стали совершеннее
В последнее время наработки в области машинного обучения позволили компьютерам значительно продвинуться вперед и обыграть людей в играх, в которых это традиционно считалось невозможным. Однако, вплоть до недавнего времени люди по-прежнему побеждали в играх с неполной информацией.
В 2015 году программа Claudico (предшественник Libratus) играла с четырьмя профессиональными игроками и заняла третье место. На протяжении двух недель было сыграно 80 000 раздач и из четырех живых игроков только один набрал меньше фишек, чем компьютер.
В турнире, который проходил в питтсбургском казино Rivers было сыграно 120 тысяч раздач в безлимитный техасский холдем один на один (Хедз-Ап), против Libratus играли Даниэль МакОлэй, Джимми Чу, Донг Ким и Джейсон Лес.
В результате 20-дневного турнира программа победила людей, заработав более 1,7 миллиона долларов в фишках. Несмотря на это, разработчик не получат никаких денег, а призовой фонд в 200 тысяч долларов будет поделен между четырьмя живыми игроками в зависимости от занятого места.
Принцип работы пока не раскрывается
На данный момент точно не известно, как именно работает Libratus, авторы описали лишь общую структуру программы и планируют в ближайшем будущем опубликовать статью в рецензируемом журнале.
По словам разработчиков, Libratus состоит из трех частей. Основное «ядро» Libratus было подготовлено заранее, вычисления заняли 15 миллионов ядро-часов, в то время как на Claudico ушло два-три миллиона. Вторая часть программы следила за возможными ошибками, которые могли допустить соперники, и учитывала в процессе игры эту информацию.
Третья часть Libratus отслеживала собственные слабые стороны, которые могли использовать противники, и корректировала общую стратегию с учетом этих данных. Такой подход позволил программе как блефовать самостоятельно, так и распознавать дезинформацию со стороны соперников.
По мнению авторов программы у систем, подобных Libratus, большое будущее в самых разных сферах, где приходиться иметь дело с неполной информацией. В качестве возможных сфер применения программы исследователи называют информационную безопасность, военное дело, аукционы, переговоры и даже бережливое распределение медикаментов.
Кроме покера машины также победили людей в го, игру с полной информацией. В прошлом году программа AlphaGo выиграла у одного из сильнейших игроков в мире Ли Седоля четыре игры из пяти. В некоторых играх с неполной информацией человек до сих пор побеждает компьютер, в том числе в Starcraft.
Читайте также:
Искусственный интеллект обыграл в го сильнейшего игрока-профессионала