テキサスホールデム(ポーカー)の必勝プログラムが完成 ついに不完全情報ゲームでもコンピュータが人間を上回る
人工知能の歴史がまた1ページ更新された。
カナダのアルバータ大学は1月9日(日本時間)、ヘッズアップリミットホールデム(ポーカーの1種)において、コンピュータソフト「Cepheus」が“完全プレイ”を解析したと発表しました。研究成果をまとめた論文が米科学誌サイエンス(電子版)に掲載されています。
ヘッズアップリミットホールデムとは、手札2枚と共通カード(最大5枚)を組み合わせる「テキサスホールデム」という形式を1対1(ヘッズアップ)で行うもの。リミットとは賭け金が決められているタイプです(有り金を全部賭けるオールインなどは不可)。
つまり、同ゲームでは一定額ずつチップをかけての勝負(降りてもよい)を何度も行います。これを長期的にプレイすると「Cepheus」は絶対に負けないそうです。ポーカーは「不完全情報ゲーム」であり、相手の手札がわからないことからブラフも有効でしたが、リミットゲームにおいてはこのたび実質的な“完全解”が求められました。
研究チームによると、「Cepheus」は、CFRと呼ばれるアルゴリズム(あの時ああしていれば! という後悔を最小化するアルゴリズム:参考)の改良版「CFR+」を用いて、自分自身と対戦することで最適戦略を学習。2カ月にわたって、秒間60億以上の手を考えるCPUを4000個稼働し、完璧に近い腕前になったそうです。同ソフトは、これまで経験則として知られていた「ディーラーボタンのプレイヤー(最後に行動できる人)が有利」についても事実だと証明したほか、いくつかの有効なプレイ戦略についても明らかにしています。
同大学の研究チームは、2007年に「チェッカー」の完全解明を発表。同年にボウリング博士が作ったポーカーソフト「Polaris」が人間の一流プレイヤーと対戦し敗北しましたが、翌年には勝利を上げ注目されていました。
関連記事
参加費なんと1億円! 史上最大のポーカートーナメントがラスベガスで始まる
スケールでかすぎ。将棋の羽生名人と元チェス世界王者カスパロフがチェスで激突 ニコ生で99%の人が満足した熱戦の結果は?
天才と天才による神々の遊び。「将棋電王戦FINAL」来年3月14日に開幕! 元チェス世界王者・カスパロフさん「1試合でも勝てる限り、人間vsコンピュータは終わらない」
記者発表会に元チェス世界王者のカスパロフさんが登場。“敵”が“先生”になる日――コンピュータ将棋ソフト開発者 一丸貴則さん・山本一成さん(後編)
人間のプロ棋士とコンピュータソフトが戦った「将棋電王戦」。2人のソフト開発者はどんなことを考えて対局当日に臨み、そしてその結果に何を感じたのか。今後の人間とコンピュータとの関わり方についても考える。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.