カナダのアルバータ大学は1月9日(日本時間)、ヘッズアップリミットホールデム(ポーカーの1種)において、コンピュータソフト「Cepheus」が“完全プレイ”を解析したと発表しました。研究成果をまとめた論文が米科学誌サイエンス(電子版)に掲載されています。

ヘッズアップリミットホールデムとは、手札2枚と共通カード(最大5枚)を組み合わせる「テキサスホールデム」という形式を1対1(ヘッズアップ)で行うもの。リミットとは賭け金が決められているタイプです(有り金を全部賭けるオールインなどは不可)。
つまり、同ゲームでは一定額ずつチップをかけての勝負(降りてもよい)を何度も行います。これを長期的にプレイすると「Cepheus」は絶対に負けないそうです。ポーカーは「不完全情報ゲーム」であり、相手の手札がわからないことからブラフも有効でしたが、リミットゲームにおいてはこのたび実質的な“完全解”が求められました。

研究チームによると、「Cepheus」は、CFRと呼ばれるアルゴリズム(あの時ああしていれば! という後悔を最小化するアルゴリズム:参考)の改良版「CFR+」を用いて、自分自身と対戦することで最適戦略を学習。2カ月にわたって、秒間60億以上の手を考えるCPUを4000個稼働し、完璧に近い腕前になったそうです。同ソフトは、これまで経験則として知られていた「ディーラーボタンのプレイヤー(最後に行動できる人)が有利」についても事実だと証明したほか、いくつかの有効なプレイ戦略についても明らかにしています。
同大学の研究チームは、2007年に「チェッカー」の完全解明を発表。同年にボウリング博士が作ったポーカーソフト「Polaris」が人間の一流プレイヤーと対戦し敗北しましたが、翌年には勝利を上げ注目されていました。
コメントランキング
「ルートインの大浴場 最高」「設備が充実のドーミーイン」 “お風呂が最高”だと思う「ビジネスホテル」は?【アンケート実施中】 | ライフスタイル ねとらぼ
東京都の「そば」の名店10選! 一番うまいと思う店はどこ?【人気投票実施中】(1/4) | 東京都 ねとらぼリサーチ
ヤマト、CLANNAD、ヴァイオレット・エヴァーガーデン…… 令和に語り継ぎたい「昭和・平成の感動したアニメ」は?【アンケート実施中】(投票結果) | アニメ ねとらぼ
「友達にドーミーイン勧めてる」「至れり尽くせりな東横イン」 “サービスが最高”だと思う「ビジネスホテル」は?【アンケート実施中】(投票結果) | ライフスタイル ねとらぼ
「初見で読めたら天才」 静岡県の“難読市町名”ランキング1位が難しすぎる「読めねぇよ」「知らないと無理」(コメント一覧) | 東京都 ねとらぼリサーチ