ニュース

テキサスホールデム(ポーカー)の必勝プログラムが完成 ついに不完全情報ゲームでもコンピュータが人間を上回る

人工知能の歴史がまた1ページ更新された。

advertisement

 カナダのアルバータ大学は1月9日(日本時間)、ヘッズアップリミットホールデム(ポーカーの1種)において、コンピュータソフト「Cepheus」が“完全プレイ”を解析したと発表しました。研究成果をまとめた論文が米科学誌サイエンス(電子版)に掲載されています

研究チームのマイケル・ボウリング博士(左)

 ヘッズアップリミットホールデムとは、手札2枚と共通カード(最大5枚)を組み合わせる「テキサスホールデム」という形式を1対1(ヘッズアップ)で行うもの。リミットとは賭け金が決められているタイプです(有り金を全部賭けるオールインなどは不可)。

 つまり、同ゲームでは一定額ずつチップをかけての勝負(降りてもよい)を何度も行います。これを長期的にプレイすると「Cepheus」は絶対に負けないそうです。ポーカーは「不完全情報ゲーム」であり、相手の手札がわからないことからブラフも有効でしたが、リミットゲームにおいてはこのたび実質的な“完全解”が求められました。

advertisement
サイエンス誌

 研究チームによると、「Cepheus」は、CFRと呼ばれるアルゴリズム(あの時ああしていれば! という後悔を最小化するアルゴリズム:参考)の改良版「CFR+」を用いて、自分自身と対戦することで最適戦略を学習。2カ月にわたって、秒間60億以上の手を考えるCPUを4000個稼働し、完璧に近い腕前になったそうです。同ソフトは、これまで経験則として知られていた「ディーラーボタンのプレイヤー(最後に行動できる人)が有利」についても事実だと証明したほか、いくつかの有効なプレイ戦略についても明らかにしています。

 同大学の研究チームは、2007年に「チェッカー」の完全解明を発表。同年にボウリング博士が作ったポーカーソフト「Polaris」が人間の一流プレイヤーと対戦し敗北しましたが、翌年には勝利を上げ注目されていました。

Copyright © ITmedia, Inc. All Rights Reserved.

記事ランキング

  1. 大きくなったらかっこいいシェパードになると思っていたら…… 予想を上回るビフォーアフターに大反響!→さらに1年半後の今は? 飼い主に聞いた
  2. 高校生の時に出会った2人→つらい闘病生活を経て、10年後…… 山あり谷ありを乗り越えた“現在の姿”が話題
  3. 「こんなことが出来るのか」ハードオフの中古電子辞書Linux化 → “阿部寛のホームページ”にアクセス その表示速度は……「電子辞書にLinuxはロマンある」
  4. 「大物すぎ」「うそだろ」 活動中だった“美少女新人VTuber”の「衝撃的な正体」が判明 「想像の斜め上を行く正体」
  5. ディズニーシーのお菓子が「異様に美味しい」→実は……“驚愕の事実”に9.6万いいね 「納得した」「これはガチ」
  6. プロが教える「PCをオフにする時はシャットダウンとスリープ、どっちがいいの?」 理想の選択肢は意外にも…… 「有益な情報ありがとう」「感動しました
  7. 「防音室を買ったVTuberの末路」 本格的な防音室を導入したら居住空間がとんでもないことになった新人VTuberにその後を聞いた
  8. 間寛平、33年間乗り続ける“希少な国産愛車”を披露 大の車好きで「スカイラインGT-R R34」も所有
  9. 「そうはならんやろ!」  おじいちゃん先生が鉛筆1本でトラを描いたら……あまりの急展開が1300万表示「なるほどわからんすごい」
  10. 走行中の車から同じ速さで後方へ飛び降りると? 体を張った実験に反響「問題文が現実世界で実行」【海外】