ニュース

テキサスホールデム(ポーカー)の必勝プログラムが完成 ついに不完全情報ゲームでもコンピュータが人間を上回る

人工知能の歴史がまた1ページ更新された。

advertisement

 カナダのアルバータ大学は1月9日(日本時間)、ヘッズアップリミットホールデム(ポーカーの1種)において、コンピュータソフト「Cepheus」が“完全プレイ”を解析したと発表しました。研究成果をまとめた論文が米科学誌サイエンス(電子版)に掲載されています

画像 研究チームのマイケル・ボウリング博士(左)

 ヘッズアップリミットホールデムとは、手札2枚と共通カード(最大5枚)を組み合わせる「テキサスホールデム」という形式を1対1(ヘッズアップ)で行うもの。リミットとは賭け金が決められているタイプです(有り金を全部賭けるオールインなどは不可)。

 つまり、同ゲームでは一定額ずつチップをかけての勝負(降りてもよい)を何度も行います。これを長期的にプレイすると「Cepheus」は絶対に負けないそうです。ポーカーは「不完全情報ゲーム」であり、相手の手札がわからないことからブラフも有効でしたが、リミットゲームにおいてはこのたび実質的な“完全解”が求められました。

advertisement
画像 サイエンス誌

 研究チームによると、「Cepheus」は、CFRと呼ばれるアルゴリズム(あの時ああしていれば! という後悔を最小化するアルゴリズム:参考)の改良版「CFR+」を用いて、自分自身と対戦することで最適戦略を学習。2カ月にわたって、秒間60億以上の手を考えるCPUを4000個稼働し、完璧に近い腕前になったそうです。同ソフトは、これまで経験則として知られていた「ディーラーボタンのプレイヤー(最後に行動できる人)が有利」についても事実だと証明したほか、いくつかの有効なプレイ戦略についても明らかにしています。

 同大学の研究チームは、2007年に「チェッカー」の完全解明を発表。同年にボウリング博士が作ったポーカーソフト「Polaris」が人間の一流プレイヤーと対戦し敗北しましたが、翌年には勝利を上げ注目されていました。

Copyright © ITmedia, Inc. All Rights Reserved.

記事ランキング

  1. ペットショップで売れ残っていた5万5000円の柴犬→お迎えして半年後…… “一目瞭然の姿”が240万表示「うるってなった」
  2. 普通のクリップを2つつなげるだけで…… あると助かる“便利グッズ”に大変身 「マジで!」「素晴らしいアイデア」【海外】
  3. 「買ってよかった」 ワークマンのEXILE TAKAHIRO監修“2900円パンツ”に高評価続出 プロデュース手腕に称賛の声も
  4. 自宅の犬小屋に住み着いた野良猫、1年後の姿に「泣いた」と大反響 それからどうなった?現在の様子を聞いた
  5. ネットで買った“詐欺ドレス”→本物を探してみると…… まさかの展開が衝撃の700万再生「なんてことだ」【海外】
  6. 妹が生まれ、うれしそうな兄2人→7年間撮り続けたら…… “すてきな仕掛け”の記念写真に「ぐぉぁぁぁーー良すぎる」「ずっと続けて欲しい!」
  7. 6年間外につながれひとりで取り残されていたワンコ、あれから半年後…… 別犬のような姿に「嬉しすぎて泣きそう」「只々感動です」
  8. 捨てるしかないトイレットペーパーの芯をそのまま通すだけで…… 目からウロコの簡単ライフハックに「天才!」「素晴らしいアイデア」【海外】
  9. 老けて見える25歳男性を評判の理容師がカットしたら…… 別人級の変身と若返りが3700万再生「ベストオブベストの変貌」【海外】【老けて見える男性のカット 反響TOP2】
  10. 古くなったセーター捨てないで! 驚きの“アイデア7選”が目からウロコ「想像力に嫉妬」「こんなにいろいろ作れるんだ」と400万再生【海外】