ニュース
» 2015年01月09日 16時00分 公開

テキサスホールデム(ポーカー)の必勝プログラムが完成 ついに不完全情報ゲームでもコンピュータが人間を上回る

人工知能の歴史がまた1ページ更新された。

[ねとらぼ]

 カナダのアルバータ大学は1月9日(日本時間)、ヘッズアップリミットホールデム(ポーカーの1種)において、コンピュータソフト「Cepheus」が“完全プレイ”を解析したと発表しました。研究成果をまとめた論文が米科学誌サイエンス(電子版)に掲載されています

画像 研究チームのマイケル・ボウリング博士(左)

 ヘッズアップリミットホールデムとは、手札2枚と共通カード(最大5枚)を組み合わせる「テキサスホールデム」という形式を1対1(ヘッズアップ)で行うもの。リミットとは賭け金が決められているタイプです(有り金を全部賭けるオールインなどは不可)。

 つまり、同ゲームでは一定額ずつチップをかけての勝負(降りてもよい)を何度も行います。これを長期的にプレイすると「Cepheus」は絶対に負けないそうです。ポーカーは「不完全情報ゲーム」であり、相手の手札がわからないことからブラフも有効でしたが、リミットゲームにおいてはこのたび実質的な“完全解”が求められました。


画像 サイエンス誌

 研究チームによると、「Cepheus」は、CFRと呼ばれるアルゴリズム(あの時ああしていれば! という後悔を最小化するアルゴリズム:参考)の改良版「CFR+」を用いて、自分自身と対戦することで最適戦略を学習。2カ月にわたって、秒間60億以上の手を考えるCPUを4000個稼働し、完璧に近い腕前になったそうです。同ソフトは、これまで経験則として知られていた「ディーラーボタンのプレイヤー(最後に行動できる人)が有利」についても事実だと証明したほか、いくつかの有効なプレイ戦略についても明らかにしています。

 同大学の研究チームは、2007年に「チェッカー」の完全解明を発表。同年にボウリング博士が作ったポーカーソフト「Polaris」が人間の一流プレイヤーと対戦し敗北しましたが、翌年には勝利を上げ注目されていました。

Copyright © ITmedia, Inc. All Rights Reserved.

先月の総合アクセスTOP10

  1. 「訃報」「愛猫」「手風琴」って読める? 常用漢字表に掲載されている“難読漢字”
  2. Excel上で「ドラクエ3」を再現した勇者に「最大の変態」「控えめに言って天才」と称賛 一体どうやって?
  3. 「降板を言い渡されて……」 小林麻耶、「グッとラック!」でのいじめを“笑顔”で主張 事務所とも突然の契約終了
  4. オンラインクレーンゲーム「トレバ」、景品獲得されそうになると“スタッフが裏操作”していたと発覚 被害者と運営会社を取材
  5. 加藤紗里、カフェ店員の前でパンケーキをたたきつぶす 衝撃動画に「これは笑えない」「何がしたいのか分からない」
  6. 保護した子ネコに「寂しくないように」とあげたヌイグルミ お留守番後に見せた子ネコの姿に涙が出る
  7. 「落選が内定」と開き直る金爆に「不甲斐ない」とAKB、謝罪する演歌歌手も 紅白出場逃した歌手の嘆き
  8. タイツメーカーのアツギ、「タイツの日」PRイラストで炎上 絵師25人以上とコラボ 「性的搾取」など関連ワードがTwitterトレンド席巻
  9. 「とうとうその日が来た」 AKB48、紅白落選で衝撃 メンバーは“言い訳のできない現実”を受け止める
  10. Koki,&cocomi、若かりし父・木村拓哉とのラブラブショットで48歳バースデーを祝福 「いつまでもカッコイイ父上でいてください」