ニュース

テキサスホールデム(ポーカー)の必勝プログラムが完成 ついに不完全情報ゲームでもコンピュータが人間を上回る

人工知能の歴史がまた1ページ更新された。

advertisement

 カナダのアルバータ大学は1月9日(日本時間)、ヘッズアップリミットホールデム(ポーカーの1種)において、コンピュータソフト「Cepheus」が“完全プレイ”を解析したと発表しました。研究成果をまとめた論文が米科学誌サイエンス(電子版)に掲載されています

研究チームのマイケル・ボウリング博士(左)

 ヘッズアップリミットホールデムとは、手札2枚と共通カード(最大5枚)を組み合わせる「テキサスホールデム」という形式を1対1(ヘッズアップ)で行うもの。リミットとは賭け金が決められているタイプです(有り金を全部賭けるオールインなどは不可)。

 つまり、同ゲームでは一定額ずつチップをかけての勝負(降りてもよい)を何度も行います。これを長期的にプレイすると「Cepheus」は絶対に負けないそうです。ポーカーは「不完全情報ゲーム」であり、相手の手札がわからないことからブラフも有効でしたが、リミットゲームにおいてはこのたび実質的な“完全解”が求められました。

advertisement
サイエンス誌

 研究チームによると、「Cepheus」は、CFRと呼ばれるアルゴリズム(あの時ああしていれば! という後悔を最小化するアルゴリズム:参考)の改良版「CFR+」を用いて、自分自身と対戦することで最適戦略を学習。2カ月にわたって、秒間60億以上の手を考えるCPUを4000個稼働し、完璧に近い腕前になったそうです。同ソフトは、これまで経験則として知られていた「ディーラーボタンのプレイヤー(最後に行動できる人)が有利」についても事実だと証明したほか、いくつかの有効なプレイ戦略についても明らかにしています。

 同大学の研究チームは、2007年に「チェッカー」の完全解明を発表。同年にボウリング博士が作ったポーカーソフト「Polaris」が人間の一流プレイヤーと対戦し敗北しましたが、翌年には勝利を上げ注目されていました。

Copyright © ITmedia, Inc. All Rights Reserved.

記事ランキング

  1. 「ロッチ」中岡、顔にたっぷり肉を蓄えた激変ショットに驚きの声 「これ…ヤバいって」「すごい変身っぷり」
  2. 「ごめん母さん。塩20キロ届く」LINEで謝罪 → お母さんからの返信が「最高」「まじで好きw」と話題に
  3. 「東京チカラめし」約2年ぶりに東京で“復活” まさかの出店場所に驚き「脳がフリーズしそうに」
  4. 「今までなんで使わなかったのか」 ワークマンの「アルミ帽子」が暑さ対策に最強だった 「めっちゃ涼しー」
  5. 「ヒルナンデス!」で道を教えてくれた男性が「丁(てい)字路」と発言 出演者が笑う一幕にネットで批判続出
  6. 大谷翔平がエスコート 真美子さん「ドジャース奥様会」に再び登場で頭ひとつ抜き出る
  7. 「新紙幣出てきたんだけど」 レジで“千円札”見た若者がポツリ→まさかの正体にショック広がる 「そうだよねえぇ」
  8. 16歳お姉ちゃんと0歳弟、赤ちゃんが泣くとすぐに抱っこして…… 愛をそそぐ姿に「愛しさ溢れてて号泣」「いいね1万回押したい」
  9. 地元民向け“バリカタ仕様”の袋麺だと思ったら……思わぬ落とし穴に「トラップ仕掛けられてる」「自分も引っかかった」
  10. 川をせき止めるほどのゴミ→ボランティアがを徹底的に掃除したら…… 見違える変化に驚き