マイクロソフトの研究チームが、AIにビデオゲームを攻略させる実験に成功。1981年リリースの「ミズ・パックマン」(ATARI 2600版)で、カウンターストップ(カンスト)となる99万9990点をたたき出しました。

同作は「パックマン」の非公式な強化版として生まれ、のちにナムコから公認を受けた作品。モンスターの行動パターンにランダム性が加味されており、「パックマン」のように一定の攻略パターンが通用しません。攻略にはステージの状況変化に即した対応が必要で、AIの学習に適しているといえます。

攻略においては「敵の動きを学習するもの」「フルーツの位置を追うもの」など、さまざまな役割を持つ「エージェント」を160以上設定。それぞれが自分の受け持つ役割の観点から、キャラクターが進むべき方向を提案します。そして「上司」に相当するエージェントが全報告を総合し、最終的に移動方向を決定。多くの要因を鑑みて最善の選択を決定する仕組みです。

もし大多数のエージェントがフルーツを取りにいくよう提案していても、敵の動きを把握するエージェントが危険を唱えれば、上司は逃げることを優先するとのこと。決して多数決ではなく、「どうすればミスせず効率よくゲームを続けられるか」とゲーマー的に判断しているようです。
「強化学習」を採用したこの手法は、ビジネスなど正解のない分野で最善策を決めるうえで有用。マイクロソフトはこの研究が、高度で複雑な作業における意思決定に役立つとしています。
(沓澤真二)
コメントランキング
こだわりのへぎそばが味わえるお店などを紹介! 新潟県の「そば」の名店10選! | 新潟県 ねとらぼリサーチ
「総じて優秀なのは東大卒」「京大院卒の後輩できたけど優秀すぎ」 “卒業生が優秀”だと思う「国公立大学」はどこ?【アンケート実施中】(投票結果) | 教育・子育て ねとらぼ
創業時から継ぎ足されてきた秘伝のタレを使用したうなぎが味わえるお店などを紹介! 三重県の「うな重」の名店10選!(コメント一覧) | 三重県 ねとらぼリサーチ
「もう3〜4年リピしてる」“香りが大好評の洗濯用洗剤”に「職場で聞かれるくらい良い匂い」「一生これでいい」「ふんわり自然な良い香り」の声(1/2) | ライフ ねとらぼリサーチ
「インスタントとは思えない」 40~50代男性が選ぶ“言わなかったら袋麺とばれなそうな袋麺”ランキング上位に集まった声「アレンジすると感動」(1/3) | ラーメン ねとらぼリサーチ