Google傘下のDeepMindが、社会科学研究に人工知能を応用した論文を発表しました。深層学習(ディープ・ラーニング)でゲームの攻略法を学ぶ人工知能「DQN」(関連記事)や、囲碁のトップ棋士を破り話題になった「AlphaGo」(関連記事)などで知られる同社。今回はAIにゲームをさせて、「囚人のジレンマ」に代表される社会的ジレンマの実験に活用しています。
社会的ジレンマとは、個人の合理的な行動が社会全体にとって合理的ではない状況のこと。例えば、「囚人のジレンマ」は共犯者2人が協力、裏切りの2択を迫られる単純なゲームのような形式で表現されていますが、今回の論文は、より現実に即したアプローチとして「sequential social dilemmas(連続的な社会的ジレンマ)」を提唱。個人間で利害関係が発生する状況をゲーム化している点は従来の方法に似ていますが、そのプレイヤーに人工知能を使って、実際にシミュレーションするのが大きく違うところです。
実験では性能差のある人工知能2種を使い、ビームで一時的に相手をフィールドから除外できるルールのもと、得点になるりんごを取り合う「Gathering」を繰り返しプレイ。りんごが十分あるうちは共存していたものの、少なくなると別のプレイヤーを攻撃するようになったといいます。また、設定が違う場合にプレイヤーの動きがどう変わるのかも調べており、りんごが豊富に出現する「パラダイスのような設定」では他のプレイヤーに攻撃しなくなります。他人と利益を奪い合うようなルールだとしても、それが気にならないくらい資源があれば、ビームを撃つ必要はないというわけです。
一方、獲物を捕まえたプレイヤー、協力したプレイヤーがともに得点できるゲーム「Wolfpack」(他人の獲物を狙うハゲタカのような生物がおり、1人きりだと奪われてしまうという状況をイメージしたルール)では、人工知能は協調的な戦略を学習。このようにルールに合わせて行動を最適化する傾向は、性能の高い人工知能のほうが強かったといいます。

特定の状況をゲームで表現し、人工知能でその実験を行うアプローチ

設定を変えて行動要因を調べたり、実験結果を量的なデータとして取り出せたりする点がメリットのようです
論文によれば、「sequential social dilemmas」は経済や交通、環境問題における人間の行動理解、コントロールに役立つとのこと。この手の実証実験を大規模に行おうとすると被験者を集めるのに苦労しそうですし、いくらでも動いてくれる人工知能はなかなか便利なのかもしれません。
(マッハ・キショ松)
コメントランキング
こだわりのへぎそばが味わえるお店などを紹介! 新潟県の「そば」の名店10選! | 新潟県 ねとらぼリサーチ
「総じて優秀なのは東大卒」「京大院卒の後輩できたけど優秀すぎ」 “卒業生が優秀”だと思う「国公立大学」はどこ?【アンケート実施中】(投票結果) | 教育・子育て ねとらぼ
創業時から継ぎ足されてきた秘伝のタレを使用したうなぎが味わえるお店などを紹介! 三重県の「うな重」の名店10選!(コメント一覧) | 三重県 ねとらぼリサーチ
「もう3〜4年リピしてる」“香りが大好評の洗濯用洗剤”に「職場で聞かれるくらい良い匂い」「一生これでいい」「ふんわり自然な良い香り」の声(2/2) | ライフ ねとらぼリサーチ:2ページ目
【四国の30~40代に聞いた】優秀な生徒が多いと思う「四国地方の私立高校」ランキングTOP15! 第1位は「愛光高校」【2025年最新調査結果】 | 高校 ねとらぼリサーチ