Google傘下のDeepMindが、社会科学研究に人工知能を応用した論文を発表しました。深層学習(ディープ・ラーニング)でゲームの攻略法を学ぶ人工知能「DQN」(関連記事)や、囲碁のトップ棋士を破り話題になった「AlphaGo」(関連記事)などで知られる同社。今回はAIにゲームをさせて、「囚人のジレンマ」に代表される社会的ジレンマの実験に活用しています。
社会的ジレンマとは、個人の合理的な行動が社会全体にとって合理的ではない状況のこと。例えば、「囚人のジレンマ」は共犯者2人が協力、裏切りの2択を迫られる単純なゲームのような形式で表現されていますが、今回の論文は、より現実に即したアプローチとして「sequential social dilemmas(連続的な社会的ジレンマ)」を提唱。個人間で利害関係が発生する状況をゲーム化している点は従来の方法に似ていますが、そのプレイヤーに人工知能を使って、実際にシミュレーションするのが大きく違うところです。
実験では性能差のある人工知能2種を使い、ビームで一時的に相手をフィールドから除外できるルールのもと、得点になるりんごを取り合う「Gathering」を繰り返しプレイ。りんごが十分あるうちは共存していたものの、少なくなると別のプレイヤーを攻撃するようになったといいます。また、設定が違う場合にプレイヤーの動きがどう変わるのかも調べており、りんごが豊富に出現する「パラダイスのような設定」では他のプレイヤーに攻撃しなくなります。他人と利益を奪い合うようなルールだとしても、それが気にならないくらい資源があれば、ビームを撃つ必要はないというわけです。
一方、獲物を捕まえたプレイヤー、協力したプレイヤーがともに得点できるゲーム「Wolfpack」(他人の獲物を狙うハゲタカのような生物がおり、1人きりだと奪われてしまうという状況をイメージしたルール)では、人工知能は協調的な戦略を学習。このようにルールに合わせて行動を最適化する傾向は、性能の高い人工知能のほうが強かったといいます。

特定の状況をゲームで表現し、人工知能でその実験を行うアプローチ

設定を変えて行動要因を調べたり、実験結果を量的なデータとして取り出せたりする点がメリットのようです
論文によれば、「sequential social dilemmas」は経済や交通、環境問題における人間の行動理解、コントロールに役立つとのこと。この手の実証実験を大規模に行おうとすると被験者を集めるのに苦労しそうですし、いくらでも動いてくれる人工知能はなかなか便利なのかもしれません。
(マッハ・キショ松)
コメントランキング
「FNS歌謡祭 第1夜」であなたが良かったと思うアーティストは?【人気投票実施中】 | 音楽 ねとらぼリサーチ
今川焼? 大判焼き? あの“円形の厚焼き和菓子”の名前は? 47都道府県別・呼び方の勢力図を公開!(投票結果) | グルメ ねとらぼ
「ベストヒット歌謡祭2025」で良かったアーティストは?【人気投票実施中】(投票結果) | 音楽 ねとらぼリサーチ
2025年「NHK紅白歌合戦」の「白組」出場歌手で楽しみなのは?【人気投票実施中】(投票結果) | 音楽 ねとらぼリサーチ
岩手県の「おいしいお土産」10選! 一番うまいと思うのは?【人気投票実施中】(2/2) | 岩手県 ねとらぼリサーチ:2ページ目