ニュース
» 2017年02月15日 08時00分 公開

AI同士は協力するか競争するか Google DeepMind、AIにゲームをプレイさせて研究

学習やルール変更による行動の変化を見られるメリットがあるそうです。

[マッハ・キショ松,ねとらぼ]

 Google傘下のDeepMindが、社会科学研究に人工知能を応用した論文を発表しました。深層学習(ディープ・ラーニング)でゲームの攻略法を学ぶ人工知能「DQN」(関連記事)や、囲碁のトップ棋士を破り話題になった「AlphaGo」(関連記事)などで知られる同社。今回はAIにゲームをさせて、「囚人のジレンマ」に代表される社会的ジレンマの実験に活用しています。

 社会的ジレンマとは、個人の合理的な行動が社会全体にとって合理的ではない状況のこと。例えば、「囚人のジレンマ」は共犯者2人が協力、裏切りの2択を迫られる単純なゲームのような形式で表現されていますが、今回の論文は、より現実に即したアプローチとして「sequential social dilemmas(連続的な社会的ジレンマ)」を提唱。個人間で利害関係が発生する状況をゲーム化している点は従来の方法に似ていますが、そのプレイヤーに人工知能を使って、実際にシミュレーションするのが大きく違うところです。

 実験では性能差のある人工知能2種を使い、ビームで一時的に相手をフィールドから除外できるルールのもと、得点になるりんごを取り合う「Gathering」を繰り返しプレイ。りんごが十分あるうちは共存していたものの、少なくなると別のプレイヤーを攻撃するようになったといいます。また、設定が違う場合にプレイヤーの動きがどう変わるのかも調べており、りんごが豊富に出現する「パラダイスのような設定」では他のプレイヤーに攻撃しなくなります。他人と利益を奪い合うようなルールだとしても、それが気にならないくらい資源があれば、ビームを撃つ必要はないというわけです。

 一方、獲物を捕まえたプレイヤー、協力したプレイヤーがともに得点できるゲーム「Wolfpack」(他人の獲物を狙うハゲタカのような生物がおり、1人きりだと奪われてしまうという状況をイメージしたルール)では、人工知能は協調的な戦略を学習。このようにルールに合わせて行動を最適化する傾向は、性能の高い人工知能のほうが強かったといいます。


画像 特定の状況をゲームで表現し、人工知能でその実験を行うアプローチ


画像 設定を変えて行動要因を調べたり、実験結果を量的なデータとして取り出せたりする点がメリットのようです

 論文によれば、「sequential social dilemmas」は経済や交通、環境問題における人間の行動理解、コントロールに役立つとのこと。この手の実証実験を大規模に行おうとすると被験者を集めるのに苦労しそうですし、いくらでも動いてくれる人工知能はなかなか便利なのかもしれません。

マッハ・キショ松

Copyright © ITmedia, Inc. All Rights Reserved.

先月の総合アクセスTOP10

  1. 「訃報」「愛猫」「手風琴」って読める? 常用漢字表に掲載されている“難読漢字”
  2. 自分のことを“柴犬”だと思っている猫ちゃん!? 犬猫4きょうだいの息ピッタリな「いただきます」がお見事
  3. 圧倒的疾走感ッ! 深田恭子、ドローン撮影のサーフィン動画が「うわぉ カッコいい!」「水を得た魚のよう」と反響
  4. セーラームーンを自分の絵柄で描く「sailormoonredraw」チャレンジ 漫画家やイラストレーターの美麗なイラストが集まる
  5. 印刷した紙がプリンタから次々消失 → 原因を突き止めた動画に爆笑 「紙隠し」「ピタゴラスイッチだ」
  6. 「イチャイチャ感半端ない」 ヒロミ、妻・松本伊代をヘアカットする動画が130万回再生超えの大反響
  7. 「パワポで作った」 離れると意味が分かる岐阜新聞の「Stay Home」広告が話題、制作したのはデザイン経験のない営業社員
  8. 仕事のLINEに「洗濯たたみましたほめてほめて!」 応募総数8000件の「LINE誤爆」最優秀作品が決定
  9. 「私も撮りたい、貸して!」と言われて娘にカメラを渡したら―― 26万いいねを集めた衝撃写真を御覧ください
  10. 「レターパックプラスがボロボロの状態で郵便受けに入ってた」 受領印必須のサービス、明らかな過失でも補償なし? 日本郵便に聞いた