ニュース
» 2017年07月12日 18時30分 公開

人工知能にテトリスを学習させる動画に感心の声 あっという間に初心者から上級者に進歩

最終的に人間味ある人工知能に。

[高橋ホイコ,ねとらぼ]

 人工知能にテトリスを学習させた動画がニコニコ動画にアップされています。動画は人工知能がどうやって学習していくのかを、丁寧に解説しています。

 人工知能はまず、「現在の盤面」に「現在落ちてきているブロック」がどう置けるか、全てのパターンを洗い出し、算出された盤面をそれぞれ評価していきます。そして、そのなかで一番評価の高い手を採用していくという仕組み。

AIの仕組みの説明図 評価の高い手を採用します

 人工知能はこの「盤面の評価」が正しくできることが重要となるため、正しく評価するために「学習」をさせます。この動画では「ニューラルネットワーク」と「遺伝的アルゴリズム」を使用しました。

 「ニューラルネットワーク」は、脳の神経回路網をモデルにした計算方法。脳の神経細胞は網目状につながっていて、他の神経細胞から一定量の信号を受け取ると、自らも信号を出力します。また、細胞同士の結合には強弱があり、経路によって強い信号として伝わったり、弱い信号として伝わったりします。脳は、この強弱を変化させ学習や記憶をしているそうです。

ニューラルネットワークの説明図 みんな、寝ないで聞いて―

 この仕組みをコンピュータに実装したのが「ニューラルネットワーク」です。脳の神経細胞の代わりに信号の送受信を担当するのが「ノード」。このノードを複数結合させたネットワークを考えます。このノードの入力層にテトリスを数値化した情報、例えば「ブロックの最大の高さ」「穴の数」などを「外部情報」として受け渡します。外部情報を受けた入力層は、中間層に信号を伝達します。このとき、入力層のノードと中間層のノードの結合には強弱があり、伝達信号の大きさも変化します。

入力層から中間層への伝達 外部情報の信号が入力層から中間層へ伝達

 中間層のノードは、信号が一定の値を越えた場合に出力層に伝達します。出力層のノードは受け取った信号の合計値を出力します。これが盤面の評価値となります。

中間層から出力層への伝達 出力層の合計値が盤面の評価値となります

 ノードの結合の強弱で盤面の評価値が変化することになります。そこで、評価値が正しくなるようにノードの結合の強弱を調整していき、この調整にも人工知能を使います。これを「学習」と呼びます。

 「学習」で使うのが、みんな大好き「遺伝的アルゴリズム」。結合の強弱を「遺伝子データ」として扱って、テトリスを上手にプレイできる遺伝子を探していくのです。

遺伝的アルゴリズム ノードの結合の強弱を調整する「遺伝的アルゴリズム」

 遺伝子データをランダムで100個生成します。それぞれの遺伝子データ(=結合の強弱)を使ったニューラルネットワークで、テトリスをプレイ。

100個の遺伝子でテトリスをプレイ 遺伝子データごとにスコアを出します

 自然界では適応度の高い遺伝子が子孫を残しやすいですが、それと同じように、テトリスのスコアが高い遺伝子が選ばれやすいように工夫しつつ、ランダムで2つの遺伝子を選びます。この2つの遺伝子を交叉させて新しい遺伝子を作り、100個になるまで繰り返します。この100個が第2世代となり、同じように第3世代、第4世代と世代交代を繰り返すことで、より高いスコアを出す遺伝子が生成されます。

第2世代の生成を説明 選べばれた2個の個体から、第2世代を作る

 さて、学習した結果はどうなったでしょうか。第1世代のプレイを見ると、なんとなくできてはいるものの、無計画に「穴」を作ってしまうプレイスタイル。すぐにゲームオーバーとなってしまいました。

第1世代のプレイ風景 「幼稚園児みたいだ」というコメントも

 次に第5世代です。第1世代と比べて確実に進化している様子がうかがえます。しっかり1列を消していき、そつが無いプレイスタイル。第1世代がゲームオーバーになるタイミングでも、まだ1列目が消せる状態でした。

第5世代のプレイ風景 第1世代(左)と第5世代(右)の比較(同じブロックが落ちてきてます)

 第10世代、第100世代と進化すると、どんどん賢くなり、ブロックが溜まりにくくなってきます。ただし、プレイ時間を長くする方が高得点となるためか、ブロックを高く積まないようにしてしまうため、4段消しは全くしません。

第10世代、第100世代のプレイ風景 ブロックが高く積みあがらない

 やっぱり「4段消し」を狙わないプレイスタイルは面白くないと、評価基準を変更しました。「ゲームオーバーのスコア」ではなく「40ラインを消すまでのスコア」で評価し、もう一度学習させます。その結果、4段消しを狙いに行く人間味あふれるプレイスタイルに。しかも、すっごい上手です。これは、見ていて気持ちがいいぞ!

4段消ししてくれるところ これぞ、テトリス

 動画を掲載したのはガジュ丸さん。人工知能に関する動画を複数アップしています。この動画は情報処理学会で発表された宇部高専の論文「ニューラルネットワークと遺伝的アルゴリズムを用いたテトリスコントローラの開発」を参考に作ったそうです。

高橋ホイコ

Copyright © ITmedia, Inc. All Rights Reserved.

先月の総合アクセスTOP10

  1. 「訃報」「愛猫」「手風琴」って読める? 常用漢字表に掲載されている“難読漢字”
  2. Excel上で「ドラクエ3」を再現した勇者に「最大の変態」「控えめに言って天才」と称賛 一体どうやって?
  3. 「降板を言い渡されて……」 小林麻耶、「グッとラック!」でのいじめを“笑顔”で主張 事務所とも突然の契約終了
  4. オンラインクレーンゲーム「トレバ」、景品獲得されそうになると“スタッフが裏操作”していたと発覚 被害者と運営会社を取材
  5. 加藤紗里、カフェ店員の前でパンケーキをたたきつぶす 衝撃動画に「これは笑えない」「何がしたいのか分からない」
  6. 保護した子ネコに「寂しくないように」とあげたヌイグルミ お留守番後に見せた子ネコの姿に涙が出る
  7. 「落選が内定」と開き直る金爆に「不甲斐ない」とAKB、謝罪する演歌歌手も 紅白出場逃した歌手の嘆き
  8. タイツメーカーのアツギ、「タイツの日」PRイラストで炎上 絵師25人以上とコラボ 「性的搾取」など関連ワードがTwitterトレンド席巻
  9. 「とうとうその日が来た」 AKB48、紅白落選で衝撃 メンバーは“言い訳のできない現実”を受け止める
  10. Koki,&cocomi、若かりし父・木村拓哉とのラブラブショットで48歳バースデーを祝福 「いつまでもカッコイイ父上でいてください」