ニュース
» 2017年10月19日 11時19分 UPDATE

囲碁AI「AlphaGo」が進化した「AlphaGo Zero」開発 自己との対局で学習し強く

「AlphaGo Zero」は40日で、世界トップ棋士に勝利した旧バージョンAIを破るほど強くなりました。

[ねとらぼ]

 世界トップ棋士に勝利した囲碁AI「AlphaGo」がさらに進化した「AlphaGo Zero」を、Googleの関連会社DeepMindがNatureの論文発表しました

 AlphaGoは人間の対局のデータを学習させていましたが、AlphaGo Zeroはそういったプロセスは経ずに、試行錯誤することで学ぶ「強化学習」の手法を取りました。AlphaGo Zeroは自身を相手に対局を繰り返すことで学習して強くなり、学習を始めて3日後には、李世ドル九段に勝ったAlphaGoのバージョン(Lee)に100勝0敗で勝てるように。40日後には、柯潔九段(世界ランキングトップ)に勝利したバージョン(Master)を超えました。

AlphaGo各バージョンのイロレーティング

 DeepMindは、AlphaGo Zeroの学習手法は人間の知識の限界に制約を受けないため、これまでのバージョンよりも強力だとしています。またAlphaGo Zeroは新たな知識を発見し、これまでにない戦略を編み出したり、新しい指し手を作り出したりしたとのこと。

 AlphaGo Zeroはまだ初期段階にあるものの、人類の直面する問題を解決するミッションへの重要な進歩だと同社は述べています。

Copyright© 2017 ITmedia, Inc. All Rights Reserved.

この記事が気に入ったら
ねとらぼに「いいね!」しよう