ニュース
囲碁AI「AlphaGo」が進化した「AlphaGo Zero」開発 自己との対局で学習し強く
「AlphaGo Zero」は40日で、世界トップ棋士に勝利した旧バージョンAIを破るほど強くなりました。
advertisement
世界トップ棋士に勝利した囲碁AI「AlphaGo」がさらに進化した「AlphaGo Zero」を、Googleの関連会社DeepMindがNatureの論文で発表しました。
AlphaGoは人間の対局のデータを学習させていましたが、AlphaGo Zeroはそういったプロセスは経ずに、試行錯誤することで学ぶ「強化学習」の手法を取りました。AlphaGo Zeroは自身を相手に対局を繰り返すことで学習して強くなり、学習を始めて3日後には、李世ドル九段に勝ったAlphaGoのバージョン(Lee)に100勝0敗で勝てるように。40日後には、柯潔九段(世界ランキングトップ)に勝利したバージョン(Master)を超えました。
DeepMindは、AlphaGo Zeroの学習手法は人間の知識の限界に制約を受けないため、これまでのバージョンよりも強力だとしています。またAlphaGo Zeroは新たな知識を発見し、これまでにない戦略を編み出したり、新しい指し手を作り出したりしたとのこと。
AlphaGo Zeroはまだ初期段階にあるものの、人類の直面する問題を解決するミッションへの重要な進歩だと同社は述べています。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- Googleの囲碁AI「AlphaGo」が19歳の最強棋士に全勝
囲碁AI「AlphaGo」と最強棋士・柯潔(かけつ)九段による3番勝負最終局が行われた。 - ネットに謎の囲碁棋士「Master」が出現 世界トップ棋士を続々撃破
井山六冠とみられる人物との対戦は4000人が見守った - 謎の囲碁棋士「Master」の正体は「AlphaGo」 Googleが発表
年末年始にかけてネット上で非公式テストを行っていた。 - 学習型AI、全自動運転で「マリオカート64」のルイージサーキットを完全走破 エンジニアが冬休みを使い実験
AIがマリカー界に進出。 - Google DeepMind、AIに人体の動きを教育 障害物を越えるための最善の動作を自力で考えるように
バランスをとろうと手足をばたつかせる様子がユーモラス。