“敵”が“先生”になる日――コンピュータ将棋ソフト開発者 一丸貴則さん・山本一成さん(後編)(3/4 ページ)
人間のプロ棋士とコンピュータソフトが戦った「将棋電王戦」。2人のソフト開発者はどんなことを考えて対局当日に臨み、そしてその結果に何を感じたのか。今後の人間とコンピュータとの関わり方についても考える。
機械学習の限界
前編でも示した通り、現在のコンピュータ将棋はプロ棋士の残した膨大な棋譜をソフト自身が自動解析することによって日々強くなっている。言わばプロ棋士が“教師”で、その棋譜が“問題集”だったというわけだ。しかしいつの日か、コンピュータと人間の実力が完全に逆転してしまう日が来るのだとしたら、このままの学習法では立ち行かなくなるのではないか。
「そのことはずっと考えています。例えばですけど、羽生さんってたぶん、他の人の棋譜並べ※してるだけじゃもう強くなれないですよね? 自分で教師を選んで、自分で問題を設定して成長していかない限りは。トップの人たちってそういうことをしないと強くなれないと思うし、コンピュータ将棋もそういうレベルに達していると思うんです」(山本さん)
山本さんは将棋以外にもオセロやバックギャモン、チェス、チェッカーなどの盤上ゲームにおいて、コンピュータソフトと人間の関係がどう変遷してきたのかを調べている。「現在のコンピュータオセロはまさにモデルケースで、少数の人間の棋譜と、多数のコンピュータソフトの棋譜を混ぜ合わせて学習させているんです。人間の多様な動きがサンプルに少しだけ混じっていると良いみたいです。バックギャモンも、ソフトの自己対戦から評価関数を生成することですごくレベルが上がりました」
“敵”が“先生”になる日
山本さんの考える将来のコンピュータ将棋の理想像は、人間のための「ラーニングツール」だ。実際にバックギャモンのプロも、チェスのプロも、ソフトを教師役として使うことで自分の実力を向上させてきた。将棋でも近い将来に同様のことが起こるのは、ほぼ間違いないと見る。
電王戦でソフトが指した手の中には、一見して人間の直観を外れるようなものが数多くあった。その後時間を掛けて詳しくその手を精査してみると、有力な一手であることが分かるのだ。ここ数年、そうしたソフトによる「新手」を自身の対局で採用するプロ棋士も増えてきた。
「floodgate」(フラッドゲート)と呼ばれる場がある。ここでは、さまざまなコンピュータ将棋ソフト同士が専用サーバ上で一日中自動対局を繰り返している。人間に匹敵しうる実力を備えたソフトが、人間には到底不可能な速度で、新たな棋譜を今この瞬間も生み出し続けているのだ。現状ではソフト間の実力もばらばらだが、その中には前述したような「新手」が埋もれている宝の山である可能性も高い。過去には“敵”として捉えられていたコンピュータソフトが、人類の“先生”となる日も遠くはないのだろうか。
Copyright © ITmedia, Inc. All Rights Reserved.