Googleの機械学習は「ルール作り」から「例から学ぶ」モデルへ　米GoogleリサーチサイエンティストCorrado氏が考える機械学習と22のレイヤー

Gmailのスパム判定やSmart Replyはどのように行われているのか。

　機械学習とAIの違いは何か。米GoogleのリサーチサイエンティストのGreg Corrado氏はこう区別する。「AIは、機械にインテリジェンスを持たせること。機械学習は、データから読み取ること。重なる部分はあるが、われわれがやっているのは機械学習である」（Corrado氏）。

11月10日六本木ヒルズで開催されたイベント「Google APAC」にて。Googleリサーチサイエンティスト　Greg Corrado氏

　Googleの機械学習は今、「ルール作り」から「例から学ぶ」モデルへと変化している。例えば、学生の勉強時間から成績を予測するには、とてもシンプルな方程式で表せる。式で書くと「y＝Wx＋b」。この「W」と「b」が何なのかを導き出すのがCorrado氏らの仕事だという。

　膨大な「例」から何時間勉強したらどれくらいの点数を取るかという予測と結果の間の「エラー」を小さくする、これが今Googleがやっている機械学習。辞書のように明示的なルールを作りそれに当てはまるかどうかではなく、多くの例から学習し予想したその結果との差を埋める。

　Googleはこの機械学習を、多くの製品に取り込んでいる。例えば、Gmailのスパム判定や返信文候補を提示する「Smart Reply」、先日オープンソース化した機械学習ライブラリ「TensorFlow」もその1つである。そして、中でもGoogle PhotosはGoogleの機械学習の成果を最もよく表したプロダクトだという。

　Google Photosは、画像の共有・格納・整理整頓ができる写真アプリ。時間別・人別・場所別・物別に写真を自動でフォルダ分けしてくれる。さらに「ねこ」と検索すればねこの写真だけを抽出・種類まで判別してくれるほか、建物や崖・川などの検索にも対応している。

　この仕組みは、脳の考え方を模倣したニューラルネットワークによるもの。画像分析には22のレイヤーが用意され、その1つ1つが学習している。例えば、各レイヤーは「色」「ライン」「ここに物体がある」などの要素をそれぞれに分析・推測して（1レイヤーが1要素の分析に特化しているわけではない）、フォルダに振り分ける。しかしこの時点ではまだフォルダに分類しただけでその物体を「ねこ」とは認識していない。それとは別の「検索データ」や「SNSの投稿」などのデータと組み合わせて、初めて「これはねこである」と紐づく。別の例で、10月末にいつもと異なる服を着ていたらハロウィン、3月にドレスアップかつWebの卒業イベント情報と一致すれば卒業式、のようなロジックができる。

　「機械学習は魔法ではない。ツールの1つに過ぎない」――Corrado氏は繰り返し言う。その言葉のとおり、機械は何度もトレーニングすることで少しずつ学び、急成長することはない。

　よく、「ヒトの判断とコンピュータの判断、どちらが正しいか」という問いがある。ヒトの判断がこれまでの経験からきているのであれば、「例」から長時間学び続けているコンピュータの判断の方がよりエラーを起こさない結果に近い予測をするということになる。

　Googleが機械学習に大きな投資をしたのは7、8年前。「例」には既に、ヒトの経験の一部も含まれている。

（太田智美）

Googleの機械学習は「ルール作り」から「例から学ぶ」モデルへ 米GoogleリサーチサイエンティストCorrado氏が考える機械学習と22のレイヤー

関連記事

Googleの機械学習は「ルール作り」から「例から学ぶ」モデルへ　米GoogleリサーチサイエンティストCorrado氏が考える機械学習と22のレイヤー