Googleの機械学習は「ルール作り」から「例から学ぶ」モデルへ　米GoogleリサーチサイエンティストCorrado氏が考える機械学習と22のレイヤー

LINE

hatena

Home

Gmailのスパム判定やSmart Replyはどのように行われているのか。

　機械学習とAIの違いは何か。米GoogleのリサーチサイエンティストのGreg Corrado氏はこう区別する。「AIは、機械にインテリジェンスを持たせること。機械学習は、データから読み取ること。重なる部分はあるが、われわれがやっているのは機械学習である」（Corrado氏）。

Google機械学習 — 11月10日六本木ヒルズで開催されたイベント「Google APAC」にて。Googleリサーチサイエンティスト　Greg Corrado氏

　Googleの機械学習は今、「ルール作り」から「例から学ぶ」モデルへと変化している。例えば、学生の勉強時間から成績を予測するには、とてもシンプルな方程式で表せる。式で書くと「y＝Wx＋b」。この「W」と「b」が何なのかを導き出すのがCorrado氏らの仕事だという。

　膨大な「例」から何時間勉強したらどれくらいの点数を取るかという予測と結果の間の「エラー」を小さくする、これが今Googleがやっている機械学習。辞書のように明示的なルールを作りそれに当てはまるかどうかではなく、多くの例から学習し予想したその結果との差を埋める。

　Googleはこの機械学習を、多くの製品に取り込んでいる。例えば、Gmailのスパム判定や返信文候補を提示する「Smart Reply」、先日オープンソース化した機械学習ライブラリ「TensorFlow」もその1つである。そして、中でもGoogle PhotosはGoogleの機械学習の成果を最もよく表したプロダクトだという。

　Google Photosは、画像の共有・格納・整理整頓ができる写真アプリ。時間別・人別・場所別・物別に写真を自動でフォルダ分けしてくれる。さらに「ねこ」と検索すればねこの写真だけを抽出・種類まで判別してくれるほか、建物や崖・川などの検索にも対応している。

　この仕組みは、脳の考え方を模倣したニューラルネットワークによるもの。画像分析には22のレイヤーが用意され、その1つ1つが学習している。例えば、各レイヤーは「色」「ライン」「ここに物体がある」などの要素をそれぞれに分析・推測して（1レイヤーが1要素の分析に特化しているわけではない）、フォルダに振り分ける。しかしこの時点ではまだフォルダに分類しただけでその物体を「ねこ」とは認識していない。それとは別の「検索データ」や「SNSの投稿」などのデータと組み合わせて、初めて「これはねこである」と紐づく。別の例で、10月末にいつもと異なる服を着ていたらハロウィン、3月にドレスアップかつWebの卒業イベント情報と一致すれば卒業式、のようなロジックができる。

　「機械学習は魔法ではない。ツールの1つに過ぎない」――Corrado氏は繰り返し言う。その言葉のとおり、機械は何度もトレーニングすることで少しずつ学び、急成長することはない。

　よく、「ヒトの判断とコンピュータの判断、どちらが正しいか」という問いがある。ヒトの判断がこれまでの経験からきているのであれば、「例」から長時間学び続けているコンピュータの判断の方がよりエラーを起こさない結果に近い予測をするということになる。

　Googleが機械学習に大きな投資をしたのは7、8年前。「例」には既に、ヒトの経験の一部も含まれている。

（太田智美）

※本ページはアフィリエイトプログラムによる収益を得ています

筆者：太田智美

小学3年生より国立音楽大学附属小学校に編入し、小・中・高とピアノを専攻。大学では音楽学と音楽教育（教員免許取得）を専攻し卒業する。その後、慶應義塾大学大学院メディアデザイン研究科に入学。人と人とのコミュニケーションで発生するイベントに対して偶然性の音楽を生成するアルゴリズム「おところりん」を生み出し、「<a href='http://koara.lib.keio.ac.jp/xoonips/modules/xoonips/download.php/KO40001001-00002010-0075.pdf?file_id=44931'>おところりん：ソーシャルネットワークにおける偶然性を用いた音楽生成（Otocororin:a chance music for social network systems）</a>」を修士論文として提出。同研究は、情報処理学会第12回「Internet and Operation Technology（IOT）」研究会において学生奨励賞を受賞。同大学院を修了後、2011年にアイティメディア株式会社に入社。営業配属を経て、2012年より＠IT統括部に所属し、技術者コミュニティ支援やイベント運営、記事執筆などに携わる。2014年4月から2016年3月までねとらぼ編集部に所属。2016年4月よりITmedia ニュースに配属される。これまでの代表作は「<a href='http://nlab.itmedia.co.jp/nl/articles/1409/10/news139.html'>世の中やっぱり金でした 71万円の大金を積んで誰よりも早く『iPhone 6 Plus』の使い勝手を検証してみた</a>」「<a href='http://nlab.itmedia.co.jp/nl/articles/1502/27/news152.html'>スケスケでまるみえじゃないですか！人によっては透明に見えるドレスを作ってみた</a>」「<a href='http://www.atmarkit.co.jp/ait/articles/1401/08/news082.html'>あの日、Twitterのくじらが出なかったもう1つの理由</a>」「<a href='http://www.itmedia.co.jp/keywords/yutori_generation.html'>ゆとり世代が問う『好きなことをやって何が悪い！』（シリーズ）</a>」「<a href='http://www.itmedia.co.jp/news/series/5264/'>はじめてのAI（連載）</a>」など。 Twitter：<a href='https://twitter.com/tb_bot'>＠tb_bot</a>

Googleの機械学習は「ルール作り」から「例から学ぶ」モデルへ　米GoogleリサーチサイエンティストCorrado氏が考える機械学習と22のレイヤー

筆者：太田智美

関連タグ

求人情報

りくりゅう、カナダに戻った後の最新ショットに「新しい動きがあるようですね」「楽しみすぎる」と期待の声【三浦璃来・木原龍一選手】

食パンを切ったら……「声出して笑った」「腹痛い」　電車で見ちゃダメな“予想外の断面”に「反則でしょうw」

「反則でしょう」北川景子が着用した“まさかの服”にネット騒然「とんでもねぇ」「何でこんなに細いんだ」

長男の小学校卒業式→ママが総絞りの着物で出席したら……　圧巻の姿に「めっちゃ素敵」「こんなお母さんいたらガン見しちゃう」

「さすが」嵐・松本潤、“ビジュアルの変化”に反響　「アイドル松潤だ……」「戻してきた」深夜2時までライブ準備も

「1泊ならこれ1つでいけます」キタムラの“エコバッグ”が大人気　「上品だと誉めてもらいました」「軽いしチャックで閉まるしキチンと見える」

ジェンダーリビールケーキを切った夫が「えっ」　まさかのオチに1100万再生「声出た」「そのパターンあったのか！」

「地雷系ファッション」だった女性→清楚系に“ガラッと転身”したら……　まさかの姿が330万表示「めっちゃ可愛くて草」

「二度見した」辻希美、自宅に“まさかの男性アイドル”の姿「やばい」「見られて嬉しい」

長年使ってきた玄関マット→新品を横に並べたら……　「元は右だったんだ」まさかの光景に「天寿を全うしたと思う」

実施中

声が好きな「日本のボーカリスト」は？

実施中

歌が上手だと思うホロライブのメンバーは？

実施中

ラーメンって日本食？それとも中華料理？

実施中

他県のひとにもおすすめしたいご当地Vtuberは？

実施中

神奈川県で一番うまいと思う「横浜家系ラーメン店」はどこ？

水木一郎、影山ヒロノブ、LiSA……　あなたが好きな「アニソンシンガー」は？【アンケート実施中】 | アニメねとらぼ

「東横イン、美味しすぎ」「朝食ならルートイン」　“食事がおいしい”と思う「ビジネスホテル」は？【アンケート実施中】（投票結果） | ライフスタイルねとらぼ

姫路城、松本城、会津若松城……　あなたが好きな「日本の城」は？【アンケート実施中】 | ライフスタイルねとらぼ

「普通に読めん」　千葉県の“難読市町村名”といえば？　ランキング上位に「千葉県、難読駅が地味に多いと思う」「文違は絶対読めません」の声（2/2） | 千葉県ねとらぼリサーチ：2ページ目

Googleの機械学習は「ルール作り」から「例から学ぶ」モデルへ 米GoogleリサーチサイエンティストCorrado氏が考える機械学習と22のレイヤー

関連タグ

求人情報

Googleの機械学習は「ルール作り」から「例から学ぶ」モデルへ　米GoogleリサーチサイエンティストCorrado氏が考える機械学習と22のレイヤー