新着記事一覧

新着記事一覧

ニュース
» 2011年06月29日 21時20分 UPDATE

Googleに負けないものを作りたい――女子大生が挑む日本独自の「かわいい検索」

女の子の“かわいい”を検索できる「かわいい検索」は、アルゴリズムの設計からプログラミング、デザインまで、学生が中心になって作り上げたWebアプリ。Googleが無視している「Webページの見た目の雰囲気」という要素にこだわり、日本人独自の検索エンジンを目指す。

[山本恵太,ITmedia]

 「ゆるかわ検索」「キュート検索」「きれい検索」「おもしろ検索」「まじめ検索」――5つの“かわいい”系統から気になるアイテムを検索ができる検索エンジン「かわいい検索」がリリースされた。開発したのは慶応義塾大学SFC(湘南藤沢キャンパス)の女子大生3人だ。

ky_kawaii_0629_01.jpgky_kawaii_0629_02.jpg

 現在は検索対象がブログのみとなっており、例えば「バッグ」(bag)を検索すると、5つの“かわいい”の系統のうち選択した分野に当てはまるバッグを紹介したファッション系のブログが表示される。芸能人ブログなど、バッグの写真だけでなく、バッグを持っている有名人の写真を見ることができるため、流行の“かわいい”も検索結果から分かるのが特徴となっている。

 開発を担当したのは同大学院修士課程の橋口恭子さん、同大学3年生の若林里奈さんと松野香織さんの3人。橋口さんがアルゴリズムの設計とプログラミングを担当し、若林さんがデザイン、松野さんがターゲットの調査や評価実験などを担当した。3人とも小川克彦 環境情報学部教授の研究室に所属している。

ky_kawaii_0629_00.jpg 左から、松野香織さん、橋口恭子さん、若林里奈さん

始まりは「文字で砂時計を作る」アイデア

 「かわいい検索」は絵文字、ひらがな、顔文字、漢字、文字数、ギザギザ、単語数、画像、行間、ゆる絵文字、画数、記号という12の要素を使ってブログを分析している。「ゆる絵文字」というのは、携帯メールの絵文字とは別に、ブログで独自に使われているGIF画像のことで、「記号」はAAのような顔文字などを表す。

 この12の要素を使って、ブログをゆるかわ、キュート、きれい、おもしろ、まじめの5つに分類する。ゆるかわはひらがなが多く、ふんわりした見た目のブログ記事。キュートは絵文字が多くにぎやかな見た目。きれいはシンプルで大人っぽく、おもしろはカラフルで個性的、まじめは飾り気がなくきちんとした見た目、といった具合に分けられる。

 例えば、文字数や画数が多いブログ記事は「まじめ」の系統に分類されることが多く、絵文字が多いブログ記事は「キュート」に分類されることが多い。

 「かわいい検索」の元になる研究は、橋口さんが大学3年生になったときの「文字で砂時計ができないかな」というアイデアからスタートした。このアイデアは、画面上に表示した任意の文章をバラバラに崩し、画数が多く密度の濃い文字ほど重いと仮定して、画面の下の方に落としていくというもの。これにより、文章の要約ができるのではと考えたという。

ky_kawaii_0629_06.jpg 「面喰い検索」研究資料より

 そのアイデアを、同年秋に「面喰い検索」として進化させ、SFCの研究発表会である「ORF(Open Research Forum) 2009」で公開し、注目を浴びた。

 「面喰い検索」は文章の見た目から、検索ワードが目立って見えるページを上位に表示するというもの。例えば「あいあい愛あいあいあい愛あい」という文章では、密度の濃い「愛」という文字が目立って見える。検索文字の関連性ではなく、検索文字が目立って見えるページを重視するのが特徴。この研究は、卒業時に優秀卒業制作として大学から表彰された。この「面喰い検索」を進化させたのが「かわいい検索」だ。

Webページの「雰囲気」を検索したい

ky_kawaii_0629_04.jpg 橋口恭子さん。ニックネームは“きょんちゃん”

 開発の中心になった橋口さんは、検索エンジンなどの分散処理について学んでいる。プログラミングを覚えたのは大学2年生からで、「憂鬱なプログラマのためのオブジェクト指向開発講座―C++による実践的ソフトウェア構築入門」「やさしいPHP」を読んで基礎を学び、Google検索を頼りに独学で習得した。

 かわいい検索を開発しようと考えたのは、Google検索など一般的に使われている検索エンジンでは、ページの“見た目の雰囲気”が要素として無視されている点に気付いたから。女子高生や女子大生は、単にテキスト情報や画像データだけではなく、絵文字や行間が醸し出す雰囲気も含めてブログ記事だと考えている。橋口さんは、この“雰囲気”、特に“かわいい雰囲気”を検索するためのアルゴリズムを作りたいと考えた。

 かわいい雰囲気を検索できるようにするのは雲をつかむように難しい。そこで、橋口さんはまずブログ記事を印刷して、見た目の雰囲気から分類し、要素を探した。印刷した紙の枚数は1000枚を超えた。SFCの学生は、学校に泊まったり深夜まで残ったりして課題や研究の作業を続けることを“残留”と呼ぶが、橋口さんは毎日のように研究室で“残留”したという。そして最終的に、前述した12の要素と5つの分類を導き出した。

 「面喰い検索」から「かわいい検索」まで、検索キーワードと内容のマッチングという検索エンジンの常識とは異なる手法にこだわるのはなぜだろうか。橋口さんは、「検索エンジンの分野で日本は負けています。Googleのような、外国の人が開発したものに負けない日本人独自の検索エンジンができるはず」と語る。同じやり方の検索エンジンを作っても勝てないのは分かっている。そこで、ひねりを加えて考え出したのが「かわいい検索」だ。別のアルゴリズムに応用すれば「かっこいい検索」や「かっこ悪い検索」なども可能になる。

 それでも“かわいい”にこだわるのは、海外展開を視野に入れているから。小川教授から、「面喰い検索」では海外で理解されにくいというアドバイスがあり、海外でも通じるようになってきた“KAWAII”に着目した。7月にはアメリカで開催される国際会議「HCI International 2011」で発表を行う予定という。

「学部生で大丈夫かなって思っていた」

ky_kawaii_0629_03.jpg SFCでは、ほぼ全学生がPCを持って授業に出ている。3人ともMacユーザー。開発にはMacが適しているという

 橋口さんたちがかわいい検索を開発する上で大きな助けになったのが、NTTレゾナントの研究プロジェクト「gooラボ」のメンバー。元NTTサイバーソリューション研究所所長でもある小川教授が、橋口さんが4年生になった年の夏に紹介した。

 「正直なところ学部生で大丈夫かなって思っていた」と話すのは、橋口さんたちのアイデア出しやプログラミングのサポートを行ってきたgooラボの藤代裕之氏。例えば、橋口さんが書いたソースコードで、セキュリティの弱い部分や大規模に処理する上で必要な部分を修正、追加するといった形で支援してきた。「最終的に僕らが引き取って完成させるという方法もあったと思うけど、想像以上に頑張ってくれた。ここまでできる人はなかなかいないので、サポートしがいがあった」と同氏は言う。

 gooラボはこれまでNTT研究所の技術を活用する場として動いていたが、今回のかわいい検索は、NTTグループと慶応大学の産学連携としての取り組みとなる。小川教授は、「NTT研究所の技術をgooラボで試すことは昔からやってきたが、“かわいい”がキーワードになるようなプロジェクトはNTT研究所ではやらない。若者の発想だ」と語る。実際、橋口さんが「砂時計のように文字が落ちるアイデア」について説明すると、その話を初めて聞いたgooラボのメンバーが、「すごい」「聞いたことがない」「(発想が)飛んでるなあ」と感心する場面もあったという。

完成を目指して

 かわいい検索は未完成だが、今回、さまざまなユーザーに使ってもらうことで、どんな反応が得られるかを確かめるため実験的に公開した。すでに公開初日で、使い方の説明が不十分な点や、ターゲットとしている女子高生や女子大生に使ってもらえていないことが課題として出てきたという。

 橋口さんは検索の精度についても満足していない。実際、一部のブログは「おもしろ検索」にしか出さないといった手作業の登録をしており、すべてが自動で分類されるわけではない。「Googleに負けないものを作りたいというのは、まだまだ心の中に秘めている思いです」と本音を語る。

 7月には国際会議での発表があり、秋にはSFCの研究発表会である「ORF」が控えている。より使いやすく、そして精度を高めた検索エンジンを目指して、3人は「かわいい検索」の研究を続けていく覚悟だ。

ky_kawaii_0629_05.jpg 上段左から、NTTレゾナントの藤代裕之氏、徳永徹郎氏、森本恭平氏、小川克彦教授、下段左から橋口恭子さん、若林里奈さん、松野香織さん

Copyright© 2016 ITmedia, Inc. All Rights Reserved.

注目のアイコン

注目のアイコン

「ITAN」×「ねとらぼ」コラボマンガ

ねとらぼがスマホからも見れる!

過去記事カレンダー

オススメ記事