ニュース

「きのこたけのこ戦争」ついに決着か NTTデータ、バレンタインデーのデータを解析

データさん……?

advertisement

 NTTデータは、2015年のバレンタインデーに起きた「きのこたけのこ戦争」をデータ解析。自社で開発している高精度テキスト分析API「なずきSA」を用いて調査した。

 「なずきSA」はインターネット上の日本語テキストデータを解析するツール。単語などからポジネガ分析(ポジティブ・ネガティブ分析)するだけでなく、分野や感性を示す表現の判定を行い、高い精度で評価情報を抽出することができる。例えば、「ヤバイ」という単語はポジネガどちらの感情でも使われ得る言葉だが、前後の文脈などからポジティブに使われているか、ネガティブに使われているかを判定可能となっている。


「なずきSA」の仕組み

例1

例2

 今回調査の対象となったのは、2015年2月1~17日までのツイート。最初に、バレンタインのソートとして「もらった」「あげた」「プレゼント」といったアクションの単語と、「きのこ」「たけのこ」という名詞でツイートを抽出。その後、「なずきSA」を用いて構文解析を行い、ポジネガ判定する。

advertisement

 ちなみに、抽出ワードを「きのこの山」「たけのこの里」といった正式名称としないのは、「きのこ厨」「たけのこ派」といった単語も拾うため。また、「きのこ鍋」や「たけのこ料理」といったノイズを除外するため、「鍋」「焼」などのお菓子と関連性のないワードを含むツイートは排除している(リツイート・広告系ツイートなども除外)。さらにここまでで排除しきれなかったノイズは、最終的に目視によるスクリーニングで削除する。

 バレンタインの判定については、「バレンタイン」という直接的な言葉で絞るとデータ数が非常に少なくなってしまうため(例えば、バレンタインの代わりに「友チョコ」や「義理チョコ」のような言葉を使っている人もいるため)、まずは「バレンタイン前後の日程」という時間軸とアクションフィルターのみをかけてデータを抽出。その後、目視判定をしている。

 結果、「きのこの山」ポジ数は453件(64.3%)、ネガ数は251件(35.7%)。「たけのこの里」ポジ数は183件(65.8%)、ネガ数は95件(34.2%)となった。「きのこの山」「たけのこの里」のツイート件数のみ比較してみると、ポジ数「きのこ:たけのこ=453:183」、ネガ数「きのこ:たけのこ=251:95」ときのこの山が圧倒的に多くツイートされていることが分かるが、ポジネガ率を見てみると、ポジ数「きのこ:たけのこ=64.3%:65.8%」、ネガ数「きのこ:たけのこ=35.7%:34.2%」とたけのこの里が上回っている。

   「たけのこの里」勝利!!

 ちなみに、2014年はきのこが優勢。NTTデータは自身の専門技術を用いて、お互い一歩も譲らない戦いが繰り広げられていることを明らかにした。

advertisement

NTTデータ運営「イマツイ」より(2014年)

太田智美

Copyright © ITmedia, Inc. All Rights Reserved.

記事ランキング

  1. 「何言ったんだ」 大谷翔平が妻から受けた“まさかの行動”に「世界中で真美子さんだけ」「可愛すぎて草」【大谷翔平激動の2024年 「家族愛」にも集まった注目】
  2. 60代女性「15年通った美容師に文句を言われ……」 悩める依頼者をプロが大変身させた結末に驚きと称賛「めっちゃ若返って見える!」
  3. 「庶民的すぎる」「明日買おう」 大谷翔平の妻・真美子さんが客席で食べていた? 「のど飴」が話題に
  4. 皇后さま、「菊のティアラ」に注目集まる 天皇陛下のネクタイと合わせたコーデも……【宮内庁インスタ振り返り】
  5. 71歳母「若いころは沢山の男性の誘いを断った」 信じられない娘だったけど…… 当時の姿に仰天「マジで美しい」【フィリピン】
  6. 真っ黒な“極太毛糸”をダイナミックに編み続けたら…… 予想外の完成品に驚きの声【スコットランド】
  7. 新1000円札を300枚両替→よく見たら…… 激レアな“不良品”に驚がく 「初めて見た」「こんなのあるんだ」
  8. 家の壁に“ポケモン”を描きはじめて、半年後…… ついに完成した“愛あふれる作品”に「最高」と反響
  9. 藤本美貴、晩ご飯に手料理7品 多忙でも野菜とお肉たっぷりで反響 「お疲れ様です」「凄く親近感」【2024年の弁当・料理まとめ】
  10. ザリガニが約3000匹いた池の水を、全部抜いてみたら…… 思わず腰が抜ける興味深い結果に「本当にすごい」「見ていて爽快」