ニュース

人は夜中の2時にエロくなるらしいぞ! Yahoo!リアルタイム検索のビッグデータで明らかに

Twitterでよくつぶやかれる言葉を抽出し、時間帯ごとに集計すると、人の感情の移り変わりが浮かび上がってきます。

advertisement

 人は夜中の2時にエロくなることがビッグデータで明らかになりました。Twitterでよくつぶやかれる言葉を抽出し、時間帯ごとに集計すると、人の感情の移り変わりが浮かび上がってきたのです。その結果……「エロい」を含むつぶやきのピークは2時台という調査結果が出ました。


1カ月間のツイート数の推移

 調査をしたのは「Yahoo!検索(リアルタイム)」を提供しているヤフーです。彼らによると、1カ月間の全体ツイート数は5時台が最も少なく、12時台に一旦増え、その後落ち込んだ後に夜に向け再び上昇し、22時台がピークとなるそうです。では特定のワードのツイート量・割合はどんな風に変化するのでしょうか。調べれば日本人の感情や感覚の推移を可視化できるのでは――というのが今回の目的であります。

 例えば「疲れた」という言葉。1カ月間の調査で“ツイート量”が最も多かったのは22時台でした。ただこれは「全体のツイート量に影響された値」であり、「疲れた」が22台を代表する言葉かというとそうは言い切れません。「疲れた」の時間帯別“ツイート割合”を調べると、ピークは17時台でした。学校や仕事が一段落する夕方、いかにも疲労がたまっていそうな時間帯に増えているのが面白いです。

advertisement
「疲れた」のツイート数(左)とツイート割合(右)の推移。割合では17時にピーク

 続いて、各時間帯を代表するワードを抽出することでTwitterを利用する日本人の24時間の特徴をあぶり出していきます。ちょっと細かいですが、ワードの選定はこんな風にやっているそうです。

(1)ツイート文から形態素解析(文章から意味のある単語などを自動抽出する技術)により抽出したワード(名詞および形容詞)と、Web検索の検索数上位ワードから作成した辞書を組み合わせてワードリストを生成

(2)そのリストを元に2014年2月の総ツイート文からワードを再抽出

(3)各時間帯の総ツイート数に占める各ワードを含んだツイート文の割合を計算し、各時間帯を代表するワードを選定

 時間帯ごとに特にツイート割合が高い傾向にある言葉上位5つは次の通り。例えば朝6時台は「明るい」「眠い」と1日の始まりを感じるワードが並びます。お昼の12時台は「お腹すいた」「もぐもぐ」ですが、13時台になると「満腹」が増えます。17時台になると「帰ろう」や先ほどの「疲れた」がつぶやかれ、18時台には「お疲れ様です」といった言葉も。

advertisement

 注目は夜中2時台。1位から順に「怖い」「エロい」「やかましい」「たのしい」「だめ」です。ここへ来て「エロい」があらわれた!!! いやー皆さん楽しい夜をお過ごしのようで。ちなみに23時~0時台は「素晴らしい」「だいすき。」「幸せです」など楽しげな言葉が多いのですが、夜が深まるとネガティブなワードが増えていき、4時台の1位は「死ね」でした。

Copyright © ITmedia, Inc. All Rights Reserved.

記事ランキング

  1. 釣りに行こうとしたら、海岸に子猫が打ち上げられていて…… 保護後、予想だにしない展開に「神様降臨」「涙が止まりません」
  2. しぶとい雑草“ドクダミ”を生やさない超簡単な方法が115万再生! 除草剤を使わない画期的な対策に「スゴイ発見」
  3. “女子小学生”がメンズカットしたら……「え!」 その驚きの大変身に「な、なに!?」「絶対モテる」と反響
  4. 顔の半分は童顔メイク、もう半分の仕上がりに驚がく 同一人物と思えない半顔メイクが860万再生「凄いねメイクの力」
  5. 正体不明の「なにかふしぎなもの」がハードオフで販売→Twitterで情報集まり正体が判明
  6. 「とんでもないものが売ってた」 ハードオフに“33万円”で売られていた「まさかの商品」に思わず仰天
  7. 「起動しません」 ハードオフで4000円のジャンクPS4購入→電源入れると“驚きの結果”に「そんなことあるんだ」
  8. スーパーで買ったレモンの種が1年後…… まさかの結果が635万再生「さっそくやってみます」「すごーい!」「手品みたい」
  9. 小1娘、ペンギンの卵を楽しみに育ててみたら…… 期待を裏切る生き物の爆誕に「声出して笑ってしまったw」「反応がめちゃくちゃ可愛い」
  10. 「ワンピース」ナミに扮したイタリアのコスプレイヤーが麗しい! 「完璧」「美しい!」と称賛