ITmedia ガジェット 過去記事一覧
検索
ニュース

人は夜中の2時にエロくなるらしいぞ! Yahoo!リアルタイム検索のビッグデータで明らかに

Twitterでよくつぶやかれる言葉を抽出し、時間帯ごとに集計すると、人の感情の移り変わりが浮かび上がってきます。

PC用表示 関連情報
advertisement

 人は夜中の2時にエロくなることがビッグデータで明らかになりました。Twitterでよくつぶやかれる言葉を抽出し、時間帯ごとに集計すると、人の感情の移り変わりが浮かび上がってきたのです。その結果……「エロい」を含むつぶやきのピークは2時台という調査結果が出ました。

画像
1カ月間のツイート数の推移

 調査をしたのは「Yahoo!検索(リアルタイム)」を提供しているヤフーです。彼らによると、1カ月間の全体ツイート数は5時台が最も少なく、12時台に一旦増え、その後落ち込んだ後に夜に向け再び上昇し、22時台がピークとなるそうです。では特定のワードのツイート量・割合はどんな風に変化するのでしょうか。調べれば日本人の感情や感覚の推移を可視化できるのでは――というのが今回の目的であります。

 例えば「疲れた」という言葉。1カ月間の調査で“ツイート量”が最も多かったのは22時台でした。ただこれは「全体のツイート量に影響された値」であり、「疲れた」が22台を代表する言葉かというとそうは言い切れません。「疲れた」の時間帯別“ツイート割合”を調べると、ピークは17時台でした。学校や仕事が一段落する夕方、いかにも疲労がたまっていそうな時間帯に増えているのが面白いです。


画像画像 「疲れた」のツイート数(左)とツイート割合(右)の推移。割合では17時にピーク

 続いて、各時間帯を代表するワードを抽出することでTwitterを利用する日本人の24時間の特徴をあぶり出していきます。ちょっと細かいですが、ワードの選定はこんな風にやっているそうです。

(1)ツイート文から形態素解析(文章から意味のある単語などを自動抽出する技術)により抽出したワード(名詞および形容詞)と、Web検索の検索数上位ワードから作成した辞書を組み合わせてワードリストを生成

(2)そのリストを元に2014年2月の総ツイート文からワードを再抽出

(3)各時間帯の総ツイート数に占める各ワードを含んだツイート文の割合を計算し、各時間帯を代表するワードを選定

 時間帯ごとに特にツイート割合が高い傾向にある言葉上位5つは次の通り。例えば朝6時台は「明るい」「眠い」と1日の始まりを感じるワードが並びます。お昼の12時台は「お腹すいた」「もぐもぐ」ですが、13時台になると「満腹」が増えます。17時台になると「帰ろう」や先ほどの「疲れた」がつぶやかれ、18時台には「お疲れ様です」といった言葉も。

画像

 注目は夜中2時台。1位から順に「怖い」「エロい」「やかましい」「たのしい」「だめ」です。ここへ来て「エロい」があらわれた!!! いやー皆さん楽しい夜をお過ごしのようで。ちなみに23時〜0時台は「素晴らしい」「だいすき。」「幸せです」など楽しげな言葉が多いのですが、夜が深まるとネガティブなワードが増えていき、4時台の1位は「死ね」でした。

画像

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る