ITmedia ガジェット 過去記事一覧
検索
ニュース

国会議員の発言をビジュアル化するサイト「国会採掘」が分かりやすい 各議員の特徴を1枚の画像に

発言内の特徴的な言葉ほど目立つように可視化。

advertisement

 国会で「誰が」「何を」「どれだけ」言ったか、国立国会図書館 国会議事録検索システムから掘り起こしてビジュアルライクに見せるサイト「国会採掘」が登場しました。各議員の大まかな傾向や動向がひと目で分かる。

国会採掘 国会でのさまざまな発言を採掘
国会採掘 名前か所属政党で検索すると、指定した議員の特徴的な発言を1枚の画像にまとめて見せてくれる

 2019年以降の議事録データを対象に、議員が何度も発した単語を「頻出語」、その議員を特徴づける(他の議員があまり言っていない)単語を「特徴語」と定義し、抽出して見せるシステム。頻出語や特徴語は、その度合いに応じた大きさで、1枚の画像にまとめて表示されます。フォントサイズから主張の強さが見えてきそう。

 使い方は名前か所属政党をもとに、議員を検索・指定するだけ。発言の画像をクリックすると、議員の詳細ページが閲覧できます。各頻出語・特徴語のリンクから、国会議事録検索システムの当該ページを参照することも可能。

国会採掘 菅総理のページで一番目立つ「全日空ホテル」を、下方の単語リストから選んでクリック
国会採掘 2020年2月18日(内閣官房長官時代)、桜の会に関する答弁として発した単語と判明。詳細を知りたい場合は、日付の右にあるボタンをクリック
国会採掘 当日の議事録がオープン。発言箇所そのものには飛ばないので、議事録検索システム上の検索等を利用して探す必要はある

 国会採掘は7月にオープンしてから近ごろ注目を集め始め、「少なくとも、各議員の国会で仕事をしようとする意思の有無は確認できる」「選挙のときに役立ちそう」「選挙区別に検索できるとなお良い」などと話題に。Twitterでは、現職議員による言及もみられます。

 編集部が運営者に仕組みを聞いたところ、国立国会図書館が公開している国会議事録取得用のAPIを利用し、Pythonでスクリプトを組んでデータを収集しているとのこと。解析用に独自のユーザー定義辞書を用意し、発言から名詞のみを抽出して集計しているそうです。

 なお、ユーザー定義辞書の単語数は現在1万5000語程度。現状では一部の言葉が発掘されないケースもあるようですが、収録語は今後も継続して追加される予定です。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る