国会で「誰が」「何を」「どれだけ」言ったか、国立国会図書館 国会議事録検索システムから掘り起こしてビジュアルライクに見せるサイト「国会採掘」が登場しました。各議員の大まかな傾向や動向がひと目で分かる。


2019年以降の議事録データを対象に、議員が何度も発した単語を「頻出語」、その議員を特徴づける(他の議員があまり言っていない)単語を「特徴語」と定義し、抽出して見せるシステム。頻出語や特徴語は、その度合いに応じた大きさで、1枚の画像にまとめて表示されます。フォントサイズから主張の強さが見えてきそう。
使い方は名前か所属政党をもとに、議員を検索・指定するだけ。発言の画像をクリックすると、議員の詳細ページが閲覧できます。各頻出語・特徴語のリンクから、国会議事録検索システムの当該ページを参照することも可能。



国会採掘は7月にオープンしてから近ごろ注目を集め始め、「少なくとも、各議員の国会で仕事をしようとする意思の有無は確認できる」「選挙のときに役立ちそう」「選挙区別に検索できるとなお良い」などと話題に。Twitterでは、現職議員による言及もみられます。
編集部が運営者に仕組みを聞いたところ、国立国会図書館が公開している国会議事録取得用のAPIを利用し、Pythonでスクリプトを組んでデータを収集しているとのこと。解析用に独自のユーザー定義辞書を用意し、発言から名詞のみを抽出して集計しているそうです。
なお、ユーザー定義辞書の単語数は現在1万5000語程度。現状では一部の言葉が発掘されないケースもあるようですが、収録語は今後も継続して追加される予定です。
コメントランキング
こだわりのへぎそばが味わえるお店などを紹介! 新潟県の「そば」の名店10選! | 新潟県 ねとらぼリサーチ
「総じて優秀なのは東大卒」「京大院卒の後輩できたけど優秀すぎ」 “卒業生が優秀”だと思う「国公立大学」はどこ?【アンケート実施中】(投票結果) | 教育・子育て ねとらぼ
創業時から継ぎ足されてきた秘伝のタレを使用したうなぎが味わえるお店などを紹介! 三重県の「うな重」の名店10選!(コメント一覧) | 三重県 ねとらぼリサーチ
「もう3〜4年リピしてる」“香りが大好評の洗濯用洗剤”に「職場で聞かれるくらい良い匂い」「一生これでいい」「ふんわり自然な良い香り」の声(1/2) | ライフ ねとらぼリサーチ
「インスタントとは思えない」 40~50代男性が選ぶ“言わなかったら袋麺とばれなそうな袋麺”ランキング上位に集まった声「アレンジすると感動」(1/3) | ラーメン ねとらぼリサーチ