国会で「誰が」「何を」「どれだけ」言ったか、国立国会図書館 国会議事録検索システムから掘り起こしてビジュアルライクに見せるサイト「国会採掘」が登場しました。各議員の大まかな傾向や動向がひと目で分かる。


2019年以降の議事録データを対象に、議員が何度も発した単語を「頻出語」、その議員を特徴づける(他の議員があまり言っていない)単語を「特徴語」と定義し、抽出して見せるシステム。頻出語や特徴語は、その度合いに応じた大きさで、1枚の画像にまとめて表示されます。フォントサイズから主張の強さが見えてきそう。
使い方は名前か所属政党をもとに、議員を検索・指定するだけ。発言の画像をクリックすると、議員の詳細ページが閲覧できます。各頻出語・特徴語のリンクから、国会議事録検索システムの当該ページを参照することも可能。



国会採掘は7月にオープンしてから近ごろ注目を集め始め、「少なくとも、各議員の国会で仕事をしようとする意思の有無は確認できる」「選挙のときに役立ちそう」「選挙区別に検索できるとなお良い」などと話題に。Twitterでは、現職議員による言及もみられます。
編集部が運営者に仕組みを聞いたところ、国立国会図書館が公開している国会議事録取得用のAPIを利用し、Pythonでスクリプトを組んでデータを収集しているとのこと。解析用に独自のユーザー定義辞書を用意し、発言から名詞のみを抽出して集計しているそうです。
なお、ユーザー定義辞書の単語数は現在1万5000語程度。現状では一部の言葉が発掘されないケースもあるようですが、収録語は今後も継続して追加される予定です。
コメントランキング
「回転寿司」でコスパ最強だと思うチェーンは?【アンケート実施中】(投票結果) | グルメ ねとらぼ
「戦国武将」で最強だと思うのは誰?【アンケート実施中】(投票結果) | ライフスタイル ねとらぼ
「最強」だと思う松田聖子のシングル曲は?【2026年版・人気投票実施中】(投票結果) | 音楽 ねとらぼリサーチ
「これだけは外せない!」サイゼリヤの定番メニューはどれ?【アンケート実施中】(投票結果) | グルメ ねとらぼ
NHK「朝ドラ」であなたが一番好きな作品は?【アンケート実施中】(投票結果) | ドラマ ねとらぼ