自衛隊イラク日報の全文検索サイトが登場 個人が3時間程度で制作

すごい。

» 2018年04月18日 12時55分 公開
[福田瑠千代ねとらぼ]

 防衛省が、当初存在しないとしていた自衛隊イラク派遣時の日報を4月16日に公開。その膨大な資料を全文検索できるサイト「イラク日報 全文検索【イラク日報村】」が17日夜に有志によりWeb上で公開され、話題を呼んでいます。

 日誌の全文データは朝日新聞デジタルなどがWeb上で公開していますが、そのままでは文字検索ができないPDFファイルとなっていたため、1万ページ以上ともいわれる内容を精査するのは大変でした。

advertisement

 制作したのはマーケティングリサーチ会社ポップインサイトに務める森川公康(@alea12)さん。業務の間を縫って、自衛隊の日誌検索サイトを作ってしまいました。

 検索をすると、文字列がヒットしたPDFファイルへのリンクと、その文字列が出現するPDF内のページ番号が表示される親切な仕組み。サイトのトップページには「人気のキーワード」ランキングも表示されます。

自衛隊イラク日報の全文検索サイトが登場 個人が3時間程度で制作 ほのぼのした文体で人気の「バグダッド日誌」「バスラ日誌」に出てくる“素麺”“スキンヘッド”“モンゴル”といったキーワードが人気
advertisement
自衛隊イラク日報の全文検索サイトが登場 個人が3時間程度で制作 最も検索されている“戦闘”の検索結果
自衛隊イラク日報の全文検索サイトが登場 個人が3時間程度で制作 検索結果に書かれていた通り、「2004年09月22日の日報(12ページ目)」に“戦闘”の文字が確認できる(緑色の下線は編集部で強調したもの)

 森川さんによると、実制作にかかったのは3時間程度。まずGoogle Cloud Vision APIにPDFのOCR化(※)を行わせるコードの作成に約1時間。OCR化は寝ている間に終わり、OCR結果からの必要情報の抽出とデータベース設計に約1時間、検索インタフェースの制作に約1時間かかったそうです。

※OCR化:PCなどで画像上の文字情報を認識できるようにする処理

advertisement

 日報検索サイトを作った動機は、「紆余曲折を経て公開された貴重なデータをより多くの方に知ってもらいたいと思ったから」とのこと。また、Google Cloud Vision APIの活用を検討していたところ、格好の題材だったために挑戦したという背景もあったそうです。

 日誌検索サービスに使われた技術はGoogle Cloud Vision APIの他に、RailsやHerokuなども駆使しているそうです。森川さんは過去にも手軽にWeb上からFaxを送信可能なサービス「FaxFlyer」や、Twitterの他人のアカウントを紹介(他己紹介)できる「ツイたこ」といったユニークなサービスを手掛けています。

 自衛隊の日報といえば、一部ほのぼのしたエッセイ風の「バグダッド日誌」「バスラ日誌」のコーナーがSNSなどで話題になっていました(関連記事)。これらの日誌コーナーを抜き出すシステムを組むことはできないか森川さんに問い合わせたところ、「ご要望を多く頂いており、まさに開発中です!」とのことでした。こちらの完成も楽しみです。


SNSで話題になっていた「バグダッド日誌」

防衛省公開の「バグダッド日誌」が読み物として面白いと話題に 「バグダッド日誌」で特に人気の坊主ネタ
防衛省公開の「バグダッド日誌」が読み物として面白いと話題に 坊主になった結果、韓国の陸中佐に「南無阿弥陀仏」と崇められることに
防衛省公開の「バグダッド日誌」が読み物として面白いと話題に 謎の生物「ヴィッシー」
防衛省公開の「バグダッド日誌」が読み物として面白いと話題に プリンタを壊したエピソード
防衛省公開の「バグダッド日誌」が読み物として面白いと話題に 「バグダッド日誌」の最終回

Copyright © ITmedia, Inc. All Rights Reserved.

昨日の総合アクセスTOP10
  1. /nl/articles/2503/10/news085.jpg 夫に「ゴミ買ったの?」と言われたハギレを並べて縫っていくと…… とんでもない完成品に「ワクワクしかない」「かわいすぎる!」
  2. /nl/articles/2503/10/news122.jpg 【べらぼう】“最後”のシーンに「最終回かと」「神回」 27歳俳優が「あんなに演技上手かったんだ……」と話題
  3. /nl/articles/2503/10/news100.jpg 新山千春の娘・もあ、高校卒業後は海外へ「ダンサーの夢に向かって」 高校最後の弁当も公開
  4. /nl/articles/2503/09/news003.jpg 「恩師ビックリするやろなぁ」 中学3年で付き合い始めた“同級生カップル”が10年後…… まさかの現在に反響
  5. /nl/articles/2503/09/news010.jpg ダイソーのセルフレジが「身に覚えのない商品」を認識→“まさかの正体”に大仰天 「そんなことあるんですね」
  6. /nl/articles/2503/08/news043.jpg グッズを高額転売された人気VTuber→「強すぎる」まさかの対処法が「天才か?」「めっちゃいい案」と560万表示
  7. /nl/articles/2503/10/news107.jpg 「お前はーーーッ!!」 マクドナルド、謎のキャラクターを“ドアップ”でネタバラシ→分かる人には分かる“顔”に「おかえりなさい!」
  8. /nl/articles/2503/10/news098.jpg 『ちいかわ』にミスド登場!? エンゼルクリーム売上好調か 「かなり売れてた」「みんな買っている」
  9. /nl/articles/2503/03/news065.jpg 【べらぼう】“問題のシーン”、「子供に見せられない」 身体張った27歳俳優へ「演技やばくない?」
  10. /nl/articles/2503/10/news034.jpg ウサギの帽子をかぶった赤ちゃんが5年後…… 同じ帽子で撮影した“現在の姿”に反響「成長って凄いですね!」
先週の総合アクセスTOP10
  1. 【べらぼう】“問題のシーン”、「子供に見せられない」 身体張った27歳俳優へ「演技やばくない?」
  2. 40代女性、デートに行くため“本気でメイク”したら…… 別人級の仕上がりに「すごいな」「めっちゃ乙女感出てる」
  3. 30年以上前の製品がかっこいい ソニーの小型ラジオのデザインが「すごい好き」「いまでも通用しそう」
  4. 幼くてかわいらしい兄妹が4年後…… 同じポーズで撮影した“現在の姿”に「これはあかん」「よすぎて声出ました」
  5. 「早く買えば良かった」 無印の1490円“本格せいろ”が690万表示の反響 「ほぼ毎日使ってる」「まっっじでいい」と感動の声
  6. ごはん炊き忘れた父「いいこと閃いた!」→完成した弁当に爆笑「アンタすげぇよ!」 息子「意味ねぇことすんなよ」
  7. 使わなくなった折りたたみ傘→切って縫うだけで…… 驚きのアイテムに変身「こうすればよかったのか!」「見事」【海外】
  8. 高3女子「進学を機にイメチェンしたい」→美容師に依頼すると…… 仕上がりが「すげえええ」「鳥肌立ちました」と1000万再生
  9. とんでもない量の糸をくれた先輩→ママがお返しに作ったのは…… 完成した“かわいいアイテム”に「絶対喜ばれるやつ!」
  10. 「洗濯機が壊れた!」→修理を頼む前によくよく調べてみると…… 「えぇ~」“まさかの原因”が200万表示「何度もやりました」
先月の総合アクセスTOP10
  1. 最初に軽く結ぶだけで…… 2000万再生された“マフラーの巻き方”に反響「これは使える」「素晴らしいアイデア」【海外】
  2. コメダ珈琲店で朝、ミックスサンドとコーヒーを頼んだら…… “とんでもない事態”に爆笑「恐るべし」「コントみたい」
  3. パパに抱っこされる娘、13年後の成人式に同じ場所とポーズで再現したら…… 「お父さん若返った?笑」「時止まってる」2人の姿に驚き
  4. 和菓子屋で、バイトの子に難題“はさみ菊”を切らせてみたら……「将来有望」と大反響 その後どうなった?現在を聞いた
  5. 古いバスタオルをザクザク切って縫い付けると…… 目からウロコの再利用に「すてきなアイデア」【海外】
  6. 「14歳でレコ大受賞」 人気アイドルがセクシー女優に転身した理由明かす 家族、メンバー、ファンの“意外な反応”
  7. 希少性ガンで闘病中だったアイドル、死去 「言葉も発せないほどの痛み」母親が闘病生活を明かす
  8. “きれいな少年”が大人になったら→「なんでそうなったw」姿に驚がく 「イケメンの無駄遣い」「どっちも好きです!笑」
  9. ドブで捕獲したザリガニを“清らかな天然水”で2週間育てたら…… 「こりゃすごい」興味深い結末が195万再生「初めて見た」
  10. 芸能界引退した「ショムニ」主演の江角マキコ、58歳の近影にネット衝撃「エグすぎた」 突然顔出しした娘とのやりとりも話題に