インタビュー

辞書作りのシステム化は“辞書の定義”まで変えるかもしれない 『大辞林』編集長インタビュー(1/3 ページ)

「分からない言葉があったら引く」以外の使い方も生まれるかも。

advertisement

 制作期間10余年、数十人規模の制作チーム、かつて膨大な手作業により指紋が消失する者もいた。――― これは巨大な建造物ではなく、“辞書”という1冊の本の話です。2019年9月、大型国語辞書『大辞林』(三省堂)から、13年ぶりの全面改訂となる第4版が刊行。本記事は、映画「舟を編む」の制作にも関わった編集長・山本康一さんへのインタビュー企画・第3回となります。

 今回は前回前々回にもチラッとでてきた「辞書作りのシステム化」を中心に伺いました。ユーザー側には見えにくい側面ですが、実は“辞書の定義”まで変えてしまう大きな転換点になっているようです。

取材参加者

  • 山本康一さん:『大辞林』第4版編集長
  • ながさわさん:数百冊の辞書を保有する辞書コレクター。暇さえあれば辞書を引いている
  • ねとらぼ編集部

約20年前から進められていた“辞書のシステム化”

――― 前回、『大辞林』は第3版(2006年刊行)のころから自動組版(紙面などのレイアウトの自動化)に取り組んでいるというお話を伺いました。具体的にはどんなことを?

advertisement

編集長:20年近くかけて「XML(※)で辞書を設計する」という方針をかなり突き詰めてやってきました。辞書の項目は「見出し」「語義解説」「用例」などから構成されますが、それらのレイアウトに関わる要素をしっかりデータ化しておくことで、“同じデータをさまざまなレイアウトで出力できる”ようにしています。

※XML:「タグ」で文字列を挟むなどして、文章の意味や構造を記述するマークアップ言語。例:<midashi>これは見出しです</midashi> <gogi>これは語義解説です</gogi>

各種辞書アプリの開発、販売を行う企業・物書堂のツイート

ながさわ:従来、人間が作ってきた辞書をシステム化したわけですね。

編集長:これがない時代は困りましたね。例えば、語義が複数あってそれぞれに番号が振られているとき。語義番号には丸で囲った数字のほか、白抜き漢数字、黒抜き漢数字などが使われることがあるのですが、その階層構造に悩んだことがあります。「白抜き漢数字は黒抜き漢数字よりも上なのか、下なのか、それとも同列なのか」という。

 もちろん、辞書内の凡例に関するページを見るとルールが書いてあるんですが、当時の編集長に聞いたら「それはケースバイケースだ」と言っていて。

――― 困ってしまいますね、ルールがあるのにケースバイケースとは

advertisement

編集長:結果的に言えば、ほぼ凡例通りになっていたんですけどね。第3版でXMLを採用するとき全て調べました。

 でも、システム化した方が「本当にそうなっているのか」が分かりやすくなる。データが正しくできているか検証するプログラムもあるので、そういう意味でも整合性が保ちやすいと思います。

――― XMLでは独自のタグを定義することが可能。言ってみれば「辞書のデータをどう分類したり、構成したりするか」が自分で決められるわけですが、『大辞林』にはどれくらいタグがあるのですか?

編集長:XMLには「要素」「その要素の属性」というものが設定されるのですが、全部合わせて300種類ほどでしょうか。

ながさわ:そんなにあるんですか!?

advertisement

編集長:自動組版のためにデータの意味を隅々まで定義して構造化する必要がある……という事情もありますが、さらに編集履歴や言葉のジャンル、位相(年齢、地域、会話・文章などで現れる言葉の意味の違い)といったユーザーには見えないメタ情報も含まれています。これからもどんどん進化していくと思います。

ながさわ:そういったデータを利用して、別の検索方法も利用できるようになったら面白そうですね。例えば、語釈の“類義語”にあたる箇所を検索に利用して、似た意味の言葉を抽出するとか。

編集長:編集支援システム上では可能です。というか、それができないと役に立たない。正規表現を使って、欲しいデータをピンポイントで拾ってくることもできます。

――― 私が学校で教わった辞書の使い方は「言葉が50音順に並んでいて、分からない言葉があったら引く」くらいでしたが、検索方法が変わるならもっと違うことができるかもしれませんね

       | 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

記事ランキング

  1. ザリガニが約3000匹いた池の水を、全部抜いてみたら…… 思わず腰が抜ける興味深い結果に「本当にすごい」「見ていて爽快」
  2. ズカズカ家に入ってきたぼっちの子猫→妙になれなれしいので、風呂に入れてみると…… 思わず腰を抜かす事態に「たまらんw」「この子は賢い」
  3. 「懐かしい」 ハードオフで“30年前のPC”を購入→Windows 95をインストールしたら“驚きの結果”に!
  4. 「靴下屋」運営のタビオ、SNSアカウント炎上を受け「不適切投稿に関するお詫び」発表 「破れないストッキング」についてのやりとりが発端
  5. 餓死寸前でうなり声を上げていた野犬を保護→“6年後の姿”が大きな話題に! さらに2年後の現在を飼い主に聞いた
  6. 「タダでもいいレベル」 ハードオフで1100円で売られていた“まさかのジャンク品”→修理すると…… 執念の復活劇に「すごすぎる」
  7. 毛糸でフリルをたくさん編んでいくと…… ため息がもれるほどかわいい“まるで天使”なアイテムに「一目惚れしてしまいました」「うちの子に作りたい!」
  8. 放置された池でレアな魚を狙っていた親子に、想定外の事態 目にしたショッキングな光景に悲しむ声が続々
  9. 脱北した女性たちが初めて“日本のお寿司”を食べたら…… 胸がつまる現実に考えさせられる 「泣いてしまった」「心打たれました」
  10. 父「若いころはモテた」→息子は半信半疑だったが…… 当時の“間違いなく大人気の姿”に40万いいね「いい年の取り方」【海外】