インタビュー
» 2019年11月22日 20時00分 公開

辞書作りのシステム化は“辞書の定義”まで変えるかもしれない 『大辞林』編集長インタビュー(1/3 ページ)

「分からない言葉があったら引く」以外の使い方も生まれるかも。

[ねとらぼ]

 制作期間10余年、数十人規模の制作チーム、かつて膨大な手作業により指紋が消失する者もいた。――― これは巨大な建造物ではなく、“辞書”という1冊の本の話です。2019年9月、大型国語辞書『大辞林』(三省堂)から、13年ぶりの全面改訂となる第4版が刊行。本記事は、映画「舟を編む」の制作にも関わった編集長・山本康一さんへのインタビュー企画・第3回となります。

 今回は前回前々回にもチラッとでてきた「辞書作りのシステム化」を中心に伺いました。ユーザー側には見えにくい側面ですが、実は“辞書の定義”まで変えてしまう大きな転換点になっているようです。



取材参加者

  • 山本康一さん:『大辞林』第4版編集長
  • ながさわさん:数百冊の辞書を保有する辞書コレクター。暇さえあれば辞書を引いている
  • ねとらぼ編集部

約20年前から進められていた“辞書のシステム化”

――― 前回、『大辞林』は第3版(2006年刊行)のころから自動組版(紙面などのレイアウトの自動化)に取り組んでいるというお話を伺いました。具体的にはどんなことを?

編集長:20年近くかけて「XML(※)で辞書を設計する」という方針をかなり突き詰めてやってきました。辞書の項目は「見出し」「語義解説」「用例」などから構成されますが、それらのレイアウトに関わる要素をしっかりデータ化しておくことで、“同じデータをさまざまなレイアウトで出力できる”ようにしています。

※XML:「タグ」で文字列を挟むなどして、文章の意味や構造を記述するマークアップ言語。例:<midashi>これは見出しです</midashi> <gogi>これは語義解説です</gogi>

ながさわ:従来、人間が作ってきた辞書をシステム化したわけですね。

編集長:これがない時代は困りましたね。例えば、語義が複数あってそれぞれに番号が振られているとき。語義番号には丸で囲った数字のほか、白抜き漢数字、黒抜き漢数字などが使われることがあるのですが、その階層構造に悩んだことがあります。「白抜き漢数字は黒抜き漢数字よりも上なのか、下なのか、それとも同列なのか」という。

 もちろん、辞書内の凡例に関するページを見るとルールが書いてあるんですが、当時の編集長に聞いたら「それはケースバイケースだ」と言っていて。

――― 困ってしまいますね、ルールがあるのにケースバイケースとは

編集長:結果的に言えば、ほぼ凡例通りになっていたんですけどね。第3版でXMLを採用するとき全て調べました。

 でも、システム化した方が「本当にそうなっているのか」が分かりやすくなる。データが正しくできているか検証するプログラムもあるので、そういう意味でも整合性が保ちやすいと思います。

――― XMLでは独自のタグを定義することが可能。言ってみれば「辞書のデータをどう分類したり、構成したりするか」が自分で決められるわけですが、『大辞林』にはどれくらいタグがあるのですか?

編集長:XMLには「要素」「その要素の属性」というものが設定されるのですが、全部合わせて300種類ほどでしょうか。

ながさわ:そんなにあるんですか!?

編集長:自動組版のためにデータの意味を隅々まで定義して構造化する必要がある……という事情もありますが、さらに編集履歴や言葉のジャンル、位相(年齢、地域、会話・文章などで現れる言葉の意味の違い)といったユーザーには見えないメタ情報も含まれています。これからもどんどん進化していくと思います。

ながさわ:そういったデータを利用して、別の検索方法も利用できるようになったら面白そうですね。例えば、語釈の“類義語”にあたる箇所を検索に利用して、似た意味の言葉を抽出するとか。

編集長:編集支援システム上では可能です。というか、それができないと役に立たない。正規表現を使って、欲しいデータをピンポイントで拾ってくることもできます。

――― 私が学校で教わった辞書の使い方は「言葉が50音順に並んでいて、分からない言葉があったら引く」くらいでしたが、検索方法が変わるならもっと違うことができるかもしれませんね

       1|2|3 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

昨日の総合アクセスTOP10

  1. /nl/articles/2112/01/news020.jpg 「キレッキレ!」「何回見ても笑えるwww」 白柴犬の激しすぎる後ろ足の動きに国内外から大反響
  2. /nl/articles/2111/30/news172.jpg 46歳と18歳の内田有紀、“2人そろって”『STORY』表紙へ 「自分の妹と撮影しているみたい」
  3. /nl/articles/2112/01/news118.jpg 渡辺美奈代、公開した自宅リビングが広すぎて“お姫様のお部屋” ゴージャスな部屋へファン「センスまで抜群」
  4. /nl/articles/2112/01/news111.jpg ゴマキの弟・後藤祐樹、服役中に死去した“母との約束” 「1000万円企画」朝倉未来の計らいで首のタトゥー除去
  5. /nl/articles/2112/01/news155.jpg 高嶋ちさ子、ダウン症の姉とさだまさしのコンサートへ 笑顔あふれる3ショットに「姉妹で素敵」「癒やされました」の声
  6. /nl/articles/2112/01/news182.jpg アイドルが「虚偽の発言」「繋がり行為」など複数の違反行為 ファンのため“卒業”を提案するもブロック→解雇へ
  7. /nl/articles/2112/01/news013.jpg 「校長先生の鑑」「神やん」 激長でおなじみの“校長先生の話”を描いた4コマ漫画が超展開で話題に
  8. /nl/articles/2111/30/news033.jpg パパに叱られる柴犬を黒猫がフォロー→柴犬「あとよろしく!」黒猫「えっ!?」 置いて行かれてあぜんとする表情がかわいい
  9. /nl/articles/2112/01/news095.jpg SPEED島袋寛子、18歳での悲劇を告白 鼻が約20年後も変形したままで「整形しようかと」
  10. /nl/articles/2111/30/news073.jpg 「犬の散歩みたい」――批判的な声にハーネスの使用をためらう親のために 現役ママが開発したリュック一体型「ワーネス」誕生秘話を聞いた

先月の総合アクセスTOP10

  1. 池田エライザ、 “お腹が出ている”体形を指摘する声へ「気にしていません」 1年前には体重58キロ公表も
  2. 「前歯を取られ歯茎を削られ」 広田レオナ、19歳デビュー作で“整形手術”を強制された恐怖体験
  3. ゴマキの弟・後藤祐樹、朝倉未来とのストリートファイトで45秒負け 左目腫らした姿を自ら公開し「もっと立って闘いたかった」
  4. 清原和博の元妻・亜希、16歳次男のレアショットを公開し反響 「スタイル抜群」「さすがモデルの遺伝子」
  5. 小林麻耶、おいっ子・めいっ子とのハロウィーン3ショットに反響 元気な姿に安堵の声が続々「幸せそうでなにより!」
  6. カエルに普段の50倍のエサをあげた結果…… 100点満点のリアクションに「想像以上で笑った」「癒やされました」
  7. 「左手は…どこ?」「片腕が消えてる」 中川翔子、謎が深まる“心霊疑惑”ショットにファン騒然
  8. 「家ではまともに歩けてない」 広田レオナ、左股関節に原因不明の“炎症” 夫から「凄い老けたと言われてます」
  9. 小林麻耶、髪ばっさりショートボブに「とても軽いです!」 ファンも反応「似合います」「気分も変わりますよね!」
  10. キンタロー。浅田舞の社交ダンス挑戦を受け体格差に驚がく 「手足が長い!!」「神様のイタズラがすぎるぞ!!」