2019/11/22 20:00（公開）

2019/11/22 20:00（更新）

辞書作りのシステム化は“辞書の定義”まで変えるかもしれない　『大辞林』編集長インタビュー

LINE

hatena

Home

「分からない言葉があったら引く」以外の使い方も生まれるかも。

INDEX

　制作期間10余年、数十人規模の制作チーム、かつて膨大な手作業により指紋が消失する者もいた。―――　これは巨大な建造物ではなく、“辞書”という1冊の本の話です。2019年9月、大型国語辞書『大辞林』（三省堂）から、13年ぶりの全面改訂となる第4版が刊行。本記事は、映画「舟を編む」の制作にも関わった編集長・山本康一さんへのインタビュー企画・第3回となります。

　今回は前回、前々回にもチラッとでてきた「辞書作りのシステム化」を中心に伺いました。ユーザー側には見えにくい側面ですが、実は“辞書の定義”まで変えてしまう大きな転換点になっているようです。

取材参加者

山本康一さん：『大辞林』第4版編集長
ながさわさん：数百冊の辞書を保有する辞書コレクター。暇さえあれば辞書を引いている
ねとらぼ編集部

約20年前から進められていた“辞書のシステム化”

―――　前回、『大辞林』は第3版（2006年刊行）のころから自動組版（紙面などのレイアウトの自動化）に取り組んでいるというお話を伺いました。具体的にはどんなことを？

編集長：20年近くかけて「XML（※）で辞書を設計する」という方針をかなり突き詰めてやってきました。辞書の項目は「見出し」「語義解説」「用例」などから構成されますが、それらのレイアウトに関わる要素をしっかりデータ化しておくことで、“同じデータをさまざまなレイアウトで出力できる”ようにしています。

※XML：「タグ」で文字列を挟むなどして、文章の意味や構造を記述するマークアップ言語。例：＜midashi＞これは見出しです＜/midashi＞　＜gogi＞これは語義解説です＜/gogi＞

各種辞書アプリの開発、販売を行う企業・物書堂のツイート

ながさわ：従来、人間が作ってきた辞書をシステム化したわけですね。

編集長：これがない時代は困りましたね。例えば、語義が複数あってそれぞれに番号が振られているとき。語義番号には丸で囲った数字のほか、白抜き漢数字、黒抜き漢数字などが使われることがあるのですが、その階層構造に悩んだことがあります。「白抜き漢数字は黒抜き漢数字よりも上なのか、下なのか、それとも同列なのか」という。

　もちろん、辞書内の凡例に関するページを見るとルールが書いてあるんですが、当時の編集長に聞いたら「それはケースバイケースだ」と言っていて。

―――　困ってしまいますね、ルールがあるのにケースバイケースとは

編集長：結果的に言えば、ほぼ凡例通りになっていたんですけどね。第3版でXMLを採用するとき全て調べました。

　でも、システム化した方が「本当にそうなっているのか」が分かりやすくなる。データが正しくできているか検証するプログラムもあるので、そういう意味でも整合性が保ちやすいと思います。

―――　XMLでは独自のタグを定義することが可能。言ってみれば「辞書のデータをどう分類したり、構成したりするか」が自分で決められるわけですが、『大辞林』にはどれくらいタグがあるのですか？

編集長：XMLには「要素」「その要素の属性」というものが設定されるのですが、全部合わせて300種類ほどでしょうか。

ながさわ：そんなにあるんですか!?

編集長：自動組版のためにデータの意味を隅々まで定義して構造化する必要がある……という事情もありますが、さらに編集履歴や言葉のジャンル、位相（年齢、地域、会話・文章などで現れる言葉の意味の違い）といったユーザーには見えないメタ情報も含まれています。これからもどんどん進化していくと思います。

ながさわ：そういったデータを利用して、別の検索方法も利用できるようになったら面白そうですね。例えば、語釈の“類義語”にあたる箇所を検索に利用して、似た意味の言葉を抽出するとか。

編集長：編集支援システム上では可能です。というか、それができないと役に立たない。正規表現を使って、欲しいデータをピンポイントで拾ってくることもできます。

―――　私が学校で教わった辞書の使い方は「言葉が50音順に並んでいて、分からない言葉があったら引く」くらいでしたが、検索方法が変わるならもっと違うことができるかもしれませんね

辞書づくりのシステム化で“辞書の定義”が変わる？

辞書作りのシステム化は“辞書の定義”まで変えるかもしれない　『大辞林』編集長インタビュー

INDEX

取材参加者

約20年前から進められていた“辞書のシステム化”

「何でそんなに老けてるの？」と言われた42歳妻、すっぴんからフルメイクしたら……　変身した姿が「アンジーに似てる！」「赤リップ似合いそう」

マックでオレンジジュースを購入→開けたら……　目を疑う光景に「蓋開けるの怖い」「よく持って帰りましたね」

農家が無人販売の結果を見に行ったら……“あ然とする光景”に「涙そうそう」「お金も入れないで」

静岡の海で見つけた“謎の物体”→棒でツンツンしたら……　まさかの正体に「ギャーっ！」「絶対触っちゃダメですよ」

「思わず2つ買った」　スタバの“ふた付きタンブラー”に絶賛の声　「保冷保温がしっかりできる」「デザインに一目惚れ」「色味も綺麗で毎日使ってます」

岡山県の洋菓子店に“100歳のバースデーケーキ”を頼んだら……　驚きの神対応に「見たことありません」「すごく気が利いてる」

「クーラーボックス積まなくても飲み物が冷やせる」　3COINSの“車用保冷ポケット”が大好評　「ペットボトル4本とお菓子も入る」「ドリンク持って車乗る時便利」

灯油タンクをカットして、注ぎ口にペットボトルを差し込んだら……　驚きの光景が「わあ、すごく簡単」「試してみる価値あり」と771万再生【海外】

「もうG-SHOCK買う必要ない」カシオの“コスパ最強腕時計”が大好評「チープカシオとは呼べない」「仕事の相棒です」

「これ直して」と渡されたボロボロのテディベア→修復したら……　驚きの姿が100万表示「涙出そう」「魔法のようです」

実施中

声が好きな「日本のボーカリスト」は？

実施中

歌が上手だと思うホロライブのメンバーは？

実施中

ラーメンって日本食？それとも中華料理？

実施中

神奈川県で一番うまいと思う「横浜家系ラーメン店」はどこ？

実施中

唯一無二の歌声だと思うボーカリストは？

名曲だと思う「サザンオールスターズ」のシングルは？【2026年版・人気投票実施中】（投票結果） | 音楽ねとらぼリサーチ

一番好きな「韓国の男性俳優」は？【2026年版・人気投票実施中】（投票結果） | 芸能人ねとらぼリサーチ

【スタジオジブリ】「ジブリヒロイン」であなたの大好きなキャラクターは誰？【2026年版・人気投票実施中】（投票結果） | アニメねとらぼリサーチ

「もっと早く買えば良かった」　カインズの“車内遮光カーテン”が大人気　「プライバシーも保てて安心」「ぐっすり眠れました」（2/2） | ライフねとらぼリサーチ：2ページ目

兵庫県の「ケーキ」の名店10選！　一番うまいと思う店はどこ？【7月12日は「デコレーションケーキの日」！】（2/4） | 兵庫県ねとらぼリサーチ：2ページ目

辞書作りのシステム化は“辞書の定義”まで変えるかもしれない 『大辞林』編集長インタビュー

INDEX

取材参加者

約20年前から進められていた“辞書のシステム化”

辞書作りのシステム化は“辞書の定義”まで変えるかもしれない　『大辞林』編集長インタビュー