「異体字」問題・その1
印刷物から電子書籍を作成するにあたって乗り越えなければならない問題はたくさんありますが、まず真っ先に問題となると思われるポイントのひとつ、「異体字」の問題について書いてみたいと思います。
異体字とは何か
日本語文書では実にたくさんの漢字が用いられますが、同じ文字でも微妙に字形が異なる文字を用いる場合があります。特に人名・地名で頻出する「旧字体」などが広く知られた例ですが、印刷物に用いられている異体字形のバリエーションは、到底それだけで収まりきれるようなものではありません。
試みに、「渡辺」の「辺」の字の異体字をInDesignの字形パレットで表示させてみます。1、2、3・・・24種類!これは「Adobe1-6」というグリフ(字形集合)規格に対応したOpenTypeフォントが内包している字形ですが、この字形全てを字形パレットから呼び出して表現できるのが現在の印刷組版システムです。さすがにこの「辺」の文字の字形バリエーションは例外的に多い部類に属しますが、普通の漢字でも「旧字体」「エキスパート字形」「JIS78字形」「JIS83字形」などといった感じで4〜5種類の異体字が存在するものはザラです。
電子書籍化に伴う問題
問題は、この印刷物で用いられている字形の中に、電子書籍でそのまま表現できない字形が多く含まれていることです(外字画像を使うという選択肢はとりあえず除外します)。字形の違いに対して別のユニコード符号が与えられているものは問題ありませんが、同一のユニコード符号位置に対してInDesign/Illustratorなどの対応アプリケーションの中から呼び出して切り替えることを前提として2種類以上のグリフ字形が割り当てられているパターンが存在するため、「電子書籍にしたら人名漢字が基本字形になってしまった」というような問題がおそらく起こってきます。
こういった字形に絡む問題はとても根が深く、電子書籍以前から書籍系印刷会社を悩ませてきた頭痛の種です。JIS規格の改訂がかかるたびに字形の変化を目を皿のようにしてチェックし、対応に血道をあげてきたのはおそらく全国の書籍系印刷会社全てに共通する歴史と思います。
比較的最近の一例をあげますと、「葛」の字のJIS改訂に伴う字形変化の例などが有名です。JIS2000からJIS2004への改訂の際に標準字形が入れ替わった※1ため、全国の印刷会社の現場が悲鳴をあげました。例えばこの「葛」の文字も、ユニコード番号「845B」に旧JIS/新JIS双方の字形が収録されているパターンに該当するため、JIS2000準拠のフォントで組版された「葛」の字を含んだ印刷データをそのまま電子書籍化し、JIS2004準拠のフォントで文字を表示した場合、紙印刷物と異なった字形で表示されてしまいます。どうしても紙印刷物と同一の字形で表示したければ外字イメージで対応するしかありません。こういった状況を改善するためにUNICODE IVSという規格が現在動き始めてはいますが、これも順当に普及したとしても、現場で実際に使えるようになるのはかなり先の話になりそうです※2。
おそらくきちんと事前に出版社サイドに説明を行っておけば本文中の字形変化は許容していただけると思われますが、人名・地名といった固有名詞に関してはそうもいかない状況が出てくるかも知れません。これはもちろん「葛」1文字だけの問題ではなく、JIS2000→JIS2004の例示字形の変化だけでも168文字を数えます。過去の印刷データにはそれ以前のJIS規格に沿ったフォントを用いて組版されたものも当然多数ありますから、「結局紙原本と照合して校正した方が早い」という状況になるのではないかと思われます。このあたりはコスト的にとても頭の痛いところです。
また、OpenTypeフォントが普及する以前は、こうした字形のバリエーションへの対応は「外字フォント」を用いていたわけで、こちらはさらに根が深いのですが……いささかキリがありませんので、外字フォントを多用した古い印刷データの電子書籍化については、いずれ機会を見てあらためて書こうと考えております。
※1 参考:http://pc.nikkeibp.co.jp/article/NPC/20070105/258134/
※2 IVS技術促進協議会:http://ivstpc.jp/default.htm
(2012.3.30)
タグ: Adobe1-6, Unicode IVS, 異体字, 電子書籍