‘未分類’ カテゴリーのアーカイブ

印刷データ→電子書籍で外字化が必要な文字のまとめ

2012/05/10

 以前のエントリーでDTPデータ内で使われているOpentypeグリフ字形(Adobe1-6)の一部が、電子書籍では外字画像にしないと表現できない問題について書かせていただきました。出版デジタル機構(pubridge)もいよいよ動き始め、実際に電子書籍を作るための環境づくりに入っている方も多いかと思いますので、印刷用DTPデータ→電子書籍で字形が変わってしまう文字についての現時点でのまとめをあらためて掲載しておきたく思います。電子書籍制作環境づくりのお役に立てていただければ幸いです。なお、検証に使用した環境はMac OS 10.7/InDesign CS5です。InDesign以外のアプリケーションでもAdobe1-6グリフ字形を呼び出せるインターフェースを持ったものであれば同様の字形変化が起きるものと思われます。

確実に外字化が必要になると思われる文字

CID/GID番号のみしか割り当てられていない文字

CID/GIDのみの文字(一部)

CID/GIDのみの文字(一部)

 UNICODE/Shift_JISの双方に文字コードの割り当てがなく、InDesignなど対応アプリケーション内部からのみ呼び出すことができる文字です。囲み数字や丸数字などを中心に、ざっと数えた限りでは約700文字あるようです。これはそもそもUNICODEにもコード割り当てがない文字のため、確実に外字にする必要があります。InDesign内でこれらの文字を選択し、テキストエディタ等にコピー&ペーストすると「1A」という文字に化けます。

合字

任意の合字(一部)

任意の合字(一部)

 複数の文字コードで構成された文字をInDesign等の対応アプリ内でOpenTypeの機能を呼び出して「合字」として表示している文字です。InDesign字形パレットの分類では、「任意の合字(dlig)」「分数(afrc)」「欧文合字(liga)」などがこれにあたります。InDesign内でこれらの文字を選択し、テキストエディタ等にコピー&ペーストすると、内包している複数の文字に展開されて表示されます。

現時点では外字化した方が無難と思われる文字

サロゲートペア領域の文字

サロゲートペア領域の文字(一部)

サロゲートペア領域の文字(一部)

 InDesignの字形パレットの表示でUnicodeのコード番号の表示が「2xxxx」と、先頭に2の付いた5桁になっている文字群です。調べた限りでは303文字あります(参照)。ATOKの文字パレットでは、「CJK統合漢字拡張B」「CJK互換漢字補助」となっています。内部的に2つの文字コードの組み合わせで1つの字形を表示しており(サロゲートペア)、多くのリーディングシステムでは問題なく表示されますが、未対応のリーディングシステムが存在するため現時点では外字化した方が無難と思われます。JIS第3水準・JIS第4水準の文字の他、JIS割り当てのない文字も多数含まれています。使用頻度の高い文字はほとんどありませんが、U+20B9Fの「叱」(印刷標準字体)や、U+20BB7の「吉」(つちよし)などは問題になるかもしれません。全てUnicodeのみに割り当てがある文字のため、ドットブック/XMDFなどではいずれにせよ外字化が必要になりそうです。「EPUB日本語基準研究グループ」のホームページから参照できる、「EPUB3日本語ベーシック基準v1.0」の28ページにこれに関しての記述があります。

外字にするかどうか出版社サイドの判断が必要になる文字

同じ文字コードに2つ以上の字形バリエーションが割り当てられている文字

旧字体(一部)

旧字体(一部)

 旧字体/エキスパート字形/すべての異体字/修飾字形 など、ひとつの文字コードに複数の字形が割り当てられ、InDesignなど対応アプリケーション内部から字形パレット等で呼び出していた文字です。これらに関しては以前のエントリーで詳しく書きましたのでそちらを参照していただければ幸いです。人名・地名等の固有名詞以外では問題になりにくいとは思いますが、一般に字形差がとても微細なため、目で追って確認するのが難しい文字群です。

フォントのバージョンによって字形の変わる可能性がある文字

JIS90字形の文字(一部)

JIS90字形の文字(一部)

 以前のエントリーでも少し触れましたが、Pr6/Pr5などJIS90字形を基準としたフォントを用いて作られたDTPデータを元データとして電子書籍を制作する場合に、JIS規格の例示字形の変化の影響で字形の変わる可能性のある文字が168文字あります(フォントによって変化に差があるようです)。こちらにも字形差が微細なため、目で追って確認するのが難しいものが多く含まれます。一点しんにょう→二点しんにょうへの例示字形変更なども行われたため、人名漢字などで問題になるパターンが多くありそうです。JIS90→JIS2004の例示字形変化について、詳しくはこちらをご参照ください。

ドットブック/XMDFなどで外字化が必要になる可能性のある文字

Shift_JISに割り当てがなく、UNICODEのみで使える文字

Unicodeのみの文字例(色つきのもの)

Unicodeのみの文字例(色つきのもの)

 文字コードがShift_JISのドットブック、Unicodeが仕様上は使えるものの、おそらく既存のリーディングシステムの互換性の問題でShift_JISが使われることが多いと思われるXMDFで外字化が必要になりそうな文字群です(HTMLのように数値文字参照等で表記できるのでしょうか?手元の資料ではちょっとわかりませんでした)。XMDFビルダーではピンク色で表示され、XMDFビルダー内簡易ビューアではゲタ記号に化けて表示されるようです。EPUB3は文字コードがUnicode(UTF-8)のため、外字化しないでそのまま表示できます。

 このほか、「インライン画像として文字を作り、テキスト内に挿入していた文字」や、「外字の表示用に独自OpenTypeフォントを制作して表示していた文字」、「Biblosなどの市販外字フォントを利用していた文字」など、各ドキュメントごとに対応が必要になる場合も当然ありますが、これらは個々に対応するしかないと思われるため詳しくは書きません。以前フォントメーカーの営業の方にお聞きした話では、望ましい字形をDTPアプリケーションソフト内での操作なしで表示するために、フォントメーカーにカスタムフォントを特注して使用している印刷会社もあるとのことです。このような場合、その印刷会社以外の会社でDTPデータから電子書籍化する場合に、全ての文字を目で追って確認する必要が出てくるため校正費用がとても高くつくことが予想できます。可能であれば元DTPデータを制作した会社での電子書籍化が望まれるところです。

 また、出版デジタル機構および緊デジ関係者の方への要望として、特に上述の「基本字形に変化してしまう字形」および「フォントのバージョンによって字形の変わる文字」に関して、どのレベルまでを必ず外字にしなければならないのか(人名・地名のみ外字化するのか、初稿で外字化する文字を確認して指示していただけるのか、あるいは全て外字にするのか)、外字対応のガイドラインを策定し、出版社/制作会社の双方に告知していただきたく思います。

(2012.5.11)

紙で読みますか? 電子で読みますか?

2012/05/08

 電子書籍の話題も、最近は大分一般認知されてきた感があります。このごろは電車の中でタブレットを操作している人をちらほら見かけるようになりました。そのうちのどれだけの人が電子書籍を読んでいるのかは分かりませんが、ひところに比べれば電子書籍の読者も増えてきているのは間違いありません。しかし、紙の書籍の読者の数とでは、比較対象にもならないのが現状とも思います。
 正直、自らを省みても、こんなブログを書いていながらほとんどの本を紙で買って読んでいます。まだまだ電子書籍は「紙の書籍」を押しのけて買わせるだけの魅力は持っていないように思えるのです。このもやもやした 紙の書籍>電子書籍 な感じを払拭しない限り、電子書籍の大規模普及は難しいようにも思えます。個人的には全ての書籍が電子書籍に置き換わる必要はなく、状況に応じて紙の書籍と電子書籍を選んで読める環境があれば良いとは思っていますが、現状では「電子書籍は選択肢に入ってこない」事実をきちんと認識しておく必要はあるでしょう。

 そこで今回は、紙の書籍/電子書籍双方の持つ特性をざっと列挙し、電子書籍の普及にはどういったファクターが必要になるかを考えてみました。

1 携帯性/収納性 電子:○ 紙:×

 かさばらないことは、現状ですでに期待できる電子書籍の大きなメリットです。旅行などの際には荷物を減らす意味で電子書籍を選ぶインセンティブがすでに存在しているように思います。このアドバンテージをさらに推し進めるために必要となるのはまず、「ラインナップの拡充」、次に「異なる電子書店をまたいだタイトル検索システムの整備」でしょう。読みたい本が電子化されていなかったり、例え電子化されていてもどこで売られているのかすぐに見つけられなければ、多少の荷物になるのを覚悟して紙の書籍を選ぶことになります。
 ラインナップの拡充については各出版社・制作会社の対応が待たれるところですが、出版デジタル機構等の登場もあり、だいぶ出版社の参入障壁も低くなってきているように思いますので、これからの展開に期待したいところです。制作サイドとしても、次世代電子書籍規格の本命であるEPUB3に対応した制作ソフトもそれなりに出揃ってきた感がありますし、EPUB3対応のビューアもまだ縦書きなどの日本語表現に一部難があるものが多いとはいえ出てきてはいますので、快適に電子書籍が作れるようになるまでもう少しといったところです。
 異なる電子書店をまたいだタイトル検索システムについては、「OPDS※1」という規格が存在しています。これは電子書籍の書誌情報をオープンに流通させるためのもので、こうした仕組みがほとんどの電子書籍タイトルで使えるようになれば、「探しにくさ」の問題はほぼ解消されるものと思います。すでにO’Reilly Mediaや達人出版会など、対応をはじめている出版社も存在するようです。旅先などでスマートフォン等から気軽に読みたい本を探し出し、簡単に購入できるようになるまであと一歩といったところでしょうか。

 また、旅行などでなくても、普段の業務の中で大きく厚い紙の書籍を何冊も持ち運ぶ必要があった職業の人々にとって、iPad等で楽に資料を持ち運べることの意義は確実に存在します。こちらは特に専門書や教科書といった分野で求められる部分でしょう。Amazonがアメリカで展開している教科書の電子レンタルサービス「Kindle Textbook Rental※2」は、このあたりを狙ったものと思います。一般にアメリカの教科書は日本のそれより重くて厚いため、こうしたサービスにニーズがあると見込んだようです。状況の異なる日本の教科書市場にそのまま輸入できるモデルではないと思いますが、こうした動きが出ていること自体は注目して良いように思います。
 一般の読者にとっても、書棚で場所を取らないことには決して小さくはない意味があります。これは、「自炊」(個人で紙書籍をスキャニングし、電子化する行為)によって蔵書をデジタル化している人々が多数いることからも推測できるように思います。必ずしも個人レベルで敷居が低いとは言えない「自炊」をしてまで電子書籍を求めている人がそれなりの数存在することは、電子書籍の潜在ニーズがきちんと存在していることの何よりの証です。諸外国に比べて狭い家に暮らさざるを得ない日本人にとって、蔵書が居住スペースを圧迫しないことにはそれなり以上の意味があるということでしょう。ただ、すでに「自炊」という電子書籍の入手手段が存在している以上、商業販売する電子書籍にはそれを越える価値が求められることも忘れてはいけないようにも思います。

2 モノとしての充足感 電子:× 紙:○

 紙の書籍には問答無用のモノとしての充足感があります。お金を払って「モノ」を手に入れ、満足感を得る。私たちはこのプロセスに子供の頃から慣れ親しんでおり、お金を払っても実体のない電子データのみしか手元に残らなければどうしても不満は残ります。これはこれまで長期にわたってWebを通じて刷り込まれてきた「電子データ=無料」という図式による部分も大きいようにも思えるのですが、その呪縛を脱するために電子書籍という新しい形式が必要になる、との意見にはなかなか説得力があります。
 一方で、現状の電子書籍で充足感が得られにくい理由は「モノとしての歴史や作り込みがまだ全然足りていない」ことにも求められるように思えます。今販売されている紙の書籍が実は長い歴史の中でふるい分けられ、「読みやすい」とされた大きさの紙に、同じく「読みやすい」とされたフォントを用い、紙書籍の読みやすさを日々追求している組版のプロによって制作されてきたパッケージ製品であることを忘れるべきではありません。また、カバーの装丁などデザインに関しても、少しでも読者の目にとまりやすいように配色やタイトル文字のサイズ、紙質に至るまで考え抜かれて制作され、店頭に並べられているわけで、こうした要素が電子書籍化によって幾分かでも失われるのなら、入手の際の充足感に不満を感じても不思議ではありません。今日書店で目にする紙の書籍は、カバーひとつを取ってみても実に多様な印刷方式・デザインで制作されており、こうしたパッケージの魅力を電子書籍で完全に再現することは決して簡単ではありません。
 電子書籍でこの「充足感」を少しでも補足するためには、紙の書籍では得られない電子書籍ならではの要素をどう盛り込めるかがカギになってくるように思います。例えばカバーひとつを取ってみても、物理的に印刷するわけではない電子書籍では「多種類のカバーバリエーションを用意して読者に選んでもらう」といった展開が紙書籍より手軽にできますし、音声や動画といった紙書籍では盛り込みようのないファクターも電子書籍なら盛り込むことができます。

 個人的にはこの部分は、1冊の本の価格のどれだけを「紙で読むというカタチ」への思い入れに対して支払っているのかにも関連しているのではないかと考えています。小説などのカタチへの思い入れが強くなるジャンルではモノとしての充足感に強い不満を感じ、情報を買う意味合いの大きいビジネス書や専門書ではそこまでの不満は感じにくいのではないでしょうか。

3 検索性 電子:○ 紙:×

 検索システムとの相性の良さは、電子書籍の本来持っている大きなメリットです。これは、「電子辞書」がすでに単独製品として成功していることからも容易に理解できます。これは必要な部分のみを拾い読みすることの多い専門書では特に強く求められる部分で、必要な文献を短時間で的確に探し出せることは、紙の書籍よりも電子書籍を選ばせる大きなインセンティブになるものと思います。さらには1冊の内部にとどまらない、類書や参考文献へのリンクを含めた多彩なインデックスの仕組みが構築されれば、この分野での電子書籍の広い普及に繋がっていくでしょう。書籍内部の索引は現状のEPUBではまだ公式の仕様が策定されていない分野で、現在議論が進行中です。統一仕様であることが書籍をまたいだ索引検索の条件になってくるようにも思いますので、正式な仕様策定を待ちたいところです。
 専門書分野と切っても切れない深いつながりを持つ図書館サイドのプロジェクトとしては、国立国会図書館の「国立国会図書館サーチ※3」というデータベース横断検索サービスがすでに稼働しはじめており、紙書籍を含めて学術論文集や地方図書館の蔵書情報などが検索できるようになってきています。また、図書館と個別契約を結び、蔵書をスキャンしてデジタル化しようとしたGoogleのプロジェクト「Google Book Search Library Project」も、巨大なデジタルライブラリの構築を目指すという意味で最終的には同じ方向性を目指していると見られます。ただ、「Google Book Search」に対して今アメリカで巻き起こっている著者/出版社を巻き込んだ大規模な訴訟に見られるように、こうした「検索の利便性」は「著作権」とぶつかる部分があり、どこかで収益モデルの再調整が必要になってきます。
 一旦はGoogle側が引いたようにも見えたGoogle Book Searchの和解問題は今年に入って再燃※4しており、予断を許さない状況です。これは決して「対岸の火事」ではないため、しばらくは注視しておく必要がありそうです。

4 保存性・独立性 電子:× 紙:○

 紙の書籍は独立したパッケージメディアですので、例え子供時代に買ったものであっても、紙が傷んでいなければ十分に読むことができます。一方で電子書籍は基本的には端末機に依存する消費型コンテンツであり、その「賞味期限」は長いとは言えません。また、友人に貸したり※5、古書店に売ったりするような、紙の書籍なら当たり前にできる行為も基本的にできません。O’Reillyの技術書など、一部、DRM(コピーガード)を適用せずに販売している電子書籍※6などでは友人に渡すことは可能ですが、販売形態として一般的ではありません。また、例えDRMフリーのコンテンツであっても、EPUB3のようなフォーマット規格自体の「賞味期限」もかなり短いことが予測できるため(ここ10年でどれだけのデジタル規格が現れては消えていったか考えてみてください)、やはり紙の書籍と同等の「賞味期限」は保ち得ません。これを考えると、電子書籍の長期的な価値は紙の書籍には及びません
 これを多少でも緩和するためのひとつの回答が、AmazonのKindleや紀伊國屋書店のKinoppyといったようなサービスでの「クラウド上にある電子データへの自由なアクセス権を売る」というモデルです。データはユーザーIDに紐付けされており、ユーザーは好きなデバイスからそれを読むことができます。これであれば少なくとも端末機が壊れたら読めなくなるという短期的なリスクの問題は解決できます。高価な専門書等を電子書籍で販売するには、当分はこの考え方が必須になるように思います。ただ、販売会社が「業務撤退」を選んだ場合、これまで読めていた本が一気に読めなくなることも考えられます。このあたりの問題に関しては、こちらのエントリーが参考になります。
 もうひとつの回答は、「消費型コンテンツ」であることを前提に紙の書籍よりも安く売ることですが、これをしてしまうと、結果的に紙の書籍の価格も下げざるを得なくなるのではないかと思われるため、出版社が現時点で躊躇せざるを得ないのは理解できます。
 個人的にはここの問題は「紙の書籍と少しでも違った商品として売る」ことでしか解決できないのではないかと思っています。「短編集を解体して一篇ずつ売る」、「ビジネス書に多数の動画コンテンツを内包して売る」といったような展開です。同じ商品が紙の書籍と電子書籍で売られていれば当然比較されますが、少しでも違う商品であればそもそも比較の対象になりにくいものと思います。
 一部の専門書系出版社が「情報提供サービス」への方向性を模索しているのも、このあたりの問題への回答のひとつでしょう。

5 表現力 電子:○ 紙:×

 映像や音声との融合といったリッチコンテンツへの発展性、リンクなどを通じた外部のコンテンツとのシームレスな連携は、紙の書籍にはない電子書籍ならではの大きなメリットです。
 ここに求められるものはどういったタイプの書籍なのかによって大きく違ってきますし、アイデア次第で売れる売れないが大きく違ってきそうです。また、紙の書籍と比較して同程度の価格を維持するためにも、この部分がカギを握るでしょう。
 まず、小説やビジネス書などの文字中心の読み物では文字の拡大縮小音声読み上げといったユニバーサルアクセス的な部分の拡充を期待します。このうち、文字の拡大はリフロー型書籍ではすでに可能ですが、ビューア側が実装するべき最大文字サイズがどの程度のポイント数なのかなどについては、まだ一般的な回答が出ていないように思います。また、音声読み上げの本格普及はこれからの課題で、これが当たり前になれば視覚障害者や老眼等で活字を追うのが辛くなってきた層へのアプローチ材料になるだけでなく、忙しいビジネスマンが電車などの移動中にオーディオブック的に「聞く」といった展開も考えられるため、紙の書籍と同程度の価格でも電子書籍を選ぶインセンティブになり得るのではないでしょうか。
 EPUB3は、「DAISY」という視覚障害者などに向けた音声読み上げ規格を取り込んで成立していますので、音声読み上げはソフトウェアの対応状況さえ整えば比較的早期に実装できる機能であるように思います。今後の展開に期待したいところです。

 さらに、前述したようにコンテンツに動画や音声を埋め込めることは、紙の書籍では考えられなかった表現の可能性を生みます。例えば動きの説明に分解写真ではなく動画を使えば、教科書等でとてもわかりやすい説明ができそうなことは簡単に理解できますし、ニュース的なコンテンツに「ライブ感」を与えるために音声を埋め込むといった手法も有効でしょう。また、外部サイトと電子書籍を連携させることで、さまざまな相乗効果を生むことも期待できそうです。
 コミックなどの分野ではニコニコ静画の試みのように「ソーシャルアクセス」などと関連させて、新しい面白さを創出できるかどうかがひとつのカギになるのかもしれません。

 ちょっとまとめてみます。まず、1携帯性/収納性および3検索性は電子書籍が紙の書籍に対して持っている大きなアドバンテージですが、一方で2モノとしての充足感は電子書籍では得られにくく、さらに4で述べたように賞味期限が短く、友人に貸すことや読み終わった後に古書店に売ることもできない電子書籍は紙の書籍と比較して同一価格では売りにくい面がある。このギャップを埋めるためには5の表現力で述べたように「紙の書籍ではできなかった」付加価値がカギを握りそうであり、場合によっては「全く違った商品」として供給する選択肢もある、といったようなところです。

※1 参考 OPDS:http://d.hatena.ne.jp/tatsu-zine/20110118/1295329201
※2 参考 Kindle Textbook Rental:http://www.itmedia.co.jp/news/articles/1107/19/news022.html
※3 国立国会図書館サーチ:http://iss.ndl.go.jp/
※4 参考 Google Book Search裁判について:http://ebook.itmedia.co.jp/ebook/articles/1112/14/news076.html
※5 参考 Lending Kindle Books:http://www.amazon.com/gp/help/customer/display.html?nodeId=200549320
※6 参考 DRMフリーの電子書籍:http://www.oreilly.co.jp/editors/archives/2011/05/ann-ebook-drm-free.html

(2012.5.08)

「文書構造」と「視覚表現」を分離する

2012/04/25

 これから書くことは、すでにあちこちで語られていますし、おそらくWebサイドから電子書籍に行こうとされている方からしてみれば「何をいまさら」感もあるかと思うのですが(そういう方はどうぞ読み飛ばしてください)、これまでDTPソフトしか触ったことのない印刷側の人間からしてみれば「最初の壁」になる可能性のある部分ですし、実際自分もしばらく乗り越えられなかった経験もありますので、あえて重複を恐れずに書いておきたく思います。これはおそらく、今後の電子・紙書籍双方の制作に関わってくる重要な考え方のひとつです。

「文書構造」と「視覚表現」の違いとは

「見出し」と「本文」のみの文書の例

「見出し」と「本文」のみの文書の例

 例えば、InDesignのドキュメントで「見出し」に続いて「本文」が書かれており、それぞれに段落スタイルが設定されているとても単純な文書モデルを考えてみてください。この場合、「文書構造」に当たるのは「見出し」および「本文」です。一方で、「M-中ゴシックBBB12ポイント」および「リュウミンL-KL9ポイント」などは「視覚表現」に相当します。行揃え方向、行頭インデントの有無、文字カラーなども同じく視覚表現です。
 従来のDTP制作フローでは、この2つの概念は、特に意識することなく混在していました。InDesign内の段落スタイルシートの名称が「見出し」であろうが「M-中ゴシックBBB12ポイント」であろうが、最終的な印刷物の見た目は何ら変わりませんし、特定の判型・文字サイズの印刷物が最終到達点である限りにおいて、それで特に問題はありませんでした。しかし、電子書籍を制作するにあたっては、おそらく真っ先にこの部分の意識改革が求められてきます。
 電子書籍で用いられるXML構造化文書のタグ名および属性名は、可能な限り「視覚表現」ではなく「文書構造」を表すものでなくてはなりません。すなわち、「M-中ゴシックBBB12ポイント」を表すタグ/属性名ではなく、「見出し」を表すタグ/属性名で命名されなくてはならないのです。では、「視覚表現」はどうするのか。これは、別に用意したCSSやXSLといった「スタイルシート」に記述します。

読まれる環境は1パターンではない

環境ごとに最適化された視覚表現を実現

 なぜこうした考え方が必要になってくるのでしょうか。メリットは多々ありますが、わかりやすいところで説明しますと、同じ文書をタブレットと携帯電話で読むことを考えてみていただきたく思います。この2つのデバイスでは、当然ながら可能な視覚表現の幅に差があります。特定のタブレットの画面サイズに最適化した形でフォントサイズを決めてしまうと、携帯電話ではとても読みにくいことになってしまうかも知れません。また、タブレットで選べる書体が携帯電話で選べるとは限りません。タブレットでなら縦書きで読めても、携帯電話では不可能かも知れません。こうした視覚表現の幅の差の問題は、メーカーの違うタブレット同士でも起こりえますし、それどころか同じタブレット内で異なるアプリケーションで閲覧した場合でも当然起きてくる問題です。
 そこで、文書には「文書構造」のみを記述しておき、それぞれの環境ごとに用意したスタイルシートと組み合わせることで最適な「視覚表現」を得る、といった考え方が出てくるわけです。こうした考え方は、異なるPC・ブラウザで同一の文書を閲覧することが前提とされるWebではすでに馴染み深いものです。HTML4で構造と表現の混在が問題とされ、後継規格のXHTMLおよび現在主流となりつつあるHTML5では「視覚表現はCSSで記述すること」が強く推奨されている現状があります。HTML5とCSSを規格として取り込んでいるEPUB3でも、少なくともプロが作る電子書籍では当然こうした考え方をきちんと意識して作ることが求められてくるでしょう。
 もちろんメリットはそれだけではありません。きちんと構造化され、表現と切り離された簡潔な文書は、例えば「電子書店で書籍のタイトル名と見出し名だけをファイルから自動取得して表示する」といったようなことを容易にしますし、「注」をそれ専用の構造を表すタグで記述しておけば、ビューア側の実装と組み合わせてポップアップ表示するといったような表現も可能になってくるでしょう。また、将来的に次世代の電子書籍フォーマットに移行する際に、文書の流用を容易にすることにも繋がります。

既存電子書籍フォーマットの弱点

 こうした視点で見てくると、既存電子書籍フォーマットの弱点がちらちらと見えてきます。以下は既存電子書籍フォーマットの代表的な存在のひとつである「XMDF」を用いて、上記モデルと同様のものを仮制作してみた例ですが、ご覧の通り完全に文書構造と視覚表現が混在してしまっています。

<p top_line_indent="0em" top_line_indent_bracket="0em" align="justified_left" bracket="「〈《【『〔([{"><font size="110%" bold="yes" name="MS Pゴシック">見出しタイトル</font></p>
<p top_line_indent="1em" top_line_indent_bracket="0em" align="justified_left" bracket="「〈《【『〔([{">本文テキスト入る 本文テキスト入る 本文テキスト入る 本文テキスト入る 本文テキスト入る 本文テキスト入る</p>

 XMDFでも「文章構造スタイル(structureタグ)」および「文字スタイル(fontタグ)」を用いることで文書構造と視覚表現が分離した文書を作成することは可能ですが、これもHTMLで言えば全て<div>タグおよび<span>タグを用いてclass名で制御している状態に当たるため、少々不完全と言わざるを得ません。「見出し」だけを取り出したい、といったニーズに応えられる仕様ではないと思います。また、なにより文書構造に視覚表現が混在した表記を「許す」仕様になっていること自体が次世代を睨んだ構造化文書としては問題があるのではないでしょうか。

 また、いわゆる「ワープロ感覚で誰でも簡単に作れる」電子書籍作成サービスがプロ向けに使えない理由もここにあります。以下はある簡易EPUB作成ソフトの自動生成タグですが、これが可読性に欠け、後から変換する際に問題となりそうなことは一読してわかることと思います。

<body>
<div><span class="fontA13AAC48-F76C-47E3-A783-C53D961CCFEF">本文本文本文本文</span></div>
<div> </div>
<div><span class="fontF2CF1A56-85BF-4B0F-B347-F11EA7E06BAF">本文本文本文本文本文</span></div>
<div> </div>
<div><span class="fontD86BC4AF-3AED-4D5B-8398-14DEDC83DA22"> </span><ruby class="ruby7BA61523-3FDE-42E9-8944-607C7ED6B2BD"><span class="fontF8A0DA5C-A523-4E98-89C9-554A66CA705C">本</span><rt class="rtA27B8F1C-73D1-46C5-8A77-2D3F5873B756">ほん</rt></ruby><ruby class="rubyAAA4353C-CA4C-4467-AF72-1952640EDDE1"><span class="fontDADF4999-C565-4C66-A938-541DA782B8BE">ぶん</span><rt class="rt771A818A-AC30-4230-BC7D-B2ECC9062AED">ぶん</rt></ruby><span class="fontFA8A96AC-F495-4DE0-9968-5DF6C51DBA15">本文本文本文本文本文</span></div>
</body>

具体的には何を意識すれば良いのか

 最後に、EPUB3(HTML5)の文書を作成する際に、作成者側が具体的にどういった点を意識する必要があるのかについて一例をあげておきたく思います。

 まず、<h1>〜<h6>(見出し)、<p>(本文)、<blockquote>(引用文)など、あらかじめ意味づけされたタグが用意されているものに関してはできるだけそちらを使うべきでしょう。そういったタグがなく、独自に属性値を定義しなくてはならない場合、例えば本文の1行だけをゴシック体・赤文字にして強調したい場合には、

<p style="font-family:'MS Pゴシック';color:#FF0000;">本文テキスト本文テキスト本文テキスト</p>

といった形で文書内にフォント名・文字色を直書きするような記述は避けるべきと思います。「MS Pゴシック」及び文字色は「視覚表現」に相当するからで、このフォント・文字色が使えない環境では適切に表示できないことになります。また、

<p class="mspgothic">本文テキスト本文テキスト本文テキスト</p>

と記述するようなパターンも(先の例よりはマシですが)避けるべきでしょう。「MS Pゴシック」が使えない環境で混乱の元となります。

<p class="highlight">本文テキスト本文テキスト本文テキスト</p>

といったような「文書構造」に近い属性名でXHTMLのclass定義をし、CSSには

p highlight {font-family:'MS Pゴシック';color:#FF0000; }

と記述するようなパターンを選ぶのが適切かと思います(実際には p highlight {font-family:'ヒラギノ角ゴ Pro W3','Hiragino Kaku Gothic Pro','メイリオ',Meiryo,'MS Pゴシック',sans-serif;} といったようにフォント名を連記することになるでしょう)。

 また、校正時のプリント出力で文字揃え等が多少狂っていたとしても、それを手直しするために「文書構造」を変えることには慎重になるべきです。実際に電子書籍を読む読者が、必ずしも作成環境と同じ表示特性のデバイスで読むわけではないことを心に留めておくべきと思います。

 なお、文章物のEPUB3文書で具体的にどういった記述をするのが適切かについては、「epubcafé」で参照できる「JBasicマークアップ指針」や、「EPUB日本語基準研究グループ」の「EPUB3日本語ベーシック基準」などが参考になります。

(2012.4.25)

プロフィール
Jun Tajima

こちらにて、電子書籍&Web制作を担当しています。
このブログは、EPUB3をはじめとした電子書籍制作担当オペレータからの、「電子書籍の制作時にたとえばこんな問題が出てきていますよ」的な「現地レポート」です。少しでも早い段階で快適な電子書籍閲覧・制作環境が整うことを願って、現場からの声を発信していこうと目論んでおります。

当ブログ内の記事・資料は、私の所属しております組織の許諾を得て掲載していますが、内容は私個人の見解に基づくものであり、所属する組織の見解を代表するものではありません。また、本ブログの情報・ツールを利用したことにより、直接的あるいは間接的に損害や債務が発生した場合でも、私および私の所属する組織は一切の責任を負いかねます。