‘未分類’ カテゴリーのアーカイブ

先頭文字/行/正規表現スタイルの処理を考える

2012/07/09

正規表現スタイル

正規表現スタイル

 InDesignには、「段落スタイル」設定内の「ドロップキャップと先頭文字スタイル」から設定できる「先頭文字スタイル」および「行スタイル」、同じく「段落スタイル」設定内で使用できる「正規表現スタイル」といった便利な機能があります。これらは全て、段落スタイルの適用されている行内の文字のうち、設定した特定の条件に適合する文字に自動的に指定した文字スタイルを適用する機能です。例えば「先頭文字スタイル」であれば、文中の数字だけを自動的に斜体にする、「行スタイル」であれば1行目だけを太字にするといったような、通常長時間の反復処理が必要になる作業を段落スタイルの設定のみで処理できます。「正規表現スタイル」はさらに自由度が高く、正規表現を用いて適合する文字列を指定できます。例えば「A」「B」「C」だけを太字にする、いったような処理も簡単に行うことができます。ここでは正規表現そのものについては触れませんのでこちらをご参照ください。
 これら特殊スタイルはInDesign内では「段落スタイル」のみが適用されており、文字スタイルは「なし」になっているように見えるため、電子書籍制作時にきちんとした処理がされるのかどうかちょっと気になるところです。

 そこで、実際の電子書籍制作時の流れの中で、これら特殊スタイル類がどのように処理されるのか試してみました。

「スタイルをタグにマップ」で正常にタグが付加されないパターンがある

行スタイルのタグに問題が出る

行スタイルのタグに問題が出る

 最初に、私がこちらのブログ内で紹介しているあらかじめ各文字に段落スタイル・文字スタイルを適用しておき、「タグ」パレットの「スタイルをタグにマップ」でタグを付加してXML書き出しを行う方法をテストしました。

 まずはシンプルに「先頭文字スタイル」「行スタイル」「正規表現スタイル」を単体で適用してみます。「先頭文字スタイル」および「正規表現スタイル」についてはきちんとタグが付加されているようですが、「行スタイル」に関しては、最後の一文字に正常なタグ付加がされていないようです。

重ねがけで正常にタグが付加されない

重ねがけで正常にタグが付加されない

 次にこれら特殊スタイル類の重ねがけを試してみます。「行スタイル」を含んだ段落のタグが全て1文字ずつずれて適用されている他、「先頭文字スタイル」と「正規表現スタイル」との重ねがけに関しても、「先頭文字スタイル」のみがタグ付加され、「正規表現スタイル」の部分にはタグが付加されていません。これではちょっと危なくてタグの自動付加はできません
 なお、「行スタイル」の最後の1文字にタグが付加されないのは、バグの類ではないかと思われます。

IDMLには文字スタイルが書き出されない

XMDFビルダーに文字スタイルが取り込まれない

文字スタイルが取り込まれない

 次にIDML(InDesign Markup Language)形式でデータを書き出し、XMDFビルダーに取り込んでみます。これは緊デジのXMDF制作ガイドラインで想定されている制作方法です。

 どうやら、特殊文字スタイル類は完全に無視され、段落スタイルのみが取り込まれるようです。つまり、XMDFビルダー内で全ての文字スタイルを再割り当てすることになってしまいます。これはちょっと作業量的に避けたい流れです。

文字カラーを変更し、検索置換パレットを使用して文字スタイルを再適用する

 さて、結局どちらにしても文字スタイルの再適用は避けられそうにありませんので、出来るだけ楽をしてスタイル再適用の作業を行いたいところです。とりあえず以下のようなワークフローを考案してみました。なお、このワークフローを使用したことに伴うトラブルに関して、私として一切の責任は負いかねますので、こちらの作業を行う前には必ず元データをバックアップしておき、コピーしたデータで作業を行うことをおすすめします。

1 文字スタイルの「文字カラー」を変更する

文字スタイルの「文字カラー」を変更する

文字スタイルの「文字カラー」を変更する

 まず、先頭文字/先頭行/正規表現スタイル内で使用されている文字スタイルの「文字カラー」を変更します。多色刷りなどのデータの場合には、登録済みのスウォッチカラーがドキュメント内のいずれかの箇所に使われている可能性を考慮し、トラブルを避けるためにもスウォッチを新規作成して割り当てることをおすすめします。

2 先頭行スタイル内の先頭文字/正規表現スタイルを手動で処理

先頭行スタイル内の先頭文字/正規表現スタイルを手動で処理

先頭文字/正規表現スタイルを手動処理

 先頭行スタイルと先頭文字/正規表現スタイルが混在している場合は、まず先頭行スタイル内の先頭文字/正規表現スタイルに手動で通常の文字スタイルを再適用します。これは、3の検索置換処理で先頭行スタイル内の先頭文字/正規表現スタイルが検索にヒットしないためです。

3 パラメータを設定し、検索置換を実行

検索置換パラメータを設定

検索置換パラメータを設定

 検索置換パレットの「検索形式」に1で設定したカラーを、「置換形式」に1で文字カラーを変更した文字スタイルをそれぞれ指定し、ドキュメント全体に対して置換を実行します。全ての文字スタイルに関して同様の置換を実行します。

 これでとりあえず文字スタイルの再適用はできます。「行スタイル」内の先頭文字/正規表現スタイルを手動処理しなければならない問題はありますが、幸い「行スタイル」はそれほど頻繁に使用されているわけではないように思えますので、実作業的にそこまでの問題はないかと思います。
 また、「タグ」パレットの「スタイルをタグにマップ」でタグを付加する際のトラブルを防ぐため、文字スタイルの再適用を行った後に「スタイルをタグにマップ」を使用する場合には、全ての特殊スタイル類をあらかじめ削除しておいた方が良いでしょう。

 なお、「正規表現スタイル」の通常文字スタイルへの置換に関しましては、市川せうぞーさんが「正規表現スタイル由来の文字スタイルをリアル文字スタイルとして適用する」というエントリーで自動処理スクリプトを発表されておられますので、そちらを利用されるのも良いかと思います。

(2012.7.9)

市川せうぞーさんより、「正規表現スタイル」2つ以上を重ねがけしている場合でも「スタイルをタグにマップ」で正常にタグが付加されないとの情報をいただきました。例え「正規表現スタイル」だけしか使われていない場合でも、文字スタイルの再適用が必須になると考えておいた方がよさそうです。

(2012.7.9追記)

国際電子出版EXPO行ってきました

2012/07/06

 ビッグサイトで開催中の第16回国際電子出版EXPOに行ってきましたので、今回はプチレポートです。私が行った水曜の午前中には国際講演が行われ、それももちろん聞いてきたのですが、すでに新聞やニュースで大きく取り上げられており、個人ブログで改めて書いても仕方がありませんので、会場で見てきて個人的に面白いと感じた製品をいくつかレポートしてみたいと思います。

FUJIFILM 「GT-Layout」

 FUJIFILMさんがコミックの電子化等の製品開発にかなり前から取り組んでおり、画像処理の自動化まわりなどで精力的に製品発表をされていたのは知っていたのですが、私の所属している会社のような文章物の制作をメイン業務にしている会社にとってはこれまで今一つ直接的なニーズのありそうな製品はありませんでした。
 ただ、今回展示されていた「GT-Layout」という技術は、スキャンして1ページまるごと1画像になっている文書を、自動処理で1文字ずつバラバラの外字にして並べ替えることで疑似的にリフローを実現するというもので、完全に「こっちの領域」の技術です。発想にちょっと目から鱗が落ちました。技術的にはOCR技術を自動テキスト化処理ではなく、画像内の文字位置の特定に使っているとのこと。力技ですが確かにそれなら文字化けはなさそうです。

 この技術は今のところまだクラウドサービス「Dropbox」内に放り込んだ画像ファイルや各種オフィス文書を、Androidスマートフォン上で快適に読むためのアプリ「GT-Document Lite for Dropbox」内でのみ使用できるようなのですが、もしこれがEPUB制作アプリ等と連携して使えるようになれば、例えば緊デジで制作されたフィックス型の電子書籍のうちかなりのものを、比較的簡単に疑似リフロー型にコンバートすることが可能になってきます。

 また、印刷会社が保有している製版フィルム等のスキャン画像から、全文校正の手間なしにリフロー型電子書籍を制作することも視野に入ってきます。私の所属している会社に保存してある製版フィルムには、活版印刷の時代に組版されたものをフィルム化して保存してあるものなども多数含まれるのですが、これらはそもそもテキストデータが存在しないため、リフロー型電子書籍にするためには、本来全文の再テキスト入力・校正が必要になってきます。これがコスト面の壁になって電子書籍化できないコンテンツはおそらく多数あります。「GT-Layout」の技術によってこれらのフィルム類も手軽に疑似リフロー型電子書籍にコンバートでき、スマートフォン等で快適に読めるようになるとすれば、「長期休眠コンテンツの価値再発見」にもつながってくる福音になり得ます。

「GT-Document Lite for Dropbox」画面

「GT-Document Lite for Dropbox」画面

 ちょっと現時点でどこまでのことが可能なのか気になったので、軽くテストをしてみました。新書横組みを想定した文書をInDesignで制作し、PDFで書き出したものをDropboxに放り込んで「GT-Document Lite for Dropbox」で開いてみます。なるほど、ちゃんとリフローしているようです。アルファベットが単語の途中で切れてしまっていることや字詰めなど気になる部分はあるものの、バックグラウンドでやっていることを考えるとすでにかなり完成度が高いと言えそうです。縦書き単行本のスキャン画像はエラーが出てリフローできなかったのですが、これはちょっと処理する文字量が多すぎたのかも知れません。「GT-Document Lite for Dropbox」自体はオフィス文書のビューアであることを考えれば致し方ないところです。電子出版EXPO会場では縦書きのデモサンプルがすでにあったことを付記しておきます。FUJIFILMの方にお聞きした話ですとまだルビまわりの処理などが完全ではないとのことだったのですが、正直かなり有望な技術だと思えるので、是非今後に期待したいところです。なんでも当面は「虫眼鏡のようなツール」としてユーザーの自己責任で使ってもらう方向を考えているとのことです。個人的には早くiPhone版が見たいです(笑)。

モリサワ 「MCBook」

 モリサワさんの電子書籍制作ソリューション「MCBook」は私も使ったことがあり、いくつかデモサンプルを作成しているのですが、もともと成果物の完成度という点ではピカイチだと感じていました。組版エンジンの柔軟さからくる画像の回り込み処理、キーワードをタップすることで呼び出せる注釈ウィンドウ、それになんといってもモリサワフォントの綺麗さが際立っていました。ただ、当初iOS用のアプリ型としてスタートした経緯からくるAppleとの契約の煩雑さや、独自タグ形式だったことが災いして、今一つメジャーにならなかった感があります。正直「このビューアでEPUB3見られたらなあ」とは思っていました。

 今回は、前バージョンで対応していたMCBookからのEPUB3書き出しに加え、ショップ向けソリューション「MCBook EPUB ビューアライブラリ」と連携することで書き出したEPUB3をストアで取り扱えるようになったことで、ほぼ「EPUB3対応」を謳える形になったようです。フォントやDRM対応を組み込み、専用ビューアを提供することで組版レイアウトの品質を保証する統合型サービスとして魅力的な存在になってきたと言えます。

 ただし、MCBookそのものからはDRMを含まないEPUB3のデータを書き出せるものの、「MCBook EPUB ビューアライブラリ」で扱えるEPUB3に関してはDRM組み込みがセットになっているようです。そのため成果物のEPUB3ファイルそのものの後修正は基本的に不可能で、修正の際にMCBookの書き出しもとファイルが必要になります。数年後に修正指示が入った場合、手元にMCBookのファイルが残っていなければ修正不可能になってしまうわけで、EPUB3の魅力のひとつであるプロプライエタリなフォーマットに依存しないオープン性をスポイルしているとは言えそうです。ただ、そこは統合型サービスならではの品質の高さの保証とのトレードオフになるのかなとも思います。そのあたりを割り切って使う「売り切り型贅沢コンテンツ向き」といった位置づけになるのではないでしょうか。

ボイジャー 「BinB」

 電子書籍の老舗、ボイジャーさんが昨年12月にスタートさせたWebブラウザだけで利用できる電子書籍配信サービス「BinB」がだいぶブラッシュアップされてきていました。当初はいまいち速度的に遅くイライラ感があり、いまひとつ魅力が伝わりにくい状態だったのですが、WebフォントのダウンロードでWindows XPなどの旧環境でもかなり綺麗な文字で読めるようになっており、電子出版EXPO直前に家でチェックした時には「これなら十分読めるな」と感じました。正直無線環境の整った場所でiPad等で読む分にはもうアプリ型電子書籍と大差ないのではないかと思います。だいぶ「Web閲覧環境があってIDとパスワードを覚えていさえすればどこでも読める」というBinBサービスのメリットが感じられるようになってきたのではないでしょうか。あとはラインナップですが、本家BinBストアにリイド社のコミックが入った他、「Yahoo!ブックストア」BinBのエンジンが採用されたとのニュースもあり、どうやらコミック分野でかなりの存在感を持ってきそうです。

 もともとBinBの「Webブラウザを利用してクラウド上のコンテンツを閲覧させる」というモデルは、読者の手元にパッケージがダウンロードされないため重DRMに頼らなくても違法コンテンツの流通を抑制しやすい側面があり、コミックなどのライトコンテンツには合っているのではないかと思っていました。ここにきて予測が当たった形で、少し嬉しく思います。

 といったところです。1日だけでしたので、興味はあっても回りきれなかったブースがたくさんあります。土曜日にブックフェアには行く予定なのですが、国際電子出版EXPOは金曜日閉幕・・・。まあ楽天koboの実機が触れそうなので楽しみではあります。今回はとにかく全体としてかなりの熱気を感じました。これが電子書籍の普及にストレートに繋がることを心から祈りたいです。

(2012.7.6)

※当初MCBookからはDRM付きのEPUB3しか書き出せないといった記述をしてしまったのですが、MCBookそのものからはDRMの含まれていない汎用のEPUB3も出力できるとのことです。失礼いたしました。謹んで修正させていただきます。

(2012.7.6追記)

「代替字形」チェックボックスで要外字化文字を見分ける

2012/06/18

 以前のエントリーで、Unicodeにコード位置を与えられており、1文字で表現できる合字(U+2668「♨」など)をInDesign内で入力する際に方法が2通りあり、字形が全く同じであるために目視確認による校正作業ができない、といったことを書かせていただきました。「旧字体」「印刷標準字形」等に関しても同じ状況で、かなり困った状態だったのですが、InDesign環境設定の「代替字形」チェックボックスを使うことで、とりあえず合字などをどちらの方法で入力したものなのか見分けることはできそうですので、お知らせしておきたく思います。「すべての異体字」などで字形置換が行われている文字もこちらで見分けられそうです。ただし以下はあくまで一時しのぎの「対処療法」で、外字対策が必要な全ての文字が見分けられるわけではなく、使う上で十分な注意も必要になることをあらかじめご留意ください。

注意が必要だが、「代替字形」チェックボックスで置換字形のチェックが可能

InDesign環境設定「代替字形」チェックボックス

環境設定「代替字形」チェックボックス

 InDesignには環境設定メニューの「組版」タブ内に「代替字形」というチェックボックスがあります。本来の字形とは違う字形に置換して表示されている文字をInDesign内でハイライト表示するためのものです。このInDesign環境設定の「代替字形」チェックボックス自体ははるか以前からあり、確認した限りではCS2の時代から機能自体は存在していたようです。そんな機能があるなら以前のエントリーは何だったんだと言われそうなのですが、実はこの機能には重大な欠点があり、日本語組版で無条件に使用できる機能ではありませんでした。

句読点等までハイライトしてしまう

句読点等までハイライトしてしまう

 この「欠点」というのは「縦組み時の自動字形切り替え(vert)まで全てハイライト表示してしまう」というものです。これにより、句読点や括弧類、拗促音などまで全てがハイライト表示されてしまい、本来の対象文字以外が大量にピックアップされてしまいますので、縦組みで字形置換をチェックする目的ではまともに使えません(そして、印刷標準字形等の字形置換を使用している書籍は文芸書等に多く、そうした書籍は縦組みで制作されている場合が多いことは容易に想像できます)。

 ただ、今回は最終目的が「電子書籍にすること」ですので、縦組みで作成されたDTPデータであっても「組み方向を横組みに切り替える」ことでこの機能を有効に生かせるのではないかと思い、テストをしてみました。

横組み切り替え時の注意点

改行位置で合字が泣き別れ

改行位置で合字が泣き別れ

 組み方向切り替えには、注意しなければならない点がいくつかあるようです。まず、テキストボックスが「フレームグリッド」ではなく「テキストフレーム」になっている場合、改行位置に合字が来ていた場合に文字が泣き別れになってしまう可能性があるようです。テキストボックスが「フレームグリッド」になっている場合は、今回テストした限りではこの問題は出なかったのですが、データの状態次第では同様の問題が出てくる可能性はあります(ちょっとテストしきれません)。
 また、縦中横に設定されていた数字やアルファベット類、縦組みで表示することを前提として挿入されていたインライン画像類などのチェックにも影響が出そうです。

グリフ置換文字のみをハイライト

グリフ置換文字のみをハイライト

 こうした問題を考えると、「もとの縦組みドキュメントをコピーし、横組みに切り替えてあくまで代替文字のチェック用として使う」あたりが無難な利用法ではないかと思います。ドキュメントを2つ並べて横組みの文字のハイライト表示を参考に縦組みドキュメントを修正していくイメージです。

 テストしてみた限りでは、文字パレットの機能を用いて字形置換された合字や、字形パレットで字形置換された旧字体(つまり文字化けを起こすもの)のみがきちんとハイライトされますので、チェック目的に限定すれば十分役に立ちそうです。

字形パレットで合字を上書き

字形パレットで合字を上書き

 ちなみに例えば「温泉」で入力されて合字変換されている「♨」の親字を「♨」そのものに変換するには、字形パレットの表示メニューを「選択された文字の異体字を表示」にし、文章中でハイライト表示されている該当文字「♨」を選択して、字形パレット内に表示された字形「♨」をダブルクリックし、文字を上書きすればOKです。ただ、合字の場合、構成要素の一部分のみ(「温」のみなど)を引っかけて選択してしまうことが多々ありますので、慎重に構成要素全てを選択した上で文字を上書きする必要があります。

「代替文字」でチェックできない文字

 なお、このInDesignの「代替文字」チェックボックスでチェックできる、外字対応が必要になる可能性がある文字は「合字」「印刷標準字形」「すべての異体字」など、InDesign内の機能で字形切り替えが行われているものに限られます。「CID/GID番号のみしか割り当てられていない文字」「ビブロスフォントなどの外字フォントを用いて表示されている文字」「JIS規格の例示字形の変化の影響で字形の変わる可能性のある文字」などは、InDesign側で行われている字形切替ではないため、このチェックボックスではハイライト表示されませんので注意が必要です。「インラインで埋め込まれた外字画像」ももちろん同様です。こうした文字類は、別途チェックが必要ですのでご注意ください※1

※1 チェックした限りで「代替字形」でのハイライト表示対象は以下の通りです

合字:○(「♨」などUnicode1文字で入力できる文字のうち、文字パレットの「任意の合字」を用いて変換せずに入力された文字(=合字ではない)を除く)

旧字体・エキスパート字形(GlyphForm):○(字形置換が行われた文字のみハイライト)

すべての異体字(aalt):○ CID番号しか持たない文字:× 箇条書きリスト:×

スモールキャップス:× オールキャップス:○ 外字フォント:×

JIS例示字形の変化の影響で字形の変わる可能性のある文字:×

(2012.6.18)

プロフィール
Jun Tajima

こちらにて、電子書籍&Web制作を担当しています。
このブログは、EPUB3をはじめとした電子書籍制作担当オペレータからの、「電子書籍の制作時にたとえばこんな問題が出てきていますよ」的な「現地レポート」です。少しでも早い段階で快適な電子書籍閲覧・制作環境が整うことを願って、現場からの声を発信していこうと目論んでおります。

当ブログ内の記事・資料は、私の所属しております組織の許諾を得て掲載していますが、内容は私個人の見解に基づくものであり、所属する組織の見解を代表するものではありません。また、本ブログの情報・ツールを利用したことにより、直接的あるいは間接的に損害や債務が発生した場合でも、私および私の所属する組織は一切の責任を負いかねます。