電子出版時代のXML活用
さまざまな形が求められるデータ
出版不況が言われて久しいなか、iPad発売を機に日本でも電子書籍がブレイクする兆しを見せています。電子書籍が出版界でどこまでその存在を大きくするかはまだ分かりませんが、いずれにしてもこれまでのやり方で出版物を作り続けるのがいずれ厳しくなっていくだろうことだけははっきりしています。
これまでの出版は、出版社の編集者が著者とともに原稿を用意し、それを写植やDTPオペレーターが版の形に組み、印刷会社が印刷、それを書店で販売するという流れでした。つまり、コンテンツを用意する著者・出版社、コンテンツを入れる入れ物(メディア)を作るデザイナー・制作オペレーター、本という形で具現化する印刷会社・製本会社というように、本を作るための工程それぞれに作業を担当する人間がいて、彼らが協力して一冊の本を世の中に提供してきたわけです。
電子書籍になると、この工程が一気に流動化します。たとえば、本を作るという作業が実際の物を作ることから単なるデータを作ることに変わることで、編集者の役割が否応なく変化します。紙の本を作るには各工程の担当者との連携が必須だったため、編集者にはかれらを統括し、的確な指示を与えるという役割がありました。逆に言うと、企画や指示、管理さえきちんとしていれば、編集者自身に技術的な知識がなくても大丈夫だったということでもあります。
電子書籍の場合、データを作るだけなら担当者は一人で十分というケースが一般的になってくるかもしれません。あるいは逆に、さまざまな仕掛けを施した凝った雑誌のようなコンテンツを作るとなると、現在の制作環境では不十分であり、プログラマーに頼るというようなことも起きてくるでしょう。
要するに、同じ電子書籍でも、企画によって作り方がまったく違ってくるわけです。そうなると、コンテンツをどのように管理するかという点が重要になってきます。
現在、出版物の原稿は著者(ライター)がテキストデータとして入力するというのが一般的になっています。もちろん、原稿用紙に手で書いてくる著者がいなくなったわけではありませんが、いずれは手書き原稿も前世紀の遺物のような扱いになってしまうでしょう。
テキストデータを本にする場合、レイアウトソフトでさまざまな組版処理を施さなければなりません。具体的には、書体、文字サイズ、行送り、コラム幅(行長)、ルビなどといった属性の指定を、見出し、本文、脚注、キャプションといった要素ごとに適用するわけです。
プレーンなテキストの場合、各要素に対してそれぞれ個別に処理(指定)していかなければならず、スタイル機能を使うことで効率的になるとはいえ膨大な分量がある場合はかなりの作業になります。原稿データがWordで作られていれば、スタイルやルビの指定をそのままInDesignに取り込み、設定を修正して使うことも可能ですが、原稿ファイルでスタイルの指定などがきちんとされているとは限らず、電子出版など幅広い用途で使うのに適したデータとは言えません。テキストデータの段階でInDesignタグを付加して自動的に処理するというやり方もありますが、これも特定ソフトに依存する話です。
また、紙の本だとノンブルや柱が入り、文章や画像が入るページも固定されますが、電子書籍だと不要だったり流動的だったりして、同じような処理はできません。
電子出版を視野において考えた場合、特定のソフトや用途にしか使えないデータを中心にワークフローを組み立てると、状況の変化に対応することが難しくなるというのが問題になります。元になるデータは、どんな形にも柔軟に変えられるような汎用性のあるフォーマットにしておき、そこからいろいろなアウトプットに合わせて変換処理を行うというやり方が必要になってくるでしょう。
XMLによる多様なアウトプット
現在のところ、柔軟で汎用性のあるフォーマットとして一番有力と思われるのはXML(eXtensible Markup Language:拡張可能なマーク付け言語という意味)です。XMLはHTMLのようにタグを使って意味づけを行う言語ですが、タグの種類が限られるHTMLと違い、ユーザーが自由にタグを作り、付けていくことができます。
もちろん、ユーザーが勝手に付けたタグは、そのままではユーザー以外にとって意味を持ちません。注目すべきなのは、XMLではタグ付けされたデータをさまざまな形に変換することが容易であること、そしてXMLをサポートする技術・製品が数多く存在しているという点です。
XMLのタグを解釈して視覚的に表現するための技術としては、CSS(Cascading Style Sheet)およびXSL(eXtensible Stylesheet Language)があります。CSSはHTMLでも使われているもので、あらかじめ定義されたスタイルシートを適用することでレイアウトすることができます。ただし、印刷用としては十分とは言えません。
一方、XSLはXMLのタグを使って組版したり変換するために考え出された言語です。XSLはさらにXSLTとXSL-FOという2つの仕様に分かれます。XSLTは、XMLを別の形に変換するための言語、XSL-FOはXMLの組版用の言語です。
XSL-FOを使う場合、XML文書をXSLTプログラムでXSL-FO文書に変換し、XSL-FO対応ソフトで表示・印刷を行うという流れになります。XSL-FOは強力かつ柔軟な組版用言語ですが、サポートする製品・ソフトが少ない(日本のアンテナハウス社の製品が有名)というのが最大の難点です。また、InDesignのような印刷専用レイアウト・ソフトほど多彩な組版機能は考えられていません。
現時点では、XMLを組版処理する技術であるCSSやXSL-FOは、ともに一般的な印刷用途としては不十分です。むしろ、重要なのはXML変換技術であるXSLTの活用でしょう。
XSLTを使うと、XMLのタグを別のタグに置き換えることができるだけでなく、文章の構造そのものを変換することも可能です。たとえば、テキスト全体から各章の特定段落だけを取り出し、置き換えるといったことも簡単にできるわけです。
電子書籍で使われているフォーマットは、EPUBをはじめとしてその多くがXML(あるいはそのバリエーションであるHTML)をベースにしています。また、InDesignなどDTPレイアウト・ソフトもXMLの読み込みをサポートしていますし、XMLを元にInDesignタグテキストを作って読み込むということも可能です。それぞれ機能的な違いが大きいため、使用するタグの種類や数、定義はかなり違ってくるものの、XMLを使って組版処理する仕組みは用意されているわけです。
出版業界をはじめとして、これまで紙の印刷物で情報を発信してきた会社も、今後は紙と同時に電子出版に対応するという時代になってくるでしょう。その場合、元になるテキストをまずXMLとしてタグ付けし、どういう形にも使えるようにする、それを中心にして、XSLTでそれぞれに特有のタグや構造に変換し、さまざまな形にアウトプットする。このワークフローを構築することが、これからは重要なカギになってくるはずです。
(田村 2010.6.28初出)
(田村 2016.11.7更新)