テキスト原稿のやり取りにおける問題
デジタルデータと文字の関係は一律ではない
最近は、文字原稿がテキストデータでやり取りされることが一般的になってきました。原稿がデータで制作側に渡されれば、あらためて文章を入力する必要がないため作業効率が向上し、コストも安くなります。
また、制作側からすれば、原稿を作る側でデータ化されることにより、誤植などの責任の所在が明確化されるといったメリットもあります。テキストデータ化に入力ミスは付き物ですが、クライアントが入力したテキストであれば、誤字脱字があっても制作側に責任はないと言えるわけです。
ただし、原稿がテキストデータになることで、以前にはなかった問題も起きるようになってきました。今回は、テキスト原稿のやり取りに関する問題を、制作側ではなく原稿を作る側の立場から見ていきましょう。
デジタルにおける文字テキストの問題としては、たとえば文字コードの問題があります。文字テキストといっても、実際には文字そのものではなく、各文字に相当する符号をやり取りしているに過ぎません。この場合、各文字とそれに相当する符号を関連付けるルールが「文字コード」です。文字コードが変われば、文字と関連する符号も違ってきます。逆に言うと、同じ符号でも文字コードというルールが変われば表示される文字も変わってしまうということになります。そのため、ある環境では正しい文字で表示・出力されていたのに、違う環境に持っていったら全く違う文字になってしまったということもあり得るわけです。
これまで、日本のパソコンで一般的に使われてきたのはシフトJISという文字コードでした。また、最近はユニコードが一般的になっています。文字コードが2つだけであれば問題はかなり簡単ですが、実際にはシフトJISといっても外字領域で環境によって異なる文字が使われていたり、ユニコードでも複数の符号化方式があるなど、いくつもの方式が存在しているのです。
このように日本語だけでも問題ですが、中国語など他の言語が混在する場合はさらに事情が複雑になってきます。場合によっては、一体どんな文字コードが使われていて、実際にはどんな文字なのか想像すら出来ないということもあり得ないわけではないのです。
文字コードの違いは構造的な問題であり、その違いも目立つものになりますが、文字コードほど目立たず、しかしそれだけに深刻なものにもなりかねないのが字形セットの違いによる問題でしょう。その最たる例がWindowsのMS書体におけるVista以降とXP以前の違いです。
Windows Vistaに搭載されたMSの標準書体は、Windows XPまでと比べて1書体増えことと文字数が増加したことを除くと基本的に同じですが、文字によっては形に微妙な違いが存在しています。これは、日本語文字コードの公的基準であるJIS X 0213の例示書体が変更されたのに伴う変更ですが、常用漢字以外の文字のうち、百数十文字だけの変更であり、しかも一点しんにょうと二点しんにょうの違いなど、字形のごく小さな変更がほとんどなので、気付かない人は少なくないでしょう。
Windows Vista以降で入力したテキストデータとそれ以前の環境で入力したデータは、文字コードが同じであれば各文字に関連付けられた符号も同じです。つまり、文字コードも符号も同じなのに文字の形だけが環境によって微妙に違ってくるということになります。さらに問題なのは、違うということすら気付かない人がほとんどだろうと推測される点です。
たとえ形の微妙な違いであっても、人名などだと重大な違いにもなりかねないので、どっちでもいいというわけにはいきません。ただし、どちらの字形で入力したのかはOSのバージョンを確認しないと分かりません(厳密にはOSだけでもダメで、MS書体のバージョンを調べないと確実なことは言えない)し、入力した人間が字形の違いを意識していたかどうかも問題です。
文字に関する情報のやり取り
デジタルデータというと、変化しないものというイメージがあります。しかし、実際には、文字コードや文字セットの違いによって簡単にその姿を変えてしまう不安定なものなのです。
制作側にテキストデータしか渡されなかった場合、データ作成側との文字コードや文字セットの違いを調整することは難しくなります。入力した通りの文字から正しいDTPデータが作られ、印刷物になるためには、原稿を作成する側としても不安定要因を解消することが必要です。
文字環境の違いをコントロールし、テキストデータと本来あるべき文字の形が同じであることを確認するには、紙原稿を使うのが一般的であり確実です。紙に出力した文字を原稿を作った本人がチェックし、正しく出力されていると確認すれば、後工程の人間であっても、その紙原稿とテキストデータを照合することで、文字環境の違いによる字形の違いをチェック・修正することができます。
ただし、紙原稿をデータと照らし合わせるといっても、微妙な違いまで確認するとなると原稿作成側にとってもDTPデータ作成側にとってもかなり大変な作業です。問題の原因は文字環境の違いにあるのですから、むしろ、お互いの環境を正しく伝え合うことで、テキストデータを適切にコントロールするという方法のほうが、ずっと効率的でしかも正確にできるでしょう。
文字環境の情報として重要なのは、OSのバージョン、フォント、入力・保存したソフト(とバージョン)、文字コード、そしてなにより、原稿作成者(著者・クライアント)の字形についての方針(どういう字形を希望しているか)です。これらの情報を的確に伝えることができれば、文字コードや文字セットの違いによって文字化けなどが起きるというトラブルはかなり防ぐことができるはずです。
(田村 2008.12.1初出)
(田村 2016.8.30更新)