今あらためてJIS2004への対応を考える

漢字表の変遷と文字コード

コンピュータが普及していく過程で問題になったのが、日本語の文字の扱いでした。数字を入れても数十字あればなんとかなる英語環境と違い、まともな日本語を扱うにはどう少なく見積もっても数千字は必要になります。

1978年、漢字を含む日本語の文字集合が初めてJISで制定されました。これがJIS C 6226―のちにJIS X 0208と改称され、日本語デジタル環境におけるもっとも基本の文字規格として広く使われるようになる文字コード（文字セット）です。

JIS X 0208は1983年、1990年、1997年の3回にわたって改定され、最終的に6,879文字が規定されることになります。内訳には、記号類や数字、アルファベット、かななど多種類の文字が含まれますが、多くを占めたのは漢字です。第1水準と第2水準合わせて6,355字になる漢字は、どのように選ばれたのでしょうか。

JIS制定に先立つ1971年、情報処理学会は規格委員会の中に漢字コード委員会を設け、漢字に関する各種資料を調査し、6086字の「標準コード用漢字表（試案）」を公表しました。その後、行政管理庁がこの試案をベースに、官報やほかの漢字表の調査を加味した分析結果と漢字表「行政管理庁基本漢字」を作成しました。

1978年のJIS作成委員会は、行政管理庁の分析結果を参考にしつつ、上記の「標準コード用漢字表」「行政管理庁基本漢字」に、人名・地名の漢字として日本生命の「人名漢字表」、国土地理協会の「国土行政区画総覧使用漢字表」を加えた4つの漢字表をもとに、漢字関係の資料37点における出現頻度を考慮してJIS X 0208の漢字を選んだのです。

その後の改定においては、若干の文字の追加もありましたが、文字の追加以上に大きな問題になったのが規格票の例示字形の変更と包摂基準の規定化でした。

そもそも漢字には、形が違うのに読み方も意味もまったく同じ文字として扱われる「異体字」が相当数存在します。異体字には、元の字形を省略した略字や、古い時代に使われていた古字、世間で非公式に使われてきた俗字など、さまざまな由来のものがありますが、いずれにしても異体字関係にある文字同士は形が異なっていても同じ文字とみなされ扱われます。

異体字がある場合、どれが正字でどれが異体字かは、一概に決められません。もともと由緒正しく広く使われてきた文字の形だったとしても、簡略化された異体字のほうが正式な漢字表に採用されたりすれば、元の字が“旧字”という名の異体字にされてしまうこともあり得るわけです。

日本で正式に国から告示された漢字表は、「当用漢字表」「人名用漢字別表」「常用漢字表」「改定常用漢字表」などいくつかありますが、そのなかでも日本の文化そのものに大きな影響を及ぼしたのが当用漢字表です。1946年に告示された当用漢字表とその3年後に告示された同字体表では数百字の簡易的な字体が採用され、それまで正しいとされてきた文字が異体字（旧字）に、異体字が正字にされるという事態が生じました。この段階で正・異が入れ替わった文字としては、たとえば「應」と「応」、「廣」と「広」、「亞」と「亜」、「晝」と「昼」などがあります。

当用漢字は漢字使用を制限する目的で作られたもので、あらゆる文書に対する義務化を伴うものではないものの、公文書や教育現場はもちろん遵守が求められ、新聞や商業出版物においてもかなりの強制力が発揮されて、漢字の使用制限や字体の変更が行われました。

一方で、当用漢字以降、漢字制限はさまざまな方面から批判を浴び続けます。その結果、まず1951年には、当初当用漢字のみ使用可能とされた人名において当用漢字以外に使える漢字として「人名用漢字別表」を告示、その後もたびたび人名用漢字が追加されることになります。さらに、1981年には当用漢字が廃止され、代わりに法令以外には強制力がなく、あくまでも目安扱いの「常用漢字」が告示されました。

1978年に策定されたJIS X 0208（78JIS）では、当用漢字表に収録されていた文字は、字体表に掲載された字形のまま、人名用漢字別表とともにすべて第1水準に収録されました（当用漢字が1850字、人名用漢字別表が120字。ちなみに第1水準領域は全部で2965字）。第1水準の残り領域と第2水準には、JIS78選定のところで述べた4つの漢字表にある漢字から選んで収録されました。その際、当用漢字でない文字のうち「嘘」「叛」など10文字ほどに当用漢字に合わせた簡略字形が採用されましたが、多くは元の漢字表に掲載されていた“正字”が採用されました。つまり、78JISは、簡略字体を使う当用漢字と、当用漢字以外の従来字体の漢字が混在した文字セットだったわけです。

この段階で字形を統一できればよかったのかもしれません。ただし、JIS文字コードの考え方としては、規格票に掲載した文字は具体的な字形を指定したものではなく、あくまで字体を「例示」したものだとなります。JIS X 0208の1997年改訂でも、この点について「包摂」という概念を示し、例示字体は一例であって字形の細かな差異があっても包摂基準の範囲であれば同じ字体とみなすとしました。

ところが、JIS X 0208の1983年改訂（83JIS）では、JIS規格票に掲載される例示字形が相当数変更され、入れ替わりました。第1水準と第2水準にまたがって異体字が収録されていた22組は、それぞれ第1水準と第2水準が入れ替わり、また、4文字の字形が簡略化され元の字は第2水準の最後に追加されました。そのほか、254字の例示字形が変更になり、合わせて約300の例示字形が変わってしまったのです。

本来、文字コードは細かな字形の違いにかかわらないものであり、なおかつ、例示字体は字形デザインを定義するものでもありませんが、この変更はその後のフォントのデザインに大きな影響を与え、83JISに準拠した字体のフォントが一般的になりました。

一方、印刷・DTPなどでは簡略化された字形よりも従来の印刷で使われてきた字体のニーズが大きく、また人名における字形もこだわりが強いことから、文字コードにかかわらず必要な字形を求める動きが高まりました。その結果、異体字を管理・運用できるOpenTypeフォントが登場することになります。

表外漢字字体表とその影響

文字数の制限を目的とした当用漢字から単なる目安の常用漢字に移行し、さらにワープロ・パソコンなど情報機器が普及したことで、漢字を取り巻く状況は大きく変わりました。文字を覚えるのに膨大な手間・労力がかかるというのが漢字を制限する政策の最大の意義でしたが、難しい漢字でも簡単に入力、印刷できるようになったことで、使える文字の範囲を増やすことへの障害がなくなったのです。

同様に、字体についても簡略化から従来の字体の維持へと流れが変わります。

2000年12月、国語審議会は、常用漢字と一緒に使われることが多い1022字の漢字について、印刷標準字体を示した「表外漢字字体表」を答申しました。常用漢字と人名漢字を除く使用頻度の高い漢字について、当用漢字や常用漢字のような簡略字体ではなく、従来のいわゆる康熙字典体（清の康熙帝の勅撰により作られた漢字辞典で採用された字体）と、それに匹敵する使用実績のある俗字や略字を印刷用の標準字体として定めたこの字体表は、強制的なものではないものの、国として字体を指定した点は無視できないものであり、文字コードにも大きな影響を与えることになりました。

表外漢字字体表に先立つ2000年1月、JIS X 0208を大幅に拡張し、11,233字を収録した新しい文字セットJIS X 0213が制定されていました（以下、「JIS2000」と略す）。JIS X 0213では第3水準、第4水準が追加され、非漢字も増えましたが、そのため従来のフォント環境での対応は難しく、Unicodeのサポートによって普及することになります。おりしも、UnicodeをサポートするOS、フォント、アプリケーションが一気に普及する時期にあたり、JIS X 0213をフルカバーするOpenTypeフォント（Adobe-Japan1-5）も2002年に登場しました。OpenTypeフォントを中心に、JIS X 0213に対応したフォントが順調に増えていく中で、メーカーや関係者に表外漢字への対応を迫ることになったのがJISの改正です。

JISの規格は制定・改正から5年以内に見直しをしなければならないという決まりがあります。JIS X 0213は2004年に改正を行いますが、その際、表外漢字字体表に対応するため、168字の例示字形を変更し、10字を追加しました（JIS X 0213:2004。以下「JIS2004」と略す）。

その後、JIS2004に対応したフォントが登場してきますが、中でも重要なのがWindowsに標準搭載された書体です。2007年発売のWindows Vista以降、MS明朝、MSゴシック、メイリオ、游明朝、游ゴシックなどの書体の字形はすべてJIS2004に準拠したものに変更されました。もちろん、従来のOSやフォントを使い続けることは可能でしたし、新OS用に従来字形のJIS90互換MS書体というものも用意されましたが、OSのバージョンによって同じ書体なのに字形が違うという事態が生じたわけです。

同時期に、主にDTP用途のOpenTypeフォントもJIS2004に対応したフォントの開発を進めました。ただし、これらはフォントで個別に管理されるものだけに、取り違えないように名前で区別をつける必要があります。従来の字形のフォント名はそのまま変わらず、小塚明朝Pr6Nや筑紫明朝Pr5NといったようにJIS2004対応の多くの書体の名前にNが付くようになりました（いわゆるNフォント）。

。

異なる字形をどうやって使い分けるか

書体の違いによって字形が変わるというのもあまりよいことではありませんが、それでも使う書体で字形の使い分けができるのであれば最低限の管理はできます。ところがWindows標準書体の場合はWindowsのバージョンによって字形が変わってしまうということであり、管理は極めて困難になります。

例えば、Windows XPで作ったJIS2000字形のデータをWindows 11で開けば、JIS2004の字形になります。これはWordデータであってもプレーンなテキストデータであっても、あるいはInDesignであってもMS書体を使って表示していれば何の警告もなく自動的に変わってしまうのです。

ここでDTPと印刷のワークフローに即して考えてみます。DTPでは、まず原稿がワープロソフトやエディタで作成されます。それをDTPアプリケーションに流し込んでレイアウトし、校正と修正を繰り返して校了になれば印刷に回ります。原稿を作る人間とレイアウトする人間は別人の場合がほとんどで、出版社の社内で完結するようなケース以外だと組織もそれぞれ別だったり、お互いに面識がないということも多いでしょう。

つまり、どのような環境で入力したか、後の工程の人間が確認するのは難しいケースが多いわけです。また、データが作られてから時間が経てば経つほど作った時点の情報は少なくなってきます。社内に昔作られたテキストデータが保管されていて、それを新たにInDesignに流し込むという仕事などでは、入力した時点での字形が何かを確認するのはかなり難しくなります。

さらに考慮しなければならないのは、原稿を入力した人間がどれだけ字形を意識していたか分からないという点です。JIS2004で変更になった字形の中には、違いが微妙でパッと見ただけでは気づきにくいものもあります。たとえば、「辻」「辿」「迄」といった一点しんにょうと二点しんにょうの違いなど、小さなモニタ画面の中できちんと確認しながら入力している人ばかりではありません。

かつてWindows XPで入力され、何度か追加された名簿テキストを、最近になってあらためて使うことになったので、Windows 11のノートパソコンで開いて確認し、問題ないから印刷会社に渡した……いくらでもありそうな話ですが、この場合、どの字形が正しいと断言できるでしょうか。

要するに、テキストを作った本人の意思を確認するのも難しいというのがこの字形にまつわる最大の問題なのです。

現実問題として、クライアントから制作会社にテキストやWordデータが入稿された場合に、JIS2004の変更字形をどうするかは現在も頭を悩ます問題の一つです。原稿のテキストやWordデータは、最近のWindowsで開けばJIS2004の字形になっています。

この場合、JIS2004の字形を維持してレイアウトするのであれば、書体にOpenTypeのNフォントを指定することになるでしょう。

一方、Pro書体が使用フォントに指定されていたり、Nフォント以外の書体が指定されている旧データをそのまま流用するという場合は、そのままであれば必然的にJIS2000の字形になります。

どの字形にするかは、もちろん最終的には発注元のクライアント（内製であれば発行の責任者）が決めるべきことです。しかし、発注元に確認しようとしても、字形をめぐる複雑な事情を知らない人間にはきちんと理解・判断できないということも十分考えられます。そういった場合のために、制作サイドとしても基本的な方針はまとめておくべきかもしれません。

もちろん、字形の違いがさほど重要でない印刷物もあります。問題になりやすいのは固有名詞が頻繁に出てくるもの、特に人名です。人名に関しては、その印刷物全体で字形を定めるというより、個別の名前ごとに字形を指定する必要があるかもしれません。

基本方針としては、まず、2006年以前に作成されたデータの場合、作成当時に想定されていた字形はJIS2000の可能性が高いということを考慮すると、Pro書体などNフォント以外の書体でも問題ないかもしれません。もっとも、クライアントが今の一般的な字形にしてほしいという希望があるならそれに従うべきです。

原稿も含めて完全に新規に作成する印刷物については、Nフォントを使うという方針でいいでしょう。現状でデータとして流通しているテキストはほとんどJIS2004字形になっているはずですから支障はないはずです。

ただし、「完全に新規に作成する」という点が問題になります。原稿がデジタルデータで受け渡されるようになって久しいですが、デジタルデータの最大の特徴は複製が極めて容易という点です。たとえば、全体の原稿は2024年に作られたものだとしても、そのうちの半分以上はWindows XPで作られた別のデータをそのままコピーしたものだとしたらどうでしょう。

テキストをコピーする際に、最初に作られた時点の字形を気にしてコピーする人間などほとんどいないでしょう。当初の制作時点では字体を明確に区別していたとしても、コピーした時点で字形を特定する手掛かりが失われることもあります。たとえば、JIS2000と2004で字形が変わる文字をそれぞれOTFのPro書体とN書体で指定し、PDFで保存したとします。この段階では字形が明確に異なっていますが、それぞれのテキストを選択してコピーし、エディタにペーストすると、どちらも同じ字形になってしまうわけです。

結局のところ、データだけで字形を確定するのは難しいようです。データを制作する側には、字形問題に関する十分な知識と、それをもとにした関係各所とのコミュニケーションが必要になるということは言えるでしょう。

（田村　2024.4.19初出）
（田村　2025.6.16更新）

技術情報

Pocket

ポリシーは『質』へのこだわり。インフォルムは質の高い書籍・カタログ・参考書・雑誌のDTP制作（デザイン・組版）を追求する会社です。《ISO 9001:2015・ISO/IEC 27001:2022認証取得》

MENU

今あらためてJIS2004への対応を考える

漢字表の変遷と文字コード

表外漢字字体表とその影響

異なる字形をどうやって使い分けるか

技術情報

DTP技術情報ワード検索

技術情報

最近のお知らせ