ぜんぶ秦恒平文学の話

文字コード問題 2002年

 

* ぽつりぽつり寄稿されてくる形勢で、対応は、ますますシンドくなる。

「毟」る、「鞠」の程度の字が、まともに受信者へ通ってゆかない機械・機種がある。ドイツ文字のウムラウトも化けてしまう。再現が全く不可能なら諦められるが、手元の機械でなんとか再現出来、やれ嬉しやと送信すると先方では読みとれない。読みとれる人も読みとれない人も有るというのが大いに困惑の種となる。文字コードの専門家達は、もう二万字もそれ以上にも文字コードは出来ているなんて謂ってくれるが、特別な箱の中に用意されている絵に描いた餅に過ぎず、万人に共通して利用できる漢字は、相変わらず六千字足らずなのである。ウインドウズやマッキントッシュがそれを搭載してくれない限り、木の葉の小判、泥の饅頭なのだ、手厳しく謂えば、文字コードも、専門家や関係者間の自己満足に過ぎない段階とすら言える。

わたしの代理として文字コード委員会に出てもらっている、電メ研委員の加藤弘一さんには、わが電子文藝館での体験や現在の悪戦苦闘もふまえ、文藝関係者からの切実な意見を折に触れ開陳してきてもらいたい。少しずつでも改善の歩を進めて欲しい。

2002 1・18 12

 

 

* 谷崎先生の「夢の浮橋」文藝館用寄稿は、えらく難作業、なによりも漢字が足りない。絶対に欠かせない大事なヒロインの名の「茅渟」が、さ、無事に届くかどうか。表具の表に衣ヘンがついているのも、字がない。有ったにしても送れまい、伝わるまい。申し訳ないが通用の「表具」にさせていただくだろう。日本文学を、現代文学ですら、機械の上で再現し送信するのにいかに不自由であるか、それはもう最初から察していて、分かり切っていて、何年も前から声高に指摘し請求し続けてきたけれど、関係者には、その必要すらなかなか分かってもらえなかった。愚かにも、自分の原稿でだけ書き出せれば、無差別の誰か受信者にそのまま届く届かぬなど論外だと、じつは学者にすら、見捨てられてきた。商売用・事務用の文書だけで世の中の事は済むと考えている人達の、または自分一人の都合だけに生きた人達の考え方であり、そんなのことで済まない世界が広大であることを理解できない人が、余りに多い、今も多い。

2002 1・21 12

 

 

* 昨日は冬の嵐、雷まで鳴りひらめきました。今日はうってかわって春のようなひかり、しめった土や濡れた落葉がやわらかくにほっています。

おっしゃってくださった百五十首を抽いています。ゆうべは選び入れた作品が、今日みると、どうしようもないものに見えたりして、行きつ戻りつしております。

つかいたい文字が、器械では出て来なかったり、よしんば、苦心してその文字にしたところで、器械がうまく受け手にそのまま伝えてくれるかというお悩み、承っていてせつなくなります。

じつは二ヶ月くらい前、岩波書店の電子辞書の部門に当てて、メールを送りました。

外出時に便利そうなので電子辞書を求めにゆきました。そして、「広辞苑」まるごと入っているという辞書で、気になっている単語をひいてみたのです。

ところが、というべきか、やはりというべきか、「せみ」「かもめ」「ろうそく」が、「蝉」「鴎」「蝋燭」になっていました。こうした日常語ですらこうなのですから、他は推して知るべしといったところでございましょう。

それで岩波書店に、「広辞苑」まるごとという宣伝文とはちがう、これはウソ字ではないか、「新明解」の幾種かはウソ字でなかったのに、なぜ「広辞苑」はウソ字をつかうのか。今後、改める予定があるなら、それを待ちたいので、知らせてほしい。

そう、申しやりましたところ、返事がありました。

コストや電子化する側の意識などから、なかなか、変更できないというようなことでございました。

予期した返事でしたけれど、やはり、がっかりいたしました。

以前、ワープロを使っていましたときには、「作字」ということができ、ときにはちっとバランスのよくない字が出来あがったりしましたけれど、何とかしのぐことはできました。器械が高級?になると、それもできないというのが、わたくしの頭では、ふしぎ、納得のゆかぬことでございます。

百五十首を抽きながら、ふりがなの多いのはやめよう、化けてしまいそうなのは、どうしようかしらなどと、かんがえたりしております。

器械の前でうたたねをなさって、お風邪ひかれませんでしたでしょうか。そう、申しあげるわたくしも、舟を漕ぎ、はっとすることがございます。

曇ってきましたけれど、空気がやはらかで、気分のよい午後でございます。ずっとずっと以前、FM放送から録音したグレン・グールドの「ピアノソナタ」K331のテープ(わたくしが、グレン・グールドに出会ったのはこのときでございました)を聴きながら、このメールを書いております。

 

* 作字は、かりに出来ても見苦しく、また送信しても化けてしまうようだ。文字セットから図版貼り付けにしても、他の文字の大きさと頑なに差が出たりする。文藝作品ではいかにも見苦しくて辛い。文字コードを与えて標準化を遂げている字は、事実もう何万もあるが、「有る」というだけの話で、たとえば「電子文藝館」を少しも楽にしてくれてはいない。繪に描いた餅の儘で、マイクロソフト社などが、機械に実装備してくれない限り、広い範囲では役に立たない。自分の書いたものを自分だけで利用する分には、かなり出来るが、送信すると、話は全然「別」なのである。そういう「別」の話ばかりが主として文字コード委員会では巨細に及んで進行しており、わたしは、それにはそれで敬意を表しているが、さて、日々に困っていることも困っている。コンピュータはインフラであると云われても、少なくも当面の我らの関心事に関連しては、インフラどころか不備不具機械と云わざるを得ない。

この「広辞苑」読者の声が岩波書店その他の出版者の連帯した声と化して、文化庁や文部省を動かし、他国の業者世間に響いて行くことを期待したい。

2002 1・22 12

 

 

* 日本規格協会符号化文字集合調査研究委員会(委員長 樺島忠夫)が、2002年1月15日付けで「JIS「情報交換用符号化拡張漢字集合」改訂の考え方案公開レビュー」をしていた。その概略を、電子メディア委員会では委員加藤弘一氏に要約してもらった。さらに委員会見解も取り纏めることになるが、加藤さんの「要約と指摘」は我々にだけでなく、機械での文字問題にも、それだけでなく日常の文字表現行為にも関わりが深刻なので、理解の届く届かないには相当な差があろうけれども、参考までに書き込んでおきたい。わたしの立場では日本ペンクラブ内の委員会だけでなく、一作家としてもこの問題は多くの人とともに分かち合い、考え合って行かねばならないと思うからである。加藤委員その他委員のお許しを得ておきたい。

 

* 現在、JISでは国語審議会の「表外漢字字体表」とJISの整合をはかるための改正作業をおこなっていますが、その案がようやくまとまり、1月15日?2月15日の期間、公開レビューとして広く意見を集めています。

案を読みましたところ、言論人の立場から意見を述べた方がいいと思われる箇所がありましたので、秦委員長にお願いして、4日の委員会で討議していただくことになりました。

JIS改正原案は  http: //www.jsa.or.jp/domestic/instac/revue/jcsopen.htm で読むことができます(4日にプリントしたものを配布します)。

ご存知の方も多いと思いますが、1978年の最初のJISでは当用漢字表にはいっていない漢字は正字になっていたのですが、1983年の改正で簡略字体に直してしまったために、印刷で一般に使われる漢字と、電子機器で表示される漢字との間に、ズレが生じました。

森鴎外の「鴎」、掴むの「掴」、冒涜の「涜」などが、その例です。(83改正以前の機械ではちゃんと正字が出ました。)

このズレを解消するために、国語審議会では1022字の「印刷標準字体」を決め、「表外漢字字体表」として公布しました。一口でいえば、JISの83改正を否定し、原状回復をはかったものといえます。

そこで、JIS改正となるわけですが、83改正移行に蓄積された膨大なデータがあるために、簡単に字体を入れ替えるというわけにはいきません。

もし、字体の入れ替えをしてしまったら、83改正と同様の混乱が生じます。

電子機器の普及を考えると、影響の深刻さは83改正以上です。

改正には慎重な配慮が求められますが、具体的には以下の通りです。

 

1. 815字(80%)については変更しない。

2. 「柵」、「閏」、「頽」、「冑」の4字は、ユニコードにはいっている正字の方ではないという解説を附加し、誤解を避ける。

3. 隙、廻など筆押さえ、跳ねなどの微細な差異のある39字は例示字形を変更。

4. 「葛」など7字は、印刷標準字体表の字形が別字としてユニコードに存在するので、追加も変更もしない。

5. 「溢」、「鰯」、「淫」、「冤」、「晦」、「徽」、「秤」、「瀞」、「煽」など100字については例示字形を変更するが、一部の字については変更しない方がいいという意見が出ている。変更しない文字については、正字を新たに追加し、ISOにも追加申請する。

6. 三部首許容に関する28字については、

>>1表外漢字字体表の例示字形に変更するという提案と,2現行JIS 文字コードの例示字形を維持するという提案の両論がある。 「この両論に対する,積極的な御意見をいただきたい。」と特記されている。

三部首許容というのは「食」偏、「示」偏、「之繞」は正字形でも簡略形でもいいという規定で、「飴」、「榊」、「逢」などが該当。

(物書きの立場からは、5と同様、現行字形を維持したまま、正字を追加した方が好ましいでしょう)。

7. 「鴎」、「掴」、「涜」など28字についてはユニコードに正字があるので、変更しない。

8. 「嘘」、「具」、「妍」、など10字は正字がユニコードにあるので、互換漢字としてJIS拡張漢字(JIS X 0213)に追加。

(5と6については、意見を述べておいた方がいいかもしれません。もっとも、JISが改正されても、メーカーがしたがうかどうか怪しいという問題があります。

むしろ、重要なのは、JISの委員会の場でマイクロソフト社の代表が提起したという、「フォントの実装方針」に注意を喚起する方ではないかと思います。

電子文藝館でも、ユニコードにはいっているのに、マックでは出ない字がありましたが、その後調べたところ、過去のマックで出ないだけではなく、現在のマック(Mac OS X)でも出ない字が多数あるのです。

Windows XPにはユニコード二万字が標準ではいっていますし、Office XPを買うと、さらに七千字が追加されるということです。

Mac OS Xの場合、ユニコードといっても一万一千字しかはいっておらず、内田百ケンの「ケン」や、タカ村薫の「梯子高」がはいっていません。

厳密にいうと、一万五千字がはいっているのですが、四千字はフォント切替という技術で表示するので、Windowsとの間でデータの互換性がありません。

一体なんのためのユニコードだったのか、アップルの姿勢には疑問をおぼえます。

ユニコードを使う以上、すべての機械で字が出るように、フォントをちゃんといれてくれと意見表明しておいた方がいいと思うのですが、どうでしょうか。

意見表明の場としては、情報処理学会の文字コード体系検討委員会(文字コード委員会)の報告書の各委員の「意見」の項目もあります。

こちらの委員会は、日本の文字コード政策の大方針を決めるところで、電子政府との関連で異体字を出す技術を標準化したり、国際的な連携について議論しています。     電子メディァ委員会委員     加藤弘一

 

* 分かりいい纏めであり、附記された加藤氏の所感にわたしも異存がないので、あえてそのまま書き込んでおく。こういう問題に、パソコンという機械環境に居住している大勢の人達が踏み込んだ関心を持ってもらえれば、果ては、日々に苦闘している電子文藝館での作品再現にも、また今後の電子的表現にも遠回りして利益をもたらすだろう、そうあって欲しいと願うのである。

2002 2・1 12

 

 

上部へスクロール