* 昨年暮れに何度かにわたり加藤弘一さんにメールで示唆されてきたことが、もう大きな問題としてわれわれの研究会でも話題になろうとしている。わたしにはまだ的確な解説はおぼつかないので、加藤さんに戴いたメールの要点を再び掲げ、廣く話題にして貰いたいと思う。文字コード委員会でも当然取り上げると石崎委員長の言質をもらっている。
* 文字コードについては、もう発言しないことにしたのですが、見過ごしにできない事態が進行しているようです。
1999年の「住民基本台帳法改正」で、全国オンライン化が決まりましたが、自治省は「独自文字コード」でやるというのです。
漏れ聞くところによりますと、工技院側は自治省に対し、JIS未収録文字の提供を申しいれたところ、拒否されたそうです。
これが事実だとすれば、短期的には「大きな利権」が生まれるでしょう。
市町村の庁舎のコンピュータは「自治省仕様の特別なコンピュータ」にならざるをえません。郵便局やコンビニでも住民票をとりよせるようなシステムが検討されているようですが、これもみんな自治省独自仕様の特別なコンピュータになります。
怖いのは、「JISコードの不備が国民総背番号制の口実に」なることです。
たとえば、間もなく入試シーズンですが、いずれ、受験申し込みはインターネット経由でおこなうようになるでしょう。通信制の学校では、スクーリングの代わりに、インターネット授業を認めるというようなことも検討されているらしいです。
学校だけでなく、民間をふくめて、あらゆる分野で、個人を「アイデンティファイ」する必要が生まれてくるでしょう。
もし、「住民基本台帳が自治省文字コードで運営される」となると、「自治省文字コードでしか、住所氏名を表記できない人」が当然出てくるわけで、それを口実に、住民票番号の使用が強制されるようになると思われます。これは見過ごしにできない事態ではないかと思います。(詳しくは加藤弘一著『電脳社会の日本語』32~6頁を参照されたい。秦)
憂慮すべき事態と考え、メールを差し上げました。
重要な問題なので、もうすこしおつきあいください。
前便では、入試のオンライン出願とインターネット通信教育を例にしましたが、住所氏名の正確な表記は「医療分野」でも必要です。
カルテを電子的に管理するためには、正確に住所氏名をしなければなりません。インターネットを使った遠隔医療もそうです。
ネットワーク社会ではありとあらゆる局面で、「住所氏名の正確な表記が必要」になります。
しかし、現在のJISコードでは表記できない方々がいます。主に人名異体字のためです。
2000年に施行されたJIS第3水準、第4水準では、ネットワーク社会に対応するために、1997年に鳴り物入りで制定した包摂規準を変更し、「徳」や「隆」の正字を追加しました。「徳」、「隆」の正字は、ご存じのように、横棒が一本多いのですが、1997年改正では通用字体の「徳」、「隆」と包摂し、同じ文字としてあつかうことになっていました。どうしても正字の方が使いたければ、フォント指定方式でやれというわけです。
しかし、正字の「徳」、「隆」は康煕別形字として人名用漢字表で使用が認められています。内閣告示ですから、当然、戸籍の届出に使うことができます。Windows外字にもはいっているくらいで、現実的なニーズがあります。
そこで、(JISの)工技院側は、面子を捨てて包摂規準を変更し、通用字体とは別の文字として、正字の「徳」、「隆」を追加しわけです。
もっとも、「徳」、「隆」は内閣告示が根拠になっているので入りましたが、法務省通達で使用が認められている「梯子高」などは、2000年の改正では落ちました。その意味で、依然として、現在のJISコードには不備があり、住所氏名をカバーしきれていません。
すべての日本人の住所氏名を表記するのに、どういう文字が必要かというデータは、自治省が、すでに握っています。
「住民基本台帳の電子化が完了」しているからです。
「JISにない文字」については、これまで「外字」を作って対応してきました。
従来は、自治体(人口のすくない自治体ではグループ化)ごとに作られた「第三セクター方式」のコンピュータ・センターで、それぞればらばらに外字を作っていたのです。「JISコードを基本としつつも、自治体ごとにばらばらの文字コードを使っているに等しい」のです。
住民基本台帳を「全国オンライン化」するとなると、「すべての自治体で共通の文字コードを使わなければ」なりません。そうしないと、東京から他県の住民票を請求しただけで、文字化けが発生します。
そうならないためには、JISに、住民基本台帳で使われているすべての人名漢字、地名漢字を入れればいいのですが、自治省側は、住民基本台帳用文字コードをJISとは別に作り、しかも「独占しようとしている」ようなのです。
もしそうなると、将来にわたって、「自治省仕様以外のコンピュータでは住所氏名を正確に表記できないケース」が生じます。電子学籍簿や電子カルテで、個人をアイデンティファイするには、自治省が管掌する「住民票番号」を使わなければならなくなります。「国民総背番号制が強制」されてしまいます。
前便で書きましたように、「大きな利権」が生まれるだけではなく、ネットワーク社会の首根っこが自治省におさえこまれることになります。
* つぶさに読めば読むほど、「自治省文字コード」の独占的な通行は、知らぬ間に既成事実化させるにはあまりに危険なものを含んでいる。すでに「自治省」の在りようには日経新聞などで問題提起が続けられているようだが、関心を持って欲しい。
* 十二月ペン理事会で、近い将来に大きく警戒を要するのは、一つは徴兵制復活、もう一つは華族の復活だと発言しても、だれも「華族」の文字に思い及ばず「家族制度」としか取らなかったのでハナシが混乱した。「勲章」を欲しがり、また爵位への憧れを隠し得ない連中は、根強くはびこっている。
今ひとつわたしが大きな恐れを持って忌避しているのは「内務省」の復活であり、「自治省」はそれへの最短距離にいる。内務省というのは明治以降の日本の行政、弾圧行政の巣窟であったし、その権力の莫大で強圧的であったことはたいていではなかった。大久保利通や井上馨いらいの伝統がついこの戦時中まで世の中を跋扈していた。敗戦で真っ先に解体させられたのは当然至極のあれは好処置であったが、「内務省」「内務大臣」への憧れを持っていない自民党の代議士が何人いるだろうか、疑問である。
上の「国民総背番号制」が現実化するときは「内務省」復活の現実化へ近づくときである。そういうことを、忘れないでいたいのである。
2001 1・4 8
* 文字コード委員会から、正式に委員を委嘱するむねの通知が来た。日本ペンクラブから出向するという意味合いとわたしは理解している。暫定的に受けておくという気持ちである。
2001 2・14 8
* 文字コード委員会に出てきてもらった村山副座長の報告を、理事会のアトで、資料とともに受け取った。
文字コード委員会の趨勢にも大きな様変わりがみえ、村山さんのはなしではあるが、「秦さん」のこれまでの発言趣旨や主張に大きく沿ってゆく方向へ、委員会の討議全体が流れてゆくようだ、と。
例えば、標準化される漢字は、「所謂足し算方式」でこれまでは姑息的に必要が生じたら数を足してゆくやりかたを繰り返してきた。この言葉を用いてわたしは、それは間違いではないかと言ってきた。必要なものは必要であったのだ、みんな必要なのだ。だが漢字に「みんな」という網羅は事実問題としてあり得ない。よぎなく、これは無理、これは拾えない、これは辛抱しなければなるまいと、架空の「みんな」から仕方なく「引き算」して行きながらも、必要で可能な限り「みんな」を標準化してゆくべきであると、言い続けた。どう孤軍奮闘であろうとも、あざ笑われようとも、妥協せずこの原則論を言い続けてきたが、この原則が、いまや本流になって行くようだと村山さんは報告してくれた。ふーん、がんばり抜いてよかったのかなあ、と、ちょっと驚いた。
なにしろ、わたしが、文字コード委員会に出始めた頃は、たとえば孔子や釈迦の文献がそのまま再現できないようなパソコンが、何のインフラかとわたしが言うと、おおかた失笑された。経済行為や工業的必要に応じられれば、文学表現や宗教や歴史などは二の次、三の次のこと、辛抱してくださいと言わんばかりに、招かざる部外者発言のように受け取られた。ガンとして、わたしは、だが、「表現者」「人文研究者」の立場からの「使える」パソコン、役に立つ「文字コード」を言い続けた。どんな優秀な文字セットが出来ようと、世界中の、どこででも、だれでも、いかなる漢字や記号も双方向で等質に使えて文字化けしない「環境」が器械に装置出来なければハナシにならんと言い続けてきた。そういう時節なのである。
* そんな次第で、出る気の無かった晩のペン例会にも出席し、いろんな会員の顔も見てきた。なにも食べず、赤いワインばかりたっぷり三杯も飲んでしまった。東京會舘の向かいのビルで、来がけに見つけておいたダウンの上着の、「このさき用」のを買い、「クラブ」へも寄らず一路保谷へ、そして駅で買ったパンを道々かじりながら、家へ。
2001 2・15 8
* あたまがよく回転しない。鼻がくすぐったくぐずつき、瞼は重い。明日の文字コード委員会にせめてすっきりしたアタマで出たいが。
* 文字コード委員会から「宿題」が出ていた。前回村山精二氏に代理で出てもらったので、もう一つ資料を読んでも問われているところが的確につかめないので、見当違いかも知れないが、手探りでメーリングリストに送り込んで置いた。相変わらず素人考えを率直に言うしかない。
* 相変わらずのトンチンカン、ご海容下さい。 今後も「表現者」「人文学の読者」という立場で発言させていただきます。
第2ステージまでの間に持ちましたのは、先ず、化け文字に出会うことの減った実感、及び撞着するようですが、相変わらず器械上ですうっとは再現できない漢字のいっぱい有った実感、です。ATOK14ほど、ま、ポピュラーなものを使っていて、文字皿で目当ての文字は嬉しいほど見つかるけれど、貼り付けてみると、情けなく「?」としか出ない漢字が山ほどあります。文字セットにいくら漢字を山盛りしてもらっても、小判が木の葉に化けるみたいで役立てにくい。日々に、今も、それを不満として痛感しています。送信した場合、向こうでどう受信されているのか、気がかりは減っていません。
10646で康煕字典は殆ど全て、0213で地名・人名は殆ど入ったと聞いています。たくさんたくさんな漢字が、もう十分なほど標準化のために採字されているこの事実と、器械上で、簡便な実用のために実装(と謂うのでしょうか)されていない事実との落差に、絵に描いた餅を睨んで、相変わらず困惑しています。私の無知なのかも知れません。
難しい話も話で必要でしょうが、文字コードをもう与えられたか、与えられる予定になっているか、の漢字群を、「?」でなく、一字でも多く、一日も早く、いつでも、だれでも、どこででも、どんな器械ででも、文字そのものとして「使える」ようにならないものかというのが、文字コード問題の素人の、相変わらずの目下の希望です。前進して欲しいのはこれだというのが実感です。順序で謂えば、これが一番先です。
日常使用頻度の高い95%の漢字は、すでに実装されている感覚でいます。正確な数字ではありませんが。しかし図式的に謂えば、その95%は、漢字全体の、よく見て1 %ほどかと思われます。10000字を仮にいま器械の上で自在に利用可能としても、残る99%、よほど少なく見積もって、99万字が、器械の内部ではまだ行方不明であるわけです。
これだけの数の文字を、ひょいひょいと取り纏めようとすればするほど、作業は絶望的に投げやりな、無方針・無方法なものに陥るでしょう。大河の砂漠の底へ吸い込まれているのを汲み出そうというのですから。しかし、漢字文化と文化財の、未来にわたる享受と研究とにとって、誰もこれを放擲して済むといえる権能はもたぬ以上、根気よく汲み出す作業と努力は、文字を拾い出しては文字コードを与え実装する必要は続くと謂うことです。
超漢字や文字鏡の、また多くの過去の字典の積み上げで、全体を百万字と仮定すれば、すでに十数パーセントほどは文字の姿が見えています。おそらく、さらに15%も積み上がれば、つまり30万字、ぜんたいの70%水準まで引き算したあたりへ第1目処を置いて進むのが、しかも途中に的確な通過目標を刻んで進むのか、甚だ上等の姿勢ではないかと考えます。
世代を越えて根気の要る仕事なのだと大きな腹をくくるのが、肝要の原則です。居催促めく取り込みを煽り立てるのは、むしろ、ぶちこわしになりかねません。必要なのは、そのもう15%を、1%ずつでも減らしてゆくのだという気概と、何よりその方法ではないでしょうか。「コンピュータ時代」の、これは国家的な、時世的な、器械上の大漢字編輯事業であり、一委員会の手作業でなどとても不可能、全国の国語と人文学系、各大学、研究施設・研究者、ないしは各界表現者たちの、年度で節づけながら多年にわたる協力に期待し、委員会は、送り込まれる相当量の重複の予測される文字情報を「束ねる」機関として長期に機能出来るよう国家的な対策を期待すべきだと思います。そのための知恵を絞り手
段を構えることが出来て関係省庁の理解と協力が得られる道、それを模索できないでしょうか。
何故かなら、一定短期間にむやみに集中して漢字を拾い上げてゆくなどという方法は適していないからです。どの文献・テキストのどの漢字が現に器械で使えないか、あるいは字典にも出ていないかは、それらに従事している人を通してしか見つかり難いものだと思うからです。
一朝一夕の仕事ではない。むやみと拾い出せるものでなく、極めて見つけにくいとも、しかも無数にあるとも、両方謂えることですから、簡単に短期間にどうにか成ると考える方がおかしい。短兵急に姑息な結果を求める前に、息の長い、持続の利く段取りを固めることです。
たいへんなようだけれど、第1ステージでも何度か言いましたが、基本的な文献や資料の一つ一つを、「これは大丈夫です」と点検し続ける作業から入ってゆくのが、急がばまわれだと思う。拾う文字の重複は出ても、確実で安心が利くし、施設や人の関心により、具体的に分担精査を依頼しやすい。
作業に大事なのは、文字コードで無条件に現に再現できる文字例を、ユーザーのだれでも利用できるハンディな文字表にして配布普及し、さらに、実装はされていないが文字コードをすでに与えられている漢字についても、誰もが見やすい文字表を作って置かないと、ロスが多くなりすぎます。これは日頃の実感です。
漢字を可能な限り全部文字コード化することは、出来るか出来ないかの問題ではない、成すべき国民的な事業なのであり、出来ない理由付けなどはしなくて良い。出来るもの、成すべきものとして、さ、いつまでにかと、ここで居催促気味に煽るのは、繰り返しますが、「やらないでおこう」と唆しているのと似たことになる。そう感じます。コンピューターの能力は百万漢字に堪えないというのなら話は別ですが。
日本の古典文芸、現代文芸、漢文日記・漢詩、古文書・抄物、祖師等の仏教著述、日本の正史、その他歴史的文献、代表的な仏典、四書五経、代表的な中国史籍・詩文、中国朝鮮の人名・地名等にまず適切に大分けし、然るべく精査照合の「分担」の依頼できる道筋をつけてゆくことは強ち不可能ではないと思われますし、迂遠なようで最も基本的基礎的な精査の作業として、一度はこういう方法で通過しなくてはいけないものと、個人的には想い続けてきたことを、繰り返しまた申し上げて、今回の答えに替えたいものです。まるで見当違いかも知れぬと懼れながら。この余は、思いつけば会議で申します。
* 時間に追われてかえって、くどくなった。こんなことを問われているのではないのかも知れない。
2001 3・22 8
* 時間ぎりぎりに御成門の会議室に到着、第2ステージの第三回文字コード委員会。なんだか、第1ステージの時とあんまり変わっていない立場で、さぞ、ハタの人たちはまどろっこしいことだろう。理解の水準を平均化しないといけないだろうと「講習会」まで提案され、わたしは喜んで受け入れた。なにしろこういう話題と世間とに飛び込んだのが最近のことで、言葉も使えずに外国に来たようなもの、仕方がない。そうはいうものの、そんなことに拘泥しなければ、問題は漢字のこと、議論にならないわけではない。漢字を読んだり書いたりそれを使って表現したりは、たいていの委員よりもずっと経験も考えもある。わたしは、すこしも苦にしていない。専門化した議論だけが議論になるとき、物事は小さくせせこましく固まりかねないものだ。やわらかく中にいて、頑固にもの言うことも避けないでいたいのである。
2001 3・23 8
* 加藤弘一さんにもらっている文字コード関連の長いメール、誰にも関心を持たれ深められていいパソコン世界の現実の問題なので、お許しもえているので、項を改めて披露しておきたい。
2001 3・28 8
* 以下、加藤弘一さんからのメールを、許していただき掲載する。
* 余計なことかもしれませんが、3月22日の項目にお書きになったいくつかの点について、参考にしていただければと思い、いささか愚見を書きます。
ATOK14の文字表に有るのに、貼りつけると「?」になる件ですが、これは文字を貼りつける側のソフトが、シフトJISモードだからです。シフトJISモードでは、シフトJISにはない文字は「?」になります。
Windows98上でも、一応の知識があれば、ユニコードモードの文書を作成し、シフトJISにない文字を使うことができますが、何もしないとシフトJISモードになってしまいます。
これは文字コードの問題というより、「Windows」の問題です。年内に出るという「WindowsXP」では、ある程度改善されるらしいです。
ただ、ホームページに限定すれば、実体参照方式を使うことで、シフトJISモードのページでも、シフトJISにない文字が出せます。拙サイトの「作家事典」
http://www.horagai.com/www/who/
では、実体参照方式で人名を表記しています。
たとえば、森オウ外は、
森鷗外
とソースに書きこめば、正しい森オウ外になります。「鷗」という記号列がユニコードの「オウ」を表しています。
(実体参照については、加藤弘一著『電脳社会の日本語』岩波新書の220-3ページをご覧ください)。
実体参照に対応していない旧型のブラウザでは、「?」になったり、「鷗」という記号列がそのまま表示されてしまいますが、拙サイトの場合、昨年11月時点で旧型ブラウザ利用者が 5% を切ったので、画像貼りこみ方式から実体参照方式に切替えました。
(新しいブラウザのインストールには、通常、雑誌付録のCD-ROMを使います。付録のCD-ROMには、InternetExplorerとNetscapeの最新版が必ず入っています。きちんとしたインストーラーがついているので、市販ソフトと同じように、数回マウスをクリックするだけで、簡単にインストールできます。拙サイトの来訪者を見ると、大きなバージョンアップがあると、三ヶ月程度で、大半の人が新版に入れ換えています)。
ユニコード文字表で目当ての漢字の番号を見つけるのは大仕事ですし、煩雑な手順が必要なので、わたしは「今昔文字鏡」で字を検索し、「形式を選択してコピー」の「Unicodeタグ(10進数)」で入力しています。「文字鏡」はよくできていて、常時立ちあげておけば、一瞬で目当ての文字が見つかります。前に使ったことのある部首や漢字は履歴が残りますから、「コピー履歴」、「部品履歴」の一覧表からすぐに呼びだせます。
わたしの経験の範囲では、一万字を超えるような文字セットでは、文字表というような形でとうていは把握しきれません。印刷物ではなく、「文字鏡」のよう検索ソフトが不可欠です。
* 文字コードの現状について、私見を書きます。
僻字に関しては、ISO 10646=ユニコードに、すべて入れるということで国際的合意ができていると思います。
「今昔文字鏡」や「GT書体」に収録されている漢字は、異体字を除けば、目下候補を募集中の「拡張C」で、網羅されるらしいです。
中国は継続的に簡体字を追加する必要があるということなので、「拡張C」が終わった後も、何年かおきに「拡張D」、「拡張E」……と、ISO 10646の拡張がつづけられる可能性が高いでしょう。
「文字鏡」など、大規模文字セットに漏れた僻字については、今後の拡張にまかせておいてよいのではないでしょうか。
問題は異体字、特に住基ネットにからむ人名異体字です。
ISO 10646は当初、ユニコードに同調して、漢字統合の方針をとり、異体字収録を制限していましたが、『電脳社会の日本語』205~7ページに書きましたように、日本側関係者のご尽力により、1999年11月に漢字統合を廃止し、ユニコード側も、これを了承したということです。若干、微妙な点があるようですが、「拡張C」候補には相当数の異体字があがっているそうです。
必要な異体字がすべてはいるのならば、ISO 10646=ユニコードに反対する理由はありません。むしろ、国際的な情報交換の基盤として、積極的に普及を応援すべきだと考えます。
目下、求められているのは、日本として、どのような異体字の追加をIRGに提案すべきか、国内的な合意を醸成することではないでしょうか。
ロードマップはわからないのですが、「拡張C」収録字までを含んだユニコードが、一般的なパソコンで使えるようになるのは、2004~6年頃ではないかと推測します(このあたりは文字コード委員会でご確認ください)。その時点で8~9万字の漢字が普通のパソコンで当たり前に使えるようになり、漢字コード問題は解決します。
(包摂規準のずれと、過去の無理な統合の後始末という問題はありますが、どちらも過渡的な問題でおさまりそうです。)
* さて、住基ネット(住民基本台帳ネットワーク)です。
住基ネットは、当初、代表的な人名異体字を収録した独自文字コードと、画像貼りつけを併用し、画像貼りつけを使う何パーセントかの人は、氏名が端末から入力できず、住民票の交付を受けるには、住民票番号を使うしかないというとんでもない設計だったようです。
住民票番号が必要になるのは、画像貼りつけの人だけではありません。
電子政府構想では、政府関係のシステムは文字コードはユニコード、サーバーはUNIX、端末はWindowsでやることに決定していて、実際、その方向で着々と整備されています。もし、住基ネットだけ独自文字コードを使われたら、個人を特定するのに住民票番号を使うしかなくなり、国民総背番号制に進まざるをえません。
最近、ある筋から情報をいただいたのですが、昨年12月に、あの設計では住基ネットは政治問題化するから、ユニコードにすべきだと、自民党有力者に進言する人がいて、事態の重要さに気づいた有力者は、旧自治省系官僚を押さえこみ、住基ネットをユニコードでやるように方針を転換させたということです(「有力者」といっても、次期総裁候補に名前があがっている人ではありません)。
これで最悪の事態はまぬがれたわけですが、住基ネットに必要な人名異体字がユニコードにはいらない状態がつづけば、またぞろ、国民総背番号制に向かわざるをえません。
本当は、必要な異体字がすべてユニコードにはいるまで、住基ネットを凍結すべきですが、当面は外字としてあつかい、正式にはいった時点で変換するという抜道があり、総務省はその方向で検討をすすめているらしいです。
「拡張C」の締切は今年の9月と聞いています。なんとかそれまでに、住基ネットの人名異体字を総務省に提供させ、日本提案として、IRGに追加を申請する必要があるでしょう。時間はあまり残されていません。
以上、思うところを長々と書きました。参考にしていただければ、幸いです。
* とても理解の及びかねる部分も有れば、ああそうかと教わったり、先に希望をもったり案じたりの問題も含まれてある。このように親切な手引きにあずかることに感謝している。
* 文字コード委員会でも他の場所でも、わたしは、たいてい発言者へまっすぐ顔を向けて、頷き頷き聴き入るようにしている。しかし、話の分かっていない場合も少なくない。人はああ分かっているのだと想像するだろうが、そうでないことがママ有る。それはおかしいではないかと言われそうだが、分からないから横を向いてしまうと、それはもう完全なお手上げの放棄になる。自分で自分に分かろうという姿勢を棄てさせるともさらに深い穴に落ち込むので、わたしは、わたしを分かる方向へ仕向けているのである。そうでなければ、わたしが電子メディアの世間で発言したり行動したりなど、もともと出来るわざではないのだ。
文字コード委員会で「講習会」しましょうといった提案もだから出てくるのであり、つまり、こいつを見放すわけには行かないなという親切なのだと、感謝しているのである。 2001 3・28 8
* 東大の西垣通教授から岩波書店版『インターネットで日本語はどうなるか』が贈られてきた。
多言語情報処理や機械翻訳はどこまで進歩しているのか、と帯に書いてある。さしあたりそんな難しいことは、見当もつかない。「日本人にとって英語とは何か」も、興味はあるが当面パス。だが「コンピュータの可能性と課題」には目を通して置かねば。
わたしにも関わりのあるのは、「日本語はどうなるか」だ。ここでは、「インターネット多言語情報処理環境」と「ナショナリズム対グローバリズムを超えて」が、論じられる。文字コード問題にも当然触れられるだろう。たぶん、分からず屋の文筆家発言はかなり窘められているかも知れないが、或る程度は余儀ないことであり、或る程度は我々との関心のずれも読みとれるかも知れない。
世界語のなかで「日本語」の位置づけなど論じられているとしたら、そういう日本語の在りよう
べつに、わたしなどは、日々に「日本語」を用いての「表現」や、また東洋語の「再現」「研究」について、さらには、それにつれて日本語の表現力にどんな質的影響がもたらされるであろうか、などに強い関心を覚えている。委員会等でのわたしの発言は、基本的にここを土俵にしていた。
文筆家たちは、このコンピュータ世界ではひどくひどく出遅れた。いまなお大変に遅れている。知識もなく、やつとあとを追い始めたとき、知識を持って先行していた人たちは、はるかな先まで走っていた。その人たちのコンピュータや文字問題を語る言語は、後続車からははや外国語に等しいほど難しかった。だが、いや、だから、我々はあまりに出遅れた分をハンデにしながら、考えたり、語ったり、要請したりせずには済まなかった。いやもう、その出遅れたるや、おそるべき程度に出遅れていたのであるし、それと同等に、先行していたコンピュータ知識人たちは、広義の日本語・東洋語文筆家たちのことを、アタマから蚊帳の外に放り投げ過ぎていた。それは、ハッキリ言って勝手が過ぎたものと咎められて仕方ないとわたしは思っている。
あげく、あまりに狭い範囲での狭い実用のためのコンピュータ言語をあやうく固定化しかねない有様であった。「表現」の微妙な価値など考えてもいなかったし、読書や研究を無視した「実用」だけの一人旅であった。「表現」と同行二人ではなかったのだ。
やっとそれに気づいた我々の側が、知識の不足は覆いがたい迄も、気のつく限りの故障を申し立て、希望し、大声を上げなければ、先行していた関係者は聴く耳すらあまり持ちたがらなかった。それはわたしが実感した事実だ。だから、早く言っておかねばならぬ事を、適切な言い方すらわきまえ得ないまま、とにかく言って置く必要が是非あったから、文筆家のごく少ない人数は、誰彼なく、機会あるごとにいろいろ発言したし、その発言もばらばらで、矛盾も撞着も無知も失見当もあった。それが分からずに言うのでなく、分かっていた。わたしなど、何を言うときでも、己れの無知は承知の上だ、だからトンチンカンを言っているだろうが、理解すればすぐ改めるからと、いつもいつも断り断り発言してきたものだ。
そういう段階を、われわれは、まだ抜け出てなどいない。わたしは、少なくも、抜け出ているとはよう言わない。だから「講習会」ハイ有り難うと受けるのである。
西垣さんたちの議論は、とても深い。学問的であると謂えよう。それに学びながら、しかし、まだまだ日本語の文筆家もその団体も、おめず、臆せず、希望を述べ意見を述べ故障を言いたて愚痴も言い立てて頑張るべきである。なにも、この十年、二十年で片づく問題とは思われないのだから、現段階では知識人の厄介がる技術的な煩雑なども、電脳優秀人がうそのように解決してくれる時もあり得るのだから、専門家の前にあまり遠慮ばかりしてひれ伏すべき段階とは思わない。
器械で日本語や東洋語を読んだり書いたり、研究したり表現したり、そんなとんでもないことを始めたのは、つい昨日のことで、結論じみた議論などなくも我々からは出せるわけがない。分かっていることは、このコンピュータは、しぶとい文明であり、インフラとしてかなり長期に人類社会に生き延びる可能性をもつと思えることだ。今日の専門家の理解であれ、百年後には、子供の目にも子供以下に見られてしまうかも知れないほど、状況は激しく変わるだろう。進むだろう。それぐらいのことを思いながら「言語」「日本語」「東洋語」の運命や力を永い永い距離でみるならば、今は目前のこぜりあいも盛んにすればよく、また茫漠とした大きな空想に類する不経済な視野すらも持って良いだろう。
わたしは、そう考えている。
* 共立出版から「インターネット時代の文字コード」という編著も出て、文字コード委員会で購入を勧められた。おそらく最善の解説と指導とが書かれ語られているであろう、が、こういう時期の一つの特徴として、問題を整理したい意向の中に、ある種の固定化や狭隘化、大きな大きな文化的展望の欠落なども有って不思議はない気もしている。謙遜に勉強しながら、とかく専門家のそれゆえに陥りやすい盲目ということも有るのは、どんな学問や専門の領域にもみうけることである。ことに言語や文字ともなれば、思いがけない文化的な視野と視点とが隠れているものである。それを懼れて、専門家はとかく問題の範囲を絞ろう絞ろうとし、大事な指摘や関連問題などを、今はそれは無関係だと過度に排除したりする。それが「専門的」という意味だと言わぬばかりに。だが、少なくも文字や言葉による理解や表現に関わることは、十の所を三十にも五十にも汲み取らねば済まぬこともある。例えば文字コードも、そのごく限局された技術的な課題・話題に過ぎない。文筆家にとっては、「文字コード」をたとえ主題にしていても、それはいわば通路のようなもの、越えねばならない老の坂のようなもので、「表現」とか「研究」とかいう本能寺は、べつにある。それへのメリットを絶えず考慮していなければ済まないから、文字コード問題にも関与するのである。そういう趣旨の「講習会」も、逆にしてあげねばいけないのかも知れない。怒られるかな。幸い、わたしたちの電メ研には、西垣さんも坂村さんも委員として参加していただいている。しっかり学んでゆきたいし、ご指導をぜひ願いたい。
2001 3・29 8
* 西垣通さんの新刊本『インターネットで日本語はどうなるか』で、第二部「日本語はどうなるか=インターネット多言語情報処理環境」を読んでいる。
改訂された新JISの漢字は6355字、これだけが器械で文字コードをエンコード=与えられていること、更にJIS補助漢字5801字が追加されているものの、これは事実上「文字集合」としてエンコード候補にされているだけで、「現在でも、日本の大半のパソコンやワープロで使える漢字は」さきの、「6355字」に「限られている」ということまでを確認した。合計して「12156字」がJISの「文字コード」なのではない。日本国内にあってもなお文字化けなしに多方向に使えるのは「6355字」だけ。
使用頻度だけでいえば、おそらくこれで九割近くカバーしているに違いなく、だから理工系・経済系、文部省系は、十分だとしてきた気味がある。ところが、予想される漢字の数は、学者により、最大200万字ないし以上とすら言う。大幅に割り引いて仮に10万字としても、JIS漢字は、全体の 10 パーセントにも遙かに足りない。そしてそれら夥しい数の全漢字は、現に一度は使用されたことがあるから「存在している」と、これは原則として認めねばならない。過去の文物の研究上、そんな稀用文字など、抹殺してもいい、無視してもいいと謂える権能を、たかだか「今日生きている」だけに過ぎない我々が、無条件に持てる道理がない。それこそ甚だしい傲慢で越権だといわねばならない。釈迦も孔子も、日本書紀も名月記も殺してしまうことに成りかねない。
そこで、「文字集合」と「エンコード」との、果てしない道程における、「リーズナブルな折り合い」が必要になってくる。「文字集合」がどう完備されようと、十全なインターネットで機能するには「エンコード」を経なければその価値に限界のあるのは明らかだからである。現に「JIS補助」の5801字も、絵に描いた餅に近似している。その辺までは、わたしにも、もう、だいぶ以前から理解できている。コンピュータは、例えば「わたし一人の器械」でだけ何とかなれば済むという器械では本来ないはずである。それなら昔のワープロにすぎない。世界中のあらゆるユーザーに無条件・無前提に通用する器械として偉大なのではないか。
そういう理解の上で、なお、わたしは、漢字は「原則」「全部必要」説をとり、「確認不可能=当たり前」であるその観念としての「全部」から、「リーズナブルな折り合い=判断」により、賢明に「引き算」し、現実問題として、「文字集合=文字セット」に「文字コードを与える=エンコード」あらゆる技術的・学術的・実用的な対策と研究へ「前進」してくれることが大事だ、と主張し続けてきた。必要になったら足すという「原則」にもならない原則は姑息だと批評してきた。
「エンコード」は少ない方がいいのだと言う議論の背景には、正にいろいろあるのだろう、が──莫大な金がかかるという経済的なことも、検索の煩雑などということも──、それはそれとして、文化的には、コンピュータが真実人類社会のインフラとして揺るぎなく定着の可能性があるのなら、なおさら、どんな桎梏も克服されてゆくことに「原則的な希望」をもつことが、それを断念し放棄することよりも遙かに、大事だと考えるのである。今が今にも直ぐというような事は、わたしは一度も言わない、最初から。
しかし「原則」を曲げようとも、放棄しようとも、断じて言わなかった。
技術の問題は、いわば坂村健さんたちが、時間をかけて達成してくださるものと信じたい。検索にも飛躍的に簡易化した道がひらかれるものと期待したい。
金のことは大事だけれど、極端に言えばそれは一私人の知ったことでなく、それこそ国と行政とが国家や民族の文化に誇りを持って「大きく永く対処すべきこと」というに過ぎないのである。
* この辺までは「講習」を受けようが受けまいが、原則の認識として、あまり変わり様がない。ことは「文字コード」のレベルに終始した話なんかではありえないのだから。「文字・言葉・表現・研究・受容」という「文化」そのものの問題なのだから。これを外しては、国語の表現者、東洋文化の愛読・愛好者としての自己放棄に繋がってしまう。ここの所を、この「コンピュータ世間での先行者たち」に説き続け、希望し続けることが、目下わたしなどの要務なのである。分かってもらわねばならない。その上で初めて「折り合う」必要が生じ、「折り合う」ことが可能になる。
2001 4・3 9
* 西垣さんの本を読み継いでいる。知識が整理されてゆく。へえっと、視野の開ける気分と、ふっと立ち止まる時とがある。「JISコード」では第一第二水準の6355字しか使えない、現在までは。だが、国際的に「ISO=国際標準化機構」による国際共通コードを経て、主として米国企業の共同と主導とによる「ISO10646-2 UCS=ユニコード2」にまで用意されて、「万国共通コード」への態勢が出来てきたという。
これの説明には、まだ理解の届かない箇所がわたしには残るが、目の前のかなり明るくなることも書かれている。「現在、すでに『ユニコード2』は、ウィンドウズ2000やウィンドウズNTといった新しいパソコンOSの内部コードとして用いられている」と。わたしのこの今の器械は確かウィンドウズ98だからダメなのだろうと分かる。ぜひ近いうちに、そのウィンドウズ2000やウィンドウズNTといった新しいパソコンに出会いたい。もう売っているのかな。
そして、こう書いてある。「ユニコード2」の「文字集合」は38885字と。そのうち「漢字は20902字」と。おお、それほどなら、もう「?」など出てこないのだろうな、だが、待てよと。
ここに西垣さんは「文字集合は三万八千八百八十五字」と書いているがこれらにすべて「万国共通の文字コードが与えられている=エンコードされている」とは書いてはいないように読める。わたしには分からない。これが、たんに「エンコード以前の候補文字集合」の意味ならば、つまり実装されていないのなら、先の望みはあるが、今は絵に描いた餅に過ぎないという「?」の継続というわけだ。
そうなると、「UCS=ユニコードは、その後、引き続いて拡張されている」と、漢字は「27786字」が「収容されている」としてある、景気のいい話にも、明らかに「文字集合は」とあって、このあとへも威勢のいい数字がまだまだ続くのだが、それらもみな「文字集合」として「文字コード」をいつか与えられるであろう「候補文字」に過ぎないのかも知れない。この辺は西垣さんの叙述をどう受け取っていいのか、わたしには、明快に分からない。
それというのも、先日の文字コード委員会でも、わたしの発言に対して苦笑まじりに「実装」の話は「マイクロソフト社の問題」で、希望があればそっちへデモをかけてくれという幹事の解説があった。「文字コードと実装とは別の問題」なのだと言われた。しかしながら、わたしなど初心のユーザーからすれば、「文字コードと実装とは別の問題」なのではなくて、「文字集合と文字コードの実装とは別ごと」なのだと言われているように感じるのである。文字コード委員会といいながら、実は将来「文字コードを与え=エンコード」すべき「文字集合を補充」の委員会のように思われるのである。べつにそれはそれで必要な作業だから宜しいが、あくまで「ユーザー」感覚で言わせてもらうなら、要するに文字セットで漢字を引き出しても「?」しか出ないようなのはイヤである、そんなす不備を解消したいという希望が先だって来るのだ。要するに万国共通で使える「文字コード」をもった漢字を、候補のママにしておく期間を短くできないかという希望が先立つのだ。
まして西垣さんの本に上げてあるように数万字もの追加が検討されているのはともかく、「ISO10646?2」の「二万九百二字」をただの「文字集合」にしておかずに、「エンコード」して使い物になれば有り難いなと思うのである。わたしは、「全部必要説」の「引き算」論であるにかかわらず、一方、当面は「二万字」が目標だとも発言してきたのだから、もし新しい器械を買ったその日から「20902」字が利用可能なら、当分は「文字コード」問題を専門家にあずけておいてもいいかなどと思ってしまうほどである。
だが、西垣さんの本は、いまのところ、この辺がよく読みとれないので悩ましい。さて、「講習会」で「文字コード」の専門家は何をどう教えてくれるのだろう。
2001 4・3 9
* 西垣さんの本を座右に、器械を扱いながらの「間合い」を利して、じつに少しずつ少しずつ読んでいる。今、104頁まで読んで、計画中の「ISO10646-2」が実現してゆくとUCSに「収納される漢字の総数はやく七万字近くになるはず」とある。これは言われるまでもなく康煕字典や諸橋大漢和辞典の収容字数を超えている。ただし、「文字集合」の段階なのか、ここに謂う「収容」とは「実装=エンコード実現」なのかが分からない。「新拡張JIS」のところでも「収容された漢字は」とあるが、「収容」の意味が正確に掴めないでいる。
それにしても「インターネット上の国際共通文字コード・システムは、すでにUCS(ユニコード)の路線でほぼ固まった。」「近々、あらゆる国の公用語で使用される文字群は、すべてUCSに収納されるはず」と聞くと、明るいような気分になるのだが、「使用」と「収納」との間にどんな距離があるのか、文字は集合収集されているけれど、文字コードを与えられてOSの中に「実装」されているわけでは全然ないのか、が、心許ない。
使用語彙の定義が確定していると、その定義に沿って語彙が選ばれる、それが科学だと思われるから、この場合、微妙なところで定義不明のため「叙述」が理解へまっすぐ飛び込んでこない。たんにまだ絵に描いた餅が大盤振舞いの数字としてだけ大山積みなのか、第一・第二水準の段階以上に、どの辺までが、どんな器械でなら「インターネットで無条件に万国使用」できるのか、わたしの不慣れもあり、愚鈍もあり、どうにも掴みにくい。
収納されたら、使用できます、というのであれば、これから文字コード委員会は、何をするというのか。ぽつぽつと康煕字典や諸橋大漢和にもない漢字を探し続けるのが「仕事」なのか。どうも、収納したが、使用できるわけではないぞというように、疑心暗鬼、読めるから悲しい。
そんな、愚痴を聞き止めて、「ほら貝」の加藤弘一さんから、助け船が入っている。わたしのような人もまだ多い故に、広く伝えさせて欲しいとおゆるしを得たい。
* 多分、「わかった」とお考えになっておられる事でも、誤解されているのではと危惧しております。
どの分野でもそうですが、暗黙の前提がありまして、長く係わっていると、暗黙の前提を周知の事実と錯覚してしまうようです。
暗黙の前提としたことを、4月3日の条に即して、説明いたします。
> これの説明には、まだ理解の届かない箇所がわたしには残るが、目の前のかなり明るくなることも書かれている。
「現在、すでに『ユニコ>ード2』は、ウィンドウズ2000やウィンドウズNTといった新しいパソコンOSの内部コードとして用いられている」と。わたしのこの今の器械は確かウィンドウズ98だからダメなのだろうと分かる。ぜひ近いうちに、そのウィンドウズ2000やウィンドウズNTといった新しいパソコンに出会いたい。もう売っているのかな。>
Windows2000とは昨年出たWindowsNTの新版のことで、プレインストール(OSをはじめから組みこんであること)したパソコンは、かなり前から売っていますし、現在お使いのパソコンに、Windows2000を組みこむことも可能です。年内には、Windows2000の新版がWindowsXPとして発売されます(XPは評判がいいです)。
つまり、 WindowsNT → Windows2000 → WindowsXP というように、出世魚よろしく、名前が変わっているのです。
Windows98でも、ユニコード文書は作れることは作れます(ユニコードは、実装されています)。しかし、Windows98でユニコードを使うには、めんどくさい手順が必要です。WindwosXPでは、簡単に使えるようになるらしいので、発売までお待ちになった方がいいでしょう。
ただし、読むだけでしたら、Windows98でも、ソフトがユニコードに対応していれば、ユニコードを使った文書を普通に読むことができます。ソフト未対応なら、「?」になります。これはWindows2000でも同じです。(画面上で、こっちはユニコードモードのウィンドウ、あっちはシフトJISのウィンドウと、ウィンドウによって使う文字コードが異なるケースが生じます。過渡期なので、仕方ないです。)
UCS=ユニコードの漢字セットですが、次のようになっています。
1. CJK統合漢字 約二万字 Windows98、WindowsNT(Windows2000)などに実装済みです。
2. 拡張A 約七千字 いつでも実装できますが、まだ実装例はない?
3. 拡張B 約四万二千字
今夏に正式決定されますが、すでにエンコード済みです。
4. 拡張C ? 今年九月まで候補を募集中。 漢字統合をやめたので、異体字がはいります。
「エンコード」とは、文字に符号(文字番号)を与えることを言います。「1」から「3」までの七万字が「エンコード済み」です。
「実装」とは、文字データをOSに組みこんで、「実際に使える」ようにすることを言います。Windowsには、「1」の、2万字すべてではなく、XKP協議会が選んだ1万7千字ほどしか実装されていないのですが(この数字はうろ覚えで書いています)、それは日本で使うことのまれな中国や韓国の文字の一部を、コスト的な理由から、はずしているからです。(ひょっとしたら、Windows2000には、2万字全部はいっているのかもしれませんが、文字コードから離れているので、わかりません。最新の情報は講習会でお聞きください)。
「拡張A」はいつでも実装できますが、Windowsにすべて実装されることは、多分、ないでしょう。幹事の方が、「マイクロソフト社にデモをしろ」と言ったのは、その意味だと思いますが、「僻字がほとんど」なので、無理に実装する必要はないと思います。
「拡張B以降の実装」は難しいです。サロゲートペアという特殊な方法で実装するので、拡張Aまでのように、フォントをいれれば、即、使えるようになるという具合にはいかないのです。しかし、これも時間の問題です。
「拡張B」が使えるようになれば、7万字、「拡張C」で9万字程度までいくと思いますが、Windowsにフォントがはいるのは、「せいぜい二万字程度ではないか」と見ています。それ以上のフォントは、必要な人だけがいれればよいということになるでしょう。5万字からのフォントをダウンロードするには、現在は一晩がかりですが、「拡張C」が使えるようになる時点では、5から6分でダウンロードし、自動的にインストールされるようになっているはずです。
* これは、嬉しい、有り難い、明快なお話で、こんなふうに、これまでも委員会等で聞いていたに違いないのだろうが、容易なことに耳には入りきらなかった。
* さて、かくて、わが文字コード委員会の目的の大きな一つは、「4. 拡張C ? 今年九月まで候補を募集中。 漢字統合をやめたので、異体字がはいります。」いう、これらしい。要するに、「エンコードするための文字集合づくり」だということらしい。誤解かも知れない。当たり前じゃないかと謂われるかも知れない。いずれにしても、どうやれば、「?」としか出ないような器械から、欲しい漢字が引き出せるのかという、ユーザーとしての貪欲が満たされるような、満たされにくいような、曖昧な按配である。かなりの「魔法」に通じれば、今でも二万字ていどまで呼び込めるらしいが、魔法使いにはなかなかなれない。ならなくて済むようにしたいものだ。「漢字が足りない」という段階の議論が、もう全然不要なのか、原則不要なのか、まだまだ喧しく言わないと文字集合での大渋滞こそあれ、文字実用には相当の歳月待ちとなるのか。目が、やはり、放せない。なんだか、もう全部解決したという明るい話では、やはり、ない、のだと思うことにしておく。
加藤さんに、心よりお礼申し上げる。
2001 4・4 9
加藤弘一さんから貴重な「教科書」を追加していただいた。
* もうすこし詳しくご説明いたします。
ワープロでも、ブラウザでも、メールソフトでも、ソフトを立ちあげると、ウィンドウが開きます。
シフトJIS対応のソフトですと、そのウィンドウはシフトJISモードのウィンドウになり、6700字種しか表示できません。
ユニコード対応のソフトですと、そのウィンドウはユニコードモードのウィンドウになり、2万字種(Windowsでは若干抜けているので、1万数千字)が表示できます。
ウィンドウに表示されている語句をコピーしますと、その語句はメモリー内の「クリップボード」という場所に格納されます。
シフトJISのウィンドウからコピーした場合、シフトJISであるという識別符号をつけた上で、格納します。ユニコードモードのウィンドウからコピーした場合は、ユニコードであるという識別符号がつきます。
「クリップボード」内の語句を貼りつける際は、貼りつけ先のウィンドウがシフトJISモードなのか、ユニコードモードなのかを調べます。
シフトJISの語句をシフトJISモードのウィンドウに貼りつける場合は、そのまま貼りつけます。ユニコードモードのウィンドウに貼りつける場合は、ユニコードに変換してから貼りつけます。
ユニコードの語句をユニコードモードのウィンドウに貼りつける場合は、そのまま貼りつけます。シフトJISモードのウィンドウに貼りつける場合は、シフトJISに変換してから貼りつけますが、シフトJISにない文字の場合は「?」にしてから貼りつけます。
こういう作業を、Windowsは自動的にやっているのです。
Windows98はユニコード機能が完全ではないらしく、できるはずのことができない場合があります。
うちのマシンですと、ユニコードにしかない文字を自由に書きこんだり、はりつけたりできるのは、MS Word2000とMS IME 2000の組みあわせの場合だけです。秀丸は使っていませんが、使っている人によるとできるそうです。
ユニコードに対応しているはずのNetscape Composerなどでは、シフトJISとWindows外字にない文字は書きこめなかったり、貼りつけられなかったりします。
Windows2000は、1万5000円程度で買えますが、メモリーを256Mくらいに増設しないと、苦しいようです。現在のメモリーの量は、パソコンのスイッチをいれた時、最初に黒い画面にでてくる数字でわかります。メモリーは1万円から1万500円くらいでしょう。合計3万円あれば、大丈夫です。
ただし、かなり難しい作業なので、お弟子さんにやってもらった方がいいです。
>* 西垣さんの本を座右に、器械を扱いながらの「間合い」を利して、
>じつに少しずつ少しずつ読んでいる。今、104頁まで読んで、計画中の
>「ISO10646-2」が実現してゆくとUCSに「収納される漢字の総数はやく七
>万字近くになるはず」とある。これは言われるまでもなく康煕字典や諸
>橋大漢和辞典の収容字数を超えている。ただし、「文字集合」の段階な
>のか、ここに謂う「収容」とは「実装=エンコード実現」なのかが分か
>らない。「新拡張JIS」のところでも「収容された漢字は」とあるが、
>「収容」の意味が正確に掴めないでいる。
エンコード=実装ではなく、収容=エンコードです。
常用漢字表とか、康煕字典のように、コンピュータと無関係に作られた文字集合の場合は、エンコードされていませんが、文字コードのために作られる文字集合は、暗黙のうちにコード構造が決まっていて、文字集合にはいった時点で、なんらかのコードがあたえられています。
文字コードは、英語では coded character setと言います。直訳すれば「符号化文字集合」です。
ただし、一度作られた文字集合に、最初とは別の符号がつけられる(別のエンコードがおこなわれる)場合があって、その結果、文字集合とエンコードが分離しているように見えるのです。
なお、文字コードにはいることと、その文字が実装されるかどうかは別問題です。
芝居でいいますと、エンコードするというのは、一場面として、台本に書きこまれることです。実装は上演にあたります。いくらいい台本を書いても、上演してくれるところがなければ、画餅で終わりますし、上演にあたって、場面がカットされることもあります。
西垣先生の御本は拝見していませんが、「文字集合」と「エンコード」を分離して考える立場に立っているように見受けられます。この立場をとられる方は多く、わたしも以前はそう考えていたのですが、歴史的に見ても、いささか問題があります。
現状を見れば、確かに「文字集合」と「エンコード」は独立しているかのような形ですが、歴史的に見ますと、両者は一体のものなのです。
漢字コードの元祖というべき日本のJIS C 6226は、最初にコード構造(入れ物)ありきで、そのコード構造でエンコードすることを前提に、最大8000字という枠で文字集合(中味)を決めていきました。
ユニコードにしても、エンコード上の制限から、最初に3万字という漢字枠の上限が決まっていました。はいりきらないことがわかって、後でサロゲートペアという裏技で増やしたのですが、最初に3万字以内に収めようと無理をして漢字統合をやった結果、ややこしいことになっています。
JIS C 6226は情報交換用の文字コードで、内部処理に向いていないので、シフトJISとEUCという内部処理用の文字コードが作られました。
内部処理用ですから、JISコードに変換してから外に出さなくてはいけないのですが、当時の技術者の文字コード理解が不十分だったために、シフトJISやEUCのまま、外部に出し、情報交換に使いはじめました。
その結果、6700字の文字セットにJIS、シフトJIS、EUCという三つの異なるエンコードがあるかのような状況が出現し、いろいろな混乱が生じました。難しいものです。
* こんなに要領の掴みやすい解説は、とても「私」にはできない。関心や興味のある人たちに加藤さんの理解を分けて差し上げたく、書き込ませていただいた。その気のある人は大いにご勉強願いたいが、わたしの文字コード委員会へ参加の経験から言うと、これでも、下地がかなり無いと、知らない外国語を聴いているのと同じなのである。わたしは、幸い、薄い色をもう何度も何度も何度も塗り重ねてきたので、だいぶ読みとれる。それでも誤解する。投げ出さないだけである。
2001 4・5 9
* 文字コードの勉強をしていて、自然「ことば」と「文字」「書字」「活字」「電子文字」等についてある種の思索と理解とか生じてくる。自分の考えは基本的にもともとどんなものであったかを整理しておく必要がある。
わたしは、難漢字、稀用漢字といえども、無用であると言える人はいないという説である。過去に用いた人と文献とがあるかぎり、その使用者と使用された文物とを無視し去る権能など、たまたま現代に生まれ、やがて後生に席を譲って退場するわれわれの持っている道理がない。過去の使用者に対しても、未来未然の利用者に対してもである。だから、たかだか近現代の小さな理屈だけで、あまり安易に漢字はこれだけあれば十分などという尊大で傲慢な態度は原則的に排したいという考え方をしている。だから、「全部が必要、だが、全部などというのは漢字の場合一種の観念に過ぎないのだから、リーズナブルに引き算の必要なことも当然」というのが、わたしの「原則引き算説」である。「全部が必要」は理想に過ぎないと言われたときに、わたしは「理想」ではない、「考え方の原則」に過ぎないと、言下に反論したのを記憶している。なんでもかんでも「多々ますます弁ず」などという不自然な「全部説」ではないことを、今一度確言しておく。
では「リーズナブルな引き算」とは何か。何を「原則全部」から引いてゆくのか。当たり前だが、第一に、先ず「その所在自体が捜索不能」なものを、無理やり探すことは出来ないのだから、当然に引く。どれほど在るのかも、誰にも分からないだろう。但し幸いに発掘できて、意義も出典もわかり、包摂になじまない自律した漢字は、ともあれ保存収集する。当然のことである。
次に、「包摂」という考え方を、原則として強く容認し、同じ意義と用字法をもち、あまりに偶然の書法=書き癖・筆癖・気まぐれ・誤記等で、形に変化こそあれ本来「異字」度の希薄な異体=異形字は、賢明に包摂し、大胆に整理することで、大きく「引き算」する。将来にわたる原則的な大課題として、包摂による引き算を敢行する。もの凄い数の、本来は同じ意義と用意の、ただ偶然の書字癖や写字癖や誤解にもとづく異形字・異体字・放恣な造字等が淘汰されるであろう。これは、最初に述べた「尊大・傲慢」とは、全くべつごとの当たり前の処置である。なぜなら、伝えられた漢字の殆どは、「手書き」されてきた歴史・時間が圧倒的に長く、「手書き」の偶発的な変容・変態・変形に一々重きを置くことの非合理なことは、あまりに明白だからである。
当然次には、アイデンティティの名においてされる「氏名・地名」漢字における、あんまりな異形字・異体字は、これを整理し包摂するのを「原則」とし、「引き算」を有効に進めるべきである。それには意識改革等を働きかける「現代の知恵とキャンペーン」とが相当の時間必要であろう。言うまでもなく、これらを原則として整理してゆく作業もまた、「尊大・傲慢」には当たらない。異民族による弾圧的な創氏改名は知らず、人間や家系のアイデンティティを、奇抜な漢字使用の固守で計ろうなどと謂うミスチックな思想の方が改訂されてゆくべきである。 わたしの姓字も戸籍謄本では現用の「秦」とはかなり奇妙に異なる字形で、どんな文字セットにも入っていないが、困るとは思わない。戸籍の方を直したいとすら考えている。「秦」は秦の文字形で活字社会では常用され、同じ一つの意義を広く認められている。それでいいではないか、戸籍謄本どおりの字でないとアイデンティティが失せるなどと謂う衰弱した思いは、わたしには、無い。拘泥しないで包摂に賛同してくれる人の増えてゆくように、現代思潮を先導してゆく働きなどをこそ「文字コード委員会」も持つべきではないか。
今夜は、この辺まで。
2001 4・9 9
* さて、次の月曜の文字コード委員会の幹事さんから、「宿題」が出されてきた。議事は公開されるのであるから、問題を広く共有して貰う意味からも、以下にその宿題をかかげる。
* 2.事前準備
次回の議論のために、以下の件について、ご意見をまとめておいて頂ければ幸いです。 文書にしてご持参頂ければ幸いですが、間に合わない場合は、口頭でのご発言でも結構です。
前回の委員会で、次のような漢字の実態モデルがほぼ合意されました:
漢字の全体像を最初に把握することは非常に困難である(青天井問題:多分、大掛かりな調査の結果として、これでこの時点での全部と想定しようと合意できる程度ではないだろうか)。 従って、全ての漢字を集めておいて、必要部分を切り出すこと(あるいは収集そのもの)。あるいは、漢字の標準化グループが、そのグループとして漢字を集めつづけることには限界がありそうで、いずれは要求ベースでの対応へ移行せざるを得なそうである。
このことは、独立字種と異形字の両方に言えることである。また、これで十分という字種や異形字は、応用や個人・団体、また時代・時期によって異なり、画一的なこれでいけるという漢字集合を作ることも困難そうである。
この時点で、字種不足問題に関して、二つの独立した課題が出てきます。
– どこまで(どの程度)、漢字標準化グループが漢字の収集を積極的にすべきか?
– それに入らなかったものを、誰が・どこに・どのように提案し、誰が・どのように審査をし、どう規格に反映させていくか?
この二つの課題にたいしての事前準備をお願いします。くわしくは、
2?1. どこまで収集するか問題
まず、先日来ご紹介している、拡張統合漢字Bまでは、規格化されるという前提で、かつ、これ以上漢字の追加をする必要はあるという前提で(不必要と思われる方は、それの理由を説明してください、またこれ以上の収集は非現実的と思われる方は、その理由をご説明ください)、
a. 1年以内に、ある種の漢字群を“漢字規格化グループ”が選んで規格化すべきとすれば、どんな出典などを洗うべきでしょうか?
b. また、もっと長期間を考えた場合には、どの範囲までを何時頃までに終えると実際的な実現可能であると考えますか?
2?2. 提案制度について、
上記の自主収集の先は、提案制度になろうと想定されます。
a. 提案制度は可能と思いますか?
b. どんな問題点が想定されますか?
c. 審査機関は、どのようなものが考えられますか?
d. 提案は随時受け付けられるとして、規格への反映頻度はどの程度が現実的と思われますか?
2?3. ところで、(異形字の議論にむけて)
現在の字種そのものについて、新字種は上記で追加するとして、現存の字種の漢字の変形の包摂範囲は実用上十分ですか? もっと包摂すべきですか? もっと細分化すべきですか?
おおむね以上のような議論を中心に次回は進めたいと思います。 大変難しい課題ですが、ここをクリヤしないと、結局文字不足問題は解決しません。 ぜひご協力をお願いいたします。
* 会議日までに二日間しかない今の時点で、これだけのことにレスポンスできる力はわたしには有りそうにない。しかしまあ考えてみなければならない。
例えば昨日のシンポジウムに出ていた編集者達は、こういうことを考慮しているだろうか。していないように思われる。紀伊国屋ホールを満員にしていた大半が編集者達であったが、彼らから機械の「漢字」や「文字コード」についての声はあまり聞こえてこない。問題がないからではない、どう問題にしていいのかを殆ど知らないのではないかと憂慮される。彼らも漢字の足りないことは知っていて、切実に困ってはいるが、文字コード委員会にいわゆる出版社の編集者は一人もいない。国語学者はいるらしい。通信社の人もいる。しかし作家は全くもってわたしが唯一人である。国文学者も歴史学者も仏教学者も詩人も批評家もいない。そういう偏った世間で、こういう宿題が出て、結論が導かれ、国際的な場に日本の意向のようにして提出される。
漢字の問題はもう程々にしようではないかという結論へ流れてゆく恐れがあり、わたしの人文的な要望は、現実的には技術と経済と実務との「もう足りています」と言う多数の声のもとにかき消えてしまうのではないか。電子出版を語り編集を語っていたあの人達の考えているのは、先ず明らかにいま「多数の声」といった声たちの満足とは、かなりかけ離れていて、わたしの念頭に置いている方面の著述・著作をもっぱら考えている。だが、その仕事の「根」に置かれねばならぬ漢字と機械との関わりには、何の力も努力も及ぼそうとはしていないように見える。出版文化を語る人たちの暢気さであるまいか。
2001 5・11 9
* 午前中は、昨夜深更来の、文字コード委員会用の作業を続行していた。くどかろうと何であろうと、わたしは、考えていることを繰り返し伝え伝えして倦むことがあってはならないからである。幹事の一人から、あまり愉快でないレスポンスがあり、それにも強い言葉で対応しなければならなかった。たとえばわたしのホームページに「文字コード」で親切な示唆を送ってくれる人にまで「生半可な入れ知恵」などという無用の批評がしてあり、いい態度とは受け取れなかった。そういう空気の中で投げやりにならずに孤独に語り続けるのはスゴクしんどい。
2001 5・12 9
* 第四回文字コード委員会が御成門の技術振興会館で開かれ、出席してきた。先日、突如メーリングリストで幹事からの宿題が伝えられた。メーリングリストで送信すると、参加している全委員ないしオヴザーバーに同時に伝わり意見交換できるのだが、それとは別にわたしは「文字コード」の自分なりの学習と感想とを、かなり長いので、石崎委員長と二人の幹事にだけ参考までに提出して置いた。小林幹事と二往復の意見交換があった。その上で「宿題」に答えるものをメーリングリストに送った。宿題への解答自体は、まさに「とりあえず」のものであったが、その前書きに考えを纏めた総括を置いた。何のことはない、この「私語」の四月九日の項をそのまま冒頭に添えたに過ぎないが、その部分について、今日の会議の席上、秦の考え方はまず全面的に文字コード関係者のそれと合致していて異存無い旨が小林幹事から明瞭に表明された。わたしの方がビックリしたほど明瞭な賛同であった。
念のために、この大きな接点となった「考え方」を再度こに記録しておこうと思う。
* 2-1 前回に問われていた「引き算説」にも触れて、原則的なものを繰り返します。四月九日の日記をそのまま。
* 文字コードの勉強をしていて、自然「ことば」と「文字」「書字」「活字」「電子文字」等についてある種の思索と理解とが生じてくる。「自分の考え」は基本的に、もともとどんなものであったかを「整理しておく」必要がある。
わたしは、難漢字、稀用漢字といえども、無用であると言える人はいないという説である。過去に用いた人と文献とがあるかぎり、その使用者と使用された文物とを無視し去る権能など、たまたま現代に生まれ、瞬時の後には後生に席を譲って退場するわれわれの持っている道理がない。過去の使用者に対しても、未来未然の利用者に対してもである。
だから、たかだか近現代の小さな理屈だけで、あまり安易に漢字はこれだけあれば十分などという尊大で傲慢な態度は原則的に排したいという考え方をしている。
だから、「全部が必要。だが、『全部』などというのは漢字の場合一種の観念に過ぎないのだから、リーズナブルに『引き算』の必要なことも当然」というのが、わたしの「原則・引き算説」である。「全部が必要」は理想に過ぎないと言われたときに、わたしは「理想」ではない、「考え方の原則」に過ぎないと、言下に反論したのを記憶している。なんでもかんでも「多々ますます弁ず」などという不自然な「全部説」ではないことを、今一度確認しておく。
では「リーズナブルな引き算」とは何か。
何を「原則全部」から引いてゆくのか。
当たり前だが、第一に、先ず「その所在自体が捜索不能」なものを、無理やり探すことは出来ないのだから、当然に引く。どれほど在るのかも、誰にも分からないだろう。但し幸いに発掘できて、意義も出典もわかり、包摂になじまない自律した漢字は、ともあれ保存収集する。当然のことである。
次に、「包摂」という考え方を、原則として強く容認し、同じ意義と用字法をもち、あまりに偶然の書法=書き癖・筆癖・気まぐれ・誤記等で、形に変化こそあれ本来「異字」度の希薄な異体=異形字は、賢明に包摂し、大胆に整理することで、大きく「引き算」する。将来にわたる原則的な大課題として、包摂による引き算を敢行する。
もの凄い数の、本来は同じ意義と用意の、ただ偶然の書字癖や写字癖や誤解にもとづく異形字・異体字・放恣な造字等が淘汰されるであろう。これは、最初に述べた「尊大・傲慢」とは、全くべつごとの当たり前の処置である。なぜなら、伝えられた漢字の殆どは、「手書き」されてきた歴史・時間が圧倒的に長く、「手書き」の偶発的な変容・変態・変形に一々重きを置くことの非合理なことは、あまりに明白だからである。
当然次には、アイデンティティの名においてされる「氏名・地名」漢字における、あんまりな異形字・異体字は、これを整理し包摂するのを「原則」とし、「引き算」を有効に進めるべきである。それには意識改革等を働きかける「現代の知恵とキャンペーン」とが相当の時間必要であろう。言うまでもなく、これらを原則として整理してゆく作業もまた、「尊大・傲慢」には当たらない。異民族による弾圧的な創氏改名は知らず、人間や家系のアイデンティティを、奇抜な漢字使用の固守で計ろうなどと謂うミスチックな思想の方が改訂されてゆくべきである。 わたしの姓字も戸籍謄本では現用の「秦」とはかなり奇妙に異なる字形で、どんな文字セットにも入っていないが、困るとは思わない。戸籍の方を直したいとすら考えている。「秦」は秦の文字形で活字社会では常用され、同じ一つの意義を広く認められている。それでいいではないか、戸籍謄本どおりの字でないとアイデンティティが失せるなどと謂う衰弱した思いは、わたしには、無い。拘泥しないで包摂に賛同してくれる人の増えてゆくように、現代思潮を先導してゆく働きなどをこそ「文字コード委員会」も持つべきではないか。(四月九日)
以上を踏まえて、「これ以上漢字の追加をする必要は、ある」との「前提」は、今後も「原則」として放棄できない。
* 三時間の会議は坦々と過ぎた。御成門からの三田線を日比谷で下りてみたら、目の前がいつもの帝劇モールだったので、「きく川」の鰻に惹かれて立ち寄った。菊正宗の正一合で二匹の鰻重をたいらげた。じつに結構であった。きゃべつの漬け物、蕗の煮物も沢山食べた。有楽町線に乗り換えてまっすぐ帰った。
2001 5・14 9
* たださえ忙しいのに、今度は文字コード委員会の方からふりかかってくる火の粉を払わねばならない。このところ文字コード委員会へあまり視線を振り向けてられる余裕がなかった、が、今朝、メーリングのなかで、例えばNTTの千田昇一さんのこんなメールが飛び込んできた。長い文章の最後の方にあり、それまでの議論は明快でよく分かるものだった。だが、こうなると、ちょっと困るのだった。
「私は、例えば、文筆家の方々が、多様な文字を扱いたいという要望を持っていることは理解していますが、その文字の扱いにしても、出版物を出すまでの道具としか見ていないのではないかと思っています。もし、出版物を出すまでの道具として情報処理機器をつかっているのだとすれば、情報処理機器の能力不足の点は、従来の技術(手書き等)で補足していただくのがコスト的に有利なのではと思います。
もし、文筆家の方々が、電子出版をお考えであれば、情報発信側だけの機能を検討するだけでなく、情報受信者となる読者の側にどの程度の価格の受信装置をもっていただくかを想定するのが、通信技術としては定石なのですが、この部分についての検討はしないまま、自分がほしいと思った機能は受信者は必ず持っていると思い込んでいるのではと危惧します。」
* これは事実認識に大いに違ったところがある。現に、私たちの今奮闘している電子文藝館の立ち上げに関しても、その基本のフォーマットをきめるについて、発信者の我々の問題以上に、不特定大多数の受信機械の現状や近未来にどう対応するかを何よりも激しく議論もし苦慮し工夫している。「情報受信者となる読者の側にどの程度の価格の受信装置をもっていただく」などという厚かましい希望は我々には持ちにくく、しかし「想定」して極力それに対応した発信をと考えている。当たり前の話ではないか。文筆家へのこの程度の認識で「危惧」されては堪らない。
千田さんには余儀なく、こう返事をした。
* 千田さん 明快なご意見です。
ただ最後に例えば「文筆家」云々の箇所には、誤解もあるやに感じましたので少し申し添えます。
前々回の会議の席で申し上げ、小林幹事より「全面的に同意見」といわれたわたしの見解をご覧になっていないようです、この全文は長いので千田さんに直接お送りし、ここのメーリングには繰り返しません。むろん文筆家全員の意見とは言いません、が、わたくしも文筆家であり、千田さんの非難されているような頑迷な立場をのみ固執しているわけでないことをご理解願います。
ことに、「紙の本にする前段階としてのみ機械を使っているのではないか、それなら手書きで補え」といわれるのは、認識不足の暴論です。
私などは、紙の本への依存度をぐんと減らして、機械そのものを創作と執筆の「場」としています。ホームページをご覧下さい。18MBの文章をすでに書き込み、何倍にも及ぶでしょう。こういう傾向は、私だけでなく文壇の内外でますます増してゆきます。
またインターネットによる、小規模ながら堅実な準研究集団やサークルが出来ています、どんどんと。そういう際には、古典や仏典・外典、古文献の引用も双方向通信でお互いに必要となりますが、文字で、記号で、苦労の多いことは察してくださらねばいけません。そういう場と傾向も、さらにさらに増えてゆくでしょう。
インターネットがインフラ化してゆくというのは、ただ、経済や工業や情報の畑だけであっていいという考えでは、偏狭に過ぎます、むろん、いろんな工夫の要ることですが。
日本ペンクラブは、従来紙の本=著書二冊以上を入会審査の条件としていたのに加え、紙の本でなくても、電子化されて現に公表されている作品も、規定の条件をクリアしたものは「著述」と認定すると正式決定しています。電子作品が市民権を与えられたのです。「出版」という言葉が、紙の本をだけをさしていた時代は、過ぎつつあります。原稿用紙には書かない、機械に書く、「機械で出版」する人は、老いにも若きにも増えています。
また現在日本ペンクラブは、島崎藤村初代会長から現在の梅原猛会長時代に至る、全会員の「紹介」とその主要作品の電子化による、「日本ペンクラブ電子文藝館」を開館しようとしています。すでに実験段階で作品を掲載し、年内には少数のコンテンツからでも開館しはじめます。無料公開です。世界に持ち出せる日本の文学・文芸のいわば代表作文化財を企図していますが、文字・記号で、多大の障害が現に予測され、どう乗り切ろうかと頭を悩ませています。「無い字は手書きで済ませよ」と言われますか、千田さん。会員は小説家・詩人・随筆家だけでなく、いろんな難しーい研究者もいます。井上靖の「星の話」をぜひ入れたいとなれば、思わず唸るのです。
こういう文化面の事業にも、千田さん、ご理解いただきたい。無理とわがままを言うているとは思いませんが。
結果として「ハ藤」「ソ藤」を例にした千田さんの提起に対し、文筆家の私個人は、2 の考えではないこと、ま、1 に近く、3 も分からぬではないがと言ったところです。これに関連した以前の見解は、部分的に、下記の通り。
「包摂」という考え方を、原則として強く容認し、同じ意義と用字法をもち、あまりに偶然の書法=書き癖・筆癖・気まぐれ・誤記等で、形に変化こそあれ本来「異字」度の希薄な異体=異形字は、賢明に包摂し、大胆に整理することで、大きく「引き算」する。将来にわたる原則的な大課題として、包摂による引き算を敢行する。もの凄い数の、本来は同じ意義と用意の、ただ偶然の書字癖や写字癖や誤解にもとづく異形字・異体字・放恣な造字等が淘汰されるであろう。これは、文字に対する「尊大・傲慢」とは、全くべつごとの、当たり前の処置である。なぜなら、伝えられた漢字の殆どは、「手書き」されてきた歴史・時間が圧倒的に長く、「手書き」の偶発的な変容・変態・変形に一々重きを置くことの非合理なことは、自身日常の書字体験から推してあまりに明白だからである。
当然次には、アイデンティティの名においてされる「氏名・地名」漢字における、あんまりな異形字・異体字は、これを整理し包摂するのを「原則」とし、「引き算」を有効に進めるべきである。それには意識改革等を働きかける「現代の知恵とキャンペーン」とが相当の時間必要であろう。言うまでもなく、これらを原則として整理してゆく作業もまた、「尊大・傲慢」には当たらない。異民族による弾圧的な創氏改名は知らず、人間や家系のアイデンティティを、奇抜な漢字使用の固守で計ろうなどと謂うミスチックな思想の方が改訂されてゆくべきである。わたしの姓字も戸籍謄本では現用の「秦」とはかなり奇妙に異なる字形であるが、困るとは思わない。戸籍の方を直したいとすら考えている。「秦」は秦の文字形で活字社会では常用され、同じ一つの意義を広く認められている。それでいいではないか、戸籍謄本どおりの字でないとアイデンティティが失せるなどと謂う、衰弱した思いは、わたしには、無い。拘泥しないで包摂に賛同してくれる人の増えてゆくように、現代思潮を先導してゆく働きなどをこそ「文字コード委員会」も持つべきではないか。(四月九日) 以上 九月七日
* ところがこれで済まなかった。第一期の主導者であった棟上昭男氏が、割り込んできて、慇懃無礼に、文筆家ないし私に、敵意まるだしの揶揄を送ってきた。「黙っていればよいものをと自分でも思いつつ,また一言感想です」と。「驚きました.秦さんがここまで踏み込んで発言されるようになるとは,正直言って小生にとって予想外のことだったので,世の中も随分変ったという感じがしているのですが,これはもともと小生の思い違いか認識不足だったのでしょうか」と。以下長いのであるが、そして論旨において我々としても聴くべきものを含んでいないのではないが、どこかに文筆家達の発言や希望や主張を「うるさい」「外野はひっこんでいろ」と言わんばかりの口吻があらわなのだ、特にこの人は第一期に参加した最初から「文筆家の文字表現」になど見向きもしないという印象であった。また、こっちも「文字コードって何?」といったていたらくであった。だが、文字コードのことは知らなくても、文字表現と文字の伝統については、深い関心も体験の豊富さももっているのである。文筆家団体を代表して出ている限り、何とバカにされても、原則的に、言うべきことは一歩も譲らずに言い続けてきたのが、この人にはよほど腹に据えかねていたのだろう。ところが、最近のわたしの総括的な「現状」認識に対して、委員会の幹事が、全面的に同意・合意できるものですと言うところまで、わたしは出て行っていた。それを棟上さんは「世の中も随分変った」と言うらしいのだが、まさに「認識不足」なのである。何年か継続して一つ事に関わってきたものが、思考を集中し集約していくのは当然であり、しかも、わたしの意見は最初から変わっていないのである。従来の「足し算」方式は、文字への思想や態度として姑息でおかしい、全体からの余儀ない「引き算」思想であることが望ましいと発言しつづけていた意味を、「青天井」の「無際限要求」のと勝手にわるく翻訳して、嗤っていたのである。わたしの「引き算法」のことは、きちんと纏めて説明し、「全面的に合意できる」理解とお墨付きを貰い、かえって私の方がびっくりしたことは、この「私語の刻」にも言い置いてある。
* どうも、もう、文筆家団体への義理は果たしたから、委員会から閉め出したいという意向のようにすらにおってくる。憶測に過ぎないが、千田さんのような温厚な論者にも、先のような「危惧」のかたちで文筆家の参加は無理か無駄かのようなニュアンスでものを言われてしまう。
だが、こうもわたしは観測している。かなり「瑣末」化してきている、つまり専門家だけの議論が、専門家だけの言葉で語られ合わねばならないだろうと言う感じの委員会の流れのように。しかしここで専門家というのは当たらない。文字コードの標準化や経済効果の算定については専門家であろうけれど、漢字や表現の専門家ではない。そういう方面の専門の人がほとんど参加していない。編集者も出版人もいない。作家はわたし一人しかいないし、詩人もいない。新聞の人が一人か二人か。そういうところで「専門的」という意味は、極めて偏狭に偏ったものでしかありえず、そういうなかで、未来に及ぶ文字表現の死命を左右されてしまってはたいへん困るから、わたしは辛抱して、出てゆくのである。発言していなければ、文筆家達も賛成、となってしまうのは目に見えている。そういうところへ持ち込むために、癇癪をおこしてやめると言わせたいのかなと、邪推したくなる。現に、文芸家協会から出ていた作家委員たちは、みな引っ込んでしまった。その方が賢いと思う。だが、わたしは、理事会がもういいよと引き留めてくれるまでは、出られるだけ出ていよう、それも仕事だと諦めている。
2001 9・7 10
* 文字コード委員会の幹事たちから、改めてわたしの総括的な暫定理解に対し「全面同意」し、千田・棟上氏への反論部分にも賛同の言が伝えられてきた。その上で、しかし他者(委員会多数)の価値観に否定的であり過ぎるのでは苦情が来た。返信を、念のために書き込んでおく。
* 一言だけ申しますが、他者の価値観に過剰に否定的でありながら、小林(幹事)さんたちからの全面同意が得られるところまで、理解が纏まるということ、可能だったでしょうか。皆さんのお話を、それなりに傾聴していたからではないのでしょうか。迎合はしないし、理解し切れぬ事を分かった顔はしないだけの話です。
初参加の頃のわたしを思い出されればと思います。文字コードに関して、百パーセントの無知識人でした、わたしは。外国語を聴いている按配だったのです。それでも投げ出しはしなかった。
もう一つは、文筆家団体をともあれ代表している立場なので、必ずしも私一人の理解でなく、表現者からの原則的希望を語らねばならず、ときには過剰なまで反応しておき、また安易にウンウンとも承知して帰れない・言えない、ことは有るのです。当然ながら。私個人にすれば、どうでもいいことなのですが。
* 黒いピンをはっきり刺したまま暮らしている今、これしきのことは、仕方がない。しかし「私個人にすれば、どうでもいいことなので」ある。その意味では、黒いピンを刺してやっさもっさやっているわたしは、わたしの幻影に過ぎない。黒いピンを抜いているわたしがわたしに見えてきているから、よけいそう思う。だから黒いピンのときの何事も手を抜くか、ゆるがせにするか。それは、しない。バグワンにしたがえば、ヒマラヤに執着して汚い妄想に悩まされる愚も、市場に執着して世の栄辱に翻弄される愚も、意識して超えて行けるように。「私個人」はそれを、期待もせず、ただ待っているだけの日々だ。だから、怒るし、食うし、飲むし、無頼も悪事すらも働くだろうが、そんなことは何でもない。
2001 9・8 10
* 昨日の文字コード委員会には代理で加藤委員に出てもらった。機械にない漢字の、入れて欲しい漢字の事例を提出してくれないではないかとかとうしは叱られたらしい。気の毒した。委員会に久々にメールを入れた。
* 春以来、「日本ペンクラブ電子文藝館」の開館作業で、とてつもなく追われ、文字コード委員会の方、手が回らず失礼しておりました。幸い、私より文字コード問題にくわしい加藤弘一氏に代理に出てもらえ、適材と胸を撫でています。
文字の提出が無いとお叱りがあったと聞きました。無いから出さないのでなく、有る(と思う)のに出せなかった、という言訳。「メールで手早く送れない」のですね、当然ですね。すると、一字ずつ手で書き抜いて整理しなくては。その時間的な余裕がとてもとれなかったという実状です。
この宿題もあるので、意図して「椿説弓張月」「南総里見八犬伝」「近世説美少年録」等で著名な「滝沢馬琴の作品」を読み進んできましたが、精査したわけでなく、すでに拾われているかいないのか分かりませんが、夥しく、ややこしい、まれに見る文字が拾えます。馬琴は、おそろしく漢字の駆使できる、ま、偉大な作者の一人ですから、作品も、国民の大きな財産です。
しかし、仮に馬琴作を、開館したばかりの我が「日本ペンクラブ・電子文藝館」で再現しようとすれば、全然お話にならない、文字が再現できず不可能だ、というのは動かぬ現状です。たとえ特殊な手をいろいろ繰り出して無理に手元で再現してみても、送信した先で「化けてしまう」ことは、ほぼ必定ですし、図像貼りつけという手が、不特定多数対象の「Digital Library」では、見苦しく読みにくい、へんな結果に成ることの多いのも、いやほど分かってきています。
いくら起稿者の手元では出来たにしても意味がない、送信した先の機械で化けないことが必要なのだと、それが双方向インフラである意義だと、口を酢くして言い続けたことを、今なお確認し続けて「文化的に」苦労しています。
オドリや音曲記号のまだ自在に使えないことにも、ほとほと閉口しました。
ともあれ、例になる漢字を拾っておいても、これがメールでは送れない、つまり、これ、ですね問題は。一つ一つ書き出している余裕がなかったと、言訳を兼ねてご無沙汰をお詫びします。 日本ペンクラブ 秦 恒平
2001 11・23 11