[LE-talk-ja 65] Re: ISO-2022-JP-MS について

Back to archive index

Tadamasa Teranishi yw3t-****@asahi*****
2006年 4月 14日 (金) 18:33:14 JST


寺西です。

# 亀レスですが。

"NARUSE, Yui" wrote:
> 
> どの範囲のユーザを想定するのかという話になってしまいますが、
> 「JIS X 0208」という言葉をしらない人が「EUC-JP」を指定した場合、
> 想定しているのは「ひらがなとか漢字とか」程度なので、
> 想定内か想定外かというのははっきりしないかと。

ちょっと認識がずれていますが。

受け取り側のプログラムを設計する人は、すくなくともその程度の知識
は必要ですし、それを知らない人を助けるために CP51932 に対応する
というのは方向として問題だろうと思います。
そもそも CP51932 で扱うべきことではないので。

コード変換の環境整備するよりは、知らずにプログラムを設計してしまう
人に教える環境を整えるべきだろうなぁと思いますね。
 
> > いや、今でも使いたいなら UTF-8 に移行すべきであって、CP51932 とか
> > で使おうとするのが良いことではないだろうと思います。例え、使える
> > ようになったとしてもです。
> 
> システムが複数のモジュールから構成されていて、
> かつそのモジュールのうちいくつかが UTF-8 非対応の場合、
> モジュールを置き換えるまで延命が必要でしょう。

そういう場合は、それらのモジュールが全て CP51932 に対応していない
といけない/不具合がでる可能性があるわけでして、CP51932 で何とか
するという解決法にも、無理があるように思います。

# 解決する場合もあるのはわかりますが。よっぽど UTF-8 の方が現状対応
# しているような...。

> > CP51932 を使っているのは IE (および他のブラウザ?)から送られてくる
> > データぐらいしか知りませんが、他にありますか?
> 
> Windows のテキストエディタで、ファイルを EUC-JP として保存した場合、
> それは CP51932 ですね。

ノートパッドは EUC-JP で保存できないので、結局はそのエディタの仕様に
依存する話なのでは?
コード変換に CP51932 を使っている場合に限られるでしょう。

そもそも機種依存文字を含めて EUC-JP として保存できるエディタに
問題があるかと思いますし、それがスタンダードだとは思わないですけど。

具体的にはどのエディタでしょう。
 
> が、自分の思っていた「EUC-JP」が実は CP51932 だった、
> という人はかなり多いのではないでしょうか。

???

> # Windows で 3バイト EUC を扱えるエディタってあまりないですし。

3バイト EUC が扱えるエディタの有無と CP51932 とは直接関係ないでしょう。
# かすってますが...。

> > つまり現状死んでいるわけです。
> 
> Windows から「日本語 (EUC)」として読めば普通に見れますから、
> 「死んでいる」は語弊があるかと。
> “dying”ではありますな。

Windows で閉じた世界ならわざわざ CP51932 で処理する必要はない
ということです。EUC-JP に変換するなら、そこに何らかの UNIX との
かかわりがあるわけでして、その処理のどこかで何らかの不具合が
生じている(生じていなければ CP51932 に対応する必要はないから)わけ
で、それはデータが死んでいる(というか、生かされていない)ということ
です。
 
> 環境を整えなかった場合、
> 全面的にレガシーなシステムのまま限界まで使い、
> 一二の三で一気に Unicode、というシナリオになるのでしょうが、
> それですと、MySQL 4.1 の二の舞になるように思います。

これは意見が異なるところでしょう。
変にレガシーエンコーディングの環境が整う方が厄介だろうと思いますけ
どね。
 
> 思うに、Windows の機種依存データは外の環境に出て行きやすいが、
> Mac の機種依存データは Mac の環境内で処理され、外に出てこないので、
> 問題が顕在化しづらいのかもしれません。

ユーザの絶対数が Windows よりかなり少ないので、問題が表面化することは
少ないですね。
個人的には、いろいろと厄介な問題を持っていて、解決しないといけないか、
あるは全て捨ててしまうか、ということになるだろうと思っています。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-****@asahi*****
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E




Legacy-Encoding-talk-ja メーリングリストの案内
Back to archive index