[LE-talk-ja 183] Re: 重複符号化文字

Back to archive index

Nozomi Ytow nozom****@biol*****
2006年 5月 19日 (金) 14:42:28 JST


>  このプロジェクトの「現実を見よう!」方針からすると、
> 必要ないってことになりませんか。

CP932 -> CP51932 という変換の場合、たとえば
0x81BE -> 0xA2C0
0x879C -> 0xADFC
という変換の方が
0x81BE -> 0xA2C0
0x879C -> 0xA2C0
よりありがたいという気がするのですが、
「みんな」がありがたいかと言われると一々聞くわけにも
行かないのでわかりません。ただ、変換元でも変換先でも
区別できるものを、中間の都合で区別を保存せずに積極的に
区別できなくする実装というのが引っかかります。

マイクロソフトの変換仕様に合わせようというのはやりかたの
一つだとは思いますし、またそもそも CP932 なんて Unicode
のソースコードではないから round trip なんかできなくても
いいんだ、というのもわかるのですが、でも困る状況がある
気がします。


>  外に出せないコードを作るのはもうやめません?

VS の並びを Unicode の規格にしてしまえば外に出せます。
--
のぞみ



Legacy-Encoding-talk-ja メーリングリストの案内
Back to archive index