Re: 重複符号化文字 (LE-talk-ja 183) - Legacy Encoding Project

>  このプロジェクトの「現実を見よう！」方針からすると、
> 必要ないってことになりませんか。

CP932 -> CP51932 という変換の場合、たとえば
0x81BE -> 0xA2C0
0x879C -> 0xADFC
という変換の方が
0x81BE -> 0xA2C0
0x879C -> 0xA2C0
よりありがたいという気がするのですが、
「みんな」がありがたいかと言われると一々聞くわけにも
行かないのでわかりません。ただ、変換元でも変換先でも
区別できるものを、中間の都合で区別を保存せずに積極的に
区別できなくする実装というのが引っかかります。

マイクロソフトの変換仕様に合わせようというのはやりかたの
一つだとは思いますし、またそもそも CP932 なんて Unicode
のソースコードではないから round trip なんかできなくても
いいんだ、というのもわかるのですが、でも困る状況がある
気がします。


>  外に出せないコードを作るのはもうやめません？

VS の並びを Unicode の規格にしてしまえば外に出せます。
--
のぞみ

Legacy Encoding Project

[LE-talk-ja 183] Re: 重複符号化文字