MORIYAMA Masayuki
moriy****@mirac*****
2006年 5月 18日 (木) 18:56:33 JST
森山です。 NUMATA Toshinori <numat****@jp*****> wrote: > Kazuhiro Kazama wrote: > > 1, Shift_JIS, EUC-JP, ISO-2022-JP系列 > ... > > ・Unicodeからレガシーエンコーディングに戻す時の変換表に手 > > を加えて,文字化けをより広く回避するような対策もおこなわない(森 > > 山さんによると,この提案が却下された実例があるらしい). > > これは: > > 「JIS X 0208 から Unicode に変換するときに, > 1区33点“波ダッシュ”を U+301C WAVE DASH に変換する処理系と, > U+FF5E FULLWIDTH TILDE に変換する処理系とが混在するので, > Unicode から JIS X 0208 に変換するときは,U+301C も U+FF5E も > 同じ1区33点に変換したい」 > > と提案したら,規格適合性の観点から(?)拒否された > > といった話ですよね. > (具体例でいわないとわかりにくいので.) libiconv 1.8 の cp932修正、eucJP-ms追加パッチを作成したときに、cp932→ ISO-2022-JP といった変換が出来るように、ISO-2022-JP で本来の U+301C WAVE DASH と cp932 で変換された U+FF5E FULLWIDTH TILDE の両方を JIS X 0208 1区33点に変換するように修正したのですが、その点が、どうもまずかっ たようで、結局パッチは取り込まれませんでした。 という話になります。 Shift_JIS、EUC-JP、ISO-2022-JP という名前で、JIS準拠として実装している ものは、下手にいじらない方が良いようです。 > > 3, eucJP-ms > ... > > ・シフトJIS符号化(不可能),JIS符号化は考 > > えない. > > つまり,ISO-2022-JP-1 や ISO-2022-JP-2 のような JIS X 0212 を含む > ISO-2022-JP 系エンコーディングに CP932 の拡張文字を追加するような > ことは考えない,と. はい、そうです。 CP932 の文字レパートリーの変換が出来れば良いという考えです。 -- 森山 将之 moriy****@mirac***** ミラクル・リナックス株式会社