MORIYAMA Masayuki
moriy****@mirac*****
2006年 4月 12日 (水) 12:04:53 JST
森山です。 cp932, cp51932, eucJP-ms, ISO-2022-JP-MS の定義および Unicode との変換 を「基本仕様書」のドラフト版を次の場所にアップしました。 ISO-2022-JP-MS に関しては、ユーザ定義文字の扱いに関して変更になるかも しれませんが、現状では ESC $ ( ? としています。 http://sourceforge.jp/docman2/?group_id=2198 今までの説明でなかった点として、重複定義されている文字の変換を明示しま した。 重複定義文字に関する Unicode から(MS)レガシーエンコーディングへの変換 ルールを簡単に説明すると次のようになります。 次の変換規則を番号の若い順番から適用していきコード変換を行う。 1. JIS X 0208:1997 で定義されている文字であれば、JIS X 0208:1997 の符 号位置に変換する。 2. NEC特殊文字で定義されている文字であれば、NEC特殊文字の符号位置に変 換する。 3. IBM拡張文字で定義されている文字であれば、IBM拡張文字の符号位置に変 換する。 4. IBM拡張文字の符号位置が存在しない場合は、NEC選定IBM拡張文字の符号位 置に変換する。 マイクロソフト > [PRB] SHIFT - JIS と Unicode 間の変換問題 http://support.microsoft.com/default.aspx?scid=kb;ja;JP170559 上記の、変換表がベースとなっています。 ここで説明している変換については、別途 ucm ファイルとして公開予定して います。 -- 森山 将之 moriy****@mirac***** ミラクル・リナックス株式会社