Nozomi Ytow
nozom****@biol*****
2006年 5月 19日 (金) 02:40:22 JST
> CP932<->CP51932(ないしはeucJP-ms)をコンバータを追加して > 可能にしようという話で,Unicodeを中心としたピボット変換時に > ベンダ独自文字が欠 落する問題を解決しようということだと思います. うーん、それなら、内部的にでも variant selector 使わずに 重複定義文字を unify して round trip 保証しないというのが なにをしたいのかよくわからんのですが... > ただし,この場合も厳密に言うと伊藤さんが指摘したような字体の > 問題がありますが,ここで想定しているのはデータベースのように > 蓄積する が,そこで直接文字を表示するわけでないシステムを > 念頭に置いているので,無視できるものとしていると理解しています. 字体の問題と言い切れるのかどうか、私には確信が持てません。 「はしご高」と「くち高」は包摂する立場からするとグリフの 問題ですが、文字としての「包摂高」は字体非依存なので、 グリフの問題ではない気がします。 ま、そこまで神経使ってデータ作ってないでしょふつー、 とは思いますが、「くち高」を含む文字集合を符号化する体系で 文字列に「くち高」のコードが現れた時、それが本当に「くち高」 なのかそれとも「包摂高」なのかはわからないと思います。 -- 伊藤 希 (のぞみ)