[LE-talk-ja 150] Re: LE-talk-ja での議論のまとめ

Back to archive index

Nozomi Ytow nozom****@biol*****
2006年 5月 19日 (金) 02:40:22 JST


> CP932<->CP51932(ないしはeucJP-ms)をコンバータを追加して
> 可能にしようという話で,Unicodeを中心としたピボット変換時に
> ベンダ独自文字が欠 落する問題を解決しようということだと思います.

うーん、それなら、内部的にでも variant selector 使わずに
重複定義文字を unify して round trip 保証しないというのが
なにをしたいのかよくわからんのですが...

> ただし,この場合も厳密に言うと伊藤さんが指摘したような字体の
> 問題がありますが,ここで想定しているのはデータベースのように
> 蓄積する が,そこで直接文字を表示するわけでないシステムを
> 念頭に置いているので,無視できるものとしていると理解しています.

字体の問題と言い切れるのかどうか、私には確信が持てません。
「はしご高」と「くち高」は包摂する立場からするとグリフの
問題ですが、文字としての「包摂高」は字体非依存なので、
グリフの問題ではない気がします。

ま、そこまで神経使ってデータ作ってないでしょふつー、
とは思いますが、「くち高」を含む文字集合を符号化する体系で
文字列に「くち高」のコードが現れた時、それが本当に「くち高」
なのかそれとも「包摂高」なのかはわからないと思います。
--
伊藤 希 (のぞみ)



Legacy-Encoding-talk-ja メーリングリストの案内
Back to archive index