Re: LE-talk-ja での議論のまとめ (LE-talk-ja 150) - Legacy Encoding Project

> CP932<->CP51932(ないしはeucJP-ms)をコンバータを追加して
> 可能にしようという話で，Unicodeを中心としたピボット変換時に
> ベンダ独自文字が欠 落する問題を解決しようということだと思います．

うーん、それなら、内部的にでも variant selector 使わずに
重複定義文字を unify して round trip 保証しないというのが
なにをしたいのかよくわからんのですが...

> ただし，この場合も厳密に言うと伊藤さんが指摘したような字体の
> 問題がありますが，ここで想定しているのはデータベースのように
> 蓄積する が，そこで直接文字を表示するわけでないシステムを
> 念頭に置いているので，無視できるものとしていると理解しています．

字体の問題と言い切れるのかどうか、私には確信が持てません。
「はしご高」と「くち高」は包摂する立場からするとグリフの
問題ですが、文字としての「包摂高」は字体非依存なので、
グリフの問題ではない気がします。

ま、そこまで神経使ってデータ作ってないでしょふつー、
とは思いますが、「くち高」を含む文字集合を符号化する体系で
文字列に「くち高」のコードが現れた時、それが本当に「くち高」
なのかそれとも「包摂高」なのかはわからないと思います。
--
伊藤　希 (のぞみ)

Legacy Encoding Project

[LE-talk-ja 150] Re: LE-talk-ja での議論のまとめ