Ticket #39518

General Punctuation (U+2000--U+206F) の分割

Date d'ouverture: 2019-08-29 05:00 Dernière mise à jour: 2019-09-26 19:38

Rapporteur:
Propriétaire:
(Aucun)
État:
Ouvert
Composant:
(Aucun)
Jalon:
(Aucun)
Priorité:
5 - moyen
Sévérité:
5 - moyen
Résolution:
Aucun
Fichier:
Aucun

Détails

現状の LuaTeX-ja では和文扱い (JAchar) と欧文扱い (ALchar) をUnicode ブロック単位で決めています(Latin-1 Supplement (U+0080--U+00FF) は文字範囲を 1 と 8 に分割していますが,どちらも ALchar 扱いなのでこのブロックは ALchar しかありません).どちらの扱いにするかは Adobe-Japan1 との共通部分があるかどうかで決めています.

この原則に従い,現状では General Punctuation (U+2000--U+206F) は全体が JAchar です(JIS X 0208 の文字があるため). しかしこのブロックには en-dash, em-dash, ‹ › といった欧文組版で「よく使われるであろう」文字の他に,U+200B(ZWSP;欧文ゴーストとして使える)や U+200D(ZWJ;絵文字の結合.参考:#39513)など「特殊な」文字もあります.

そこで,次バージョンでは General Punctuation ブロックを JAchar の文字と ALchar の文字に分割しようと考えています.JAchar とする手っ取り早い基準としては「Adobe-Japan1 にある」「JIS X 0213 にある」「JIS X 0208 にある」というのが考えられますが,実際には以下に示すように en dash が JIS X 0208 段階で収録されているので,迷っているところです.

  • JIS X 0213 にはなく,Adobe-Japan1 のみにある文字:
    U+2002 (En space), U+2011 (Non-breaking hyphen), U+201A (Single low-9 quot.), U+201E (Double low-9 quot.),
    U+2039 (Single left-pointing angle quot.), U+203A (Single right-pointing angle quot.), U+2044 (Fraction slash)
    
  • JIS X 0213 で追加された文字:
    3-2340  U+2022  # BULLET        [2000]
    3-237C  U+2013  # EN DASH       [2000]
    3-286B  U+203C  # DOUBLE EXCLAMATION MARK       [2000]
    3-286C  U+2047  # DOUBLE QUESTION MARK  [2000]  [Unicode3.2]
    3-286D  U+2048  # QUESTION EXCLAMATION MARK     [2000]
    3-286E  U+2049  # EXCLAMATION QUESTION MARK     [2000]
    3-2921  U+20AC  # EURO SIGN     [2000]
    3-2B58  U+203F  # UNDERTIE      [2000]
    3-2C7D  U+2051  # TWO ASTERISKS ALIGNED VERTICALLY      [2000]  [Unicode3.2]
    3-2C7E  U+2042  # ASTERISM      [2000]
    
  • JIS X 0208 からある文字:
    3-2131  U+203E  # OVERLINE      Windows: U+FFE3
    3-213D  U+2014  # EM DASH       Windows: U+2015
    3-213E  U+2010  # HYPHEN
    3-2142  U+2016  # DOUBLE VERTICAL LINE  Windows: U+2225
    3-2144  U+2026  # HORIZONTAL ELLIPSIS
    3-2145  U+2025  # TWO DOT LEADER
    3-2146  U+2018  # LEFT SINGLE QUOTATION MARK
    3-2147  U+2019  # RIGHT SINGLE QUOTATION MARK
    3-2148  U+201C  # LEFT DOUBLE QUOTATION MARK
    3-2149  U+201D  # RIGHT DOUBLE QUOTATION MARK
    3-216C  U+2032  # PRIME
    3-216D  U+2033  # DOUBLE PRIME
    3-2228  U+203B  # REFERENCE MARK
    3-2273  U+2030  # PER MILLE SIGN        [1983]
    3-2277  U+2020  # DAGGER        [1983]
    3-2278  U+2021  # DOUBLE DAGGER [1983]
    

Ticket History (2/2 Histories)

2019-08-29 05:00 Updated by: h7k
  • New Ticket "General Punctuation (U+2000--U+206F) の分割" created
2019-09-26 19:38 Updated by: h7k
Commentaire

一応 20190926.0 では Adobe-Japan1 に属しているかで決めるようにしましたが,まだまだ検討の余地がありそうです.

Attachment File List

No attachments

Modifier

You are not logged in. I you are not logged in, your comment will be treated as an anonymous post. » Connexion