[Anthy-dev 3764] Re: 郵便番号のデータ

Back to archive index

Jun Oizumi vagus****@gmail*****
2010年 6月 8日 (火) 22:45:33 JST


大泉です。

2010/6/8 Hideyuki SHIRAI :
> まずは報告です。ひとつイレギュラーな処理をしないといけないところ
> を見つけました。
>
> "愛知県","豊橋市","岩田町居村、北郷中"
>
> は、下記のように "岩田町居村", "岩田町北郷中" としないとだめな模
> 様です。
>
> 4400032 #CNS 愛知県豊橋市岩田町居村
> 4400032 #CNS 愛知県豊橋市岩田町北郷中
>
> 調べたところ、
>
> 4400032 "岩田町居村" "北郷中"
> 4400041 "岩田町宮下" "道合"
> 4400833 "飯村町西山" "高山"
>
> (全部 愛知県豊橋市!!)が該当しました。う〜〜ん、どんどんコード
> が汚くなっていく。。。

本当ですね…(嘆息)。

>> 「make skk; make anthy; make canna」みたいにできるような感じで。
>> そうすれば、anthy でファイル形式を変えた場合でも、「古いのは "make anthy-old"、新形式の
>> は "make anthy"」みたいな感じに Makefile を書き換えるだけで、一つのソースパッケージで
>> 対応できるんじゃないかなぁ、と。
>
> ;; せっかくやるならそこまで狙いましょうよ :-)

どうやら、新部さんもそのおつもりのようでした。
http://bugs.debian.org/cgi-bin/bugreport.cgi?bug=584978
> It is usual for Japanese input system (Kana-Kanji conversion) to help
> inputting address.  Currently, we have duplicates of postal code data
> among input systems, such as SKK, Anthy, Canna, and others.  We expect
> maintainers of those packages to use this package.

> ken_all.lzh を unix 上で lha コマンドで展開すると ken_all.csv に
> なるようです。Windows 的なアーカイバで展開すると KEN_ALL.CSV で
> すが、なんでかわからないです。

あれ? 手元(openSUSE 11.2) で「lha x ken_all.lzh」とやると KEN_ALL.CSV に
なるんですが…。"--convert-filename-case" を付けると ken_all.csv になります。

「SKK は?」と思って、Makefile 見てみたら、

> KEN_ALL_LZH=$(temp_dir)/ken_all.lzh
> KEN_ALL=$(temp_dir)/ken_all.csv
> extract:
> 	$(LHA) ptq $(KEN_ALL_LZH) > $(KEN_ALL)

すみません、私がアホでした orz

> まだ人には見せられません ^^; もうしばらくお待ちを。
[..]
>> さすがというか何と言うか、SKK が凄いです。
>> "()" 内もできるだけ展開して、京都の通り名の対応までしてます。
>> 私からすると、「そこまでやるか」という感じです。
>
> ちなみにぼくのも京都はそこまでやっています(自慢)

何と!! さすがです。期待しております。

> 個人的は『サンシャイン60 1階』ってスペースを入れるのが良いと思う
> のですが、zipcode.t だと全角スペースじゃないと NG なのがちょっと
> なぁ。この時だけ () を残すかな。

私も全く同じことを考えました。

> 一行一エントリかセパレータを変えてスペースも一つの候補内で使える
> ようにした方がよいかもしれません。

~/.anthy/imported_words_* で使うとそれができるんですが、
今度は、入力が全角数字だった場合に変換できなくなるので、郵便番号が全角数字の
エントリを追加してやる必要があり、ファイルサイズが倍になっちゃうんですよね…。




Anthy-dev メーリングリストの案内
Back to archive index