[Anthy-dev 3345] ja.wikipedia + mecab-ruby ベースの Anthy 用辞書を完成させました

Back to archive index

UTUMI Hirosi utuhi****@yahoo*****
2007年 2月 3日 (土) 22:37:40 JST


内海です。

動詞の活用形判定コードがとりあえず書けたので、
ja.wikipedia + mecab-ruby ベースの Anthy 用辞書をリリースしました。
http://www.geocities.jp/ep3797/anthy_dict_01.html
ja.wikipedia は 20070127 版に更新しています。

コンパイル済み辞書もアップロードしていますので、
/usr/share/anthy/anthy.dic を上書きすれば簡単に試用できます。

ほぼ無調整なのですが、思っていたよりはきちんと変換できます。
カタカナ語を大量に追加しているので、
まとりっくすれぼりゅーしょんずを =>
マトリックス・レボリューションズを
などが一発で出ます。
ただ、お遊びの作品なので、精度には期待しないでください。
カタカナ語部分については大泉さんも私家版辞書で取り込みを
考えておられるそうです。

問題点:
・cannadic 形式に変換する際の動詞の活用形判定が甘い
・形容詞の語幹部分の判定も少し甘い
・mecab では1表記から1読みを得るので、
"亮子" が "あきこ" でしか登録されていない、
というようなことがあり得る

コンパイルする際の Anthy へのパッチは
word-counter-0.0.3 の README に書いています。
--------------------------------------
Start Yahoo! Auction now! Check out the cool campaign
http://pr.mail.yahoo.co.jp/auction/




Anthy-dev メーリングリストの案内
Back to archive index