UTUMI Hirosi
utuhi****@yahoo*****
2007年 2月 3日 (土) 22:37:40 JST
内海です。 動詞の活用形判定コードがとりあえず書けたので、 ja.wikipedia + mecab-ruby ベースの Anthy 用辞書をリリースしました。 http://www.geocities.jp/ep3797/anthy_dict_01.html ja.wikipedia は 20070127 版に更新しています。 コンパイル済み辞書もアップロードしていますので、 /usr/share/anthy/anthy.dic を上書きすれば簡単に試用できます。 ほぼ無調整なのですが、思っていたよりはきちんと変換できます。 カタカナ語を大量に追加しているので、 まとりっくすれぼりゅーしょんずを => マトリックス・レボリューションズを などが一発で出ます。 ただ、お遊びの作品なので、精度には期待しないでください。 カタカナ語部分については大泉さんも私家版辞書で取り込みを 考えておられるそうです。 問題点: ・cannadic 形式に変換する際の動詞の活用形判定が甘い ・形容詞の語幹部分の判定も少し甘い ・mecab では1表記から1読みを得るので、 "亮子" が "あきこ" でしか登録されていない、 というようなことがあり得る コンパイルする際の Anthy へのパッチは word-counter-0.0.3 の README に書いています。 -------------------------------------- Start Yahoo! Auction now! Check out the cool campaign http://pr.mail.yahoo.co.jp/auction/