Taku Kudo
taku****@chase*****
2014年 6月 19日 (木) 14:07:11 JST
工藤です 数字+助数詞の読みは例外的なことが多く、現状のMeCabのモデルでは正しく解析できません。 たとえば、 5日 → いつか という表記を辞書に登録すれば解決できるかというと、そうでもなくて、 55日 → ごいつか となってしまう可能性があります。 辞書登録で解決出来ないような現象につきましては、後処理で読みを修正することが音声合成や認識では一般的のようです。 http://www.ar.media.kyoto-u.ac.jp/dictation/doc/morph.pdf 工藤 2014年6月16日 11:57 Hans Schmidt <z0idb****@gmx*****>: > こんにちは > > シュミットです。 > > 今日メカブを使用し始めて、いい読み方の作成に驚きました。 > > それにも関わらず、数字と数詞の熟語から読み方の作成する時にかなり失敗しそ > うです。 > > 例えば: > > 5日 → ごにち > 二人 → ににん > 一人 → いちにん > 二十日 → にじゅうにち > 20日 → にぜろにち > > この熟語のルールが比較的に簡単ですから、対策がありますか。 > > ありがとうございます。 > > _______________________________________________ > Mecab-devel mailing list > Mecab****@lists***** > http://lists.sourceforge.jp/mailman/listinfo/mecab-devel