[mecab-devel 106] Re: 日付などの読み方

Back to archive index

Taku Kudo taku****@chase*****
2014年 6月 19日 (木) 14:07:11 JST


工藤です

数字+助数詞の読みは例外的なことが多く、現状のMeCabのモデルでは正しく解析できません。

たとえば、

5日 → いつか

という表記を辞書に登録すれば解決できるかというと、そうでもなくて、

55日 → ごいつか

となってしまう可能性があります。

辞書登録で解決出来ないような現象につきましては、後処理で読みを修正することが音声合成や認識では一般的のようです。

http://www.ar.media.kyoto-u.ac.jp/dictation/doc/morph.pdf

工藤




2014年6月16日 11:57 Hans Schmidt <z0idb****@gmx*****>:
> こんにちは
>
> シュミットです。
>
> 今日メカブを使用し始めて、いい読み方の作成に驚きました。
>
> それにも関わらず、数字と数詞の熟語から読み方の作成する時にかなり失敗しそ
> うです。
>
> 例えば:
>
> 5日 → ごにち
> 二人 → ににん
> 一人 → いちにん
> 二十日 → にじゅうにち
> 20日 → にぜろにち
>
> この熟語のルールが比較的に簡単ですから、対策がありますか。
>
> ありがとうございます。
>
> _______________________________________________
> Mecab-devel mailing list
> Mecab****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/mecab-devel



Mecab-devel メーリングリストの案内
Back to archive index