Taku Kudo
taku****@chase*****
2007年 6月 10日 (日) 00:23:50 JST
工藤です これは大変恥ずかしいバグなのですが、システム辞書を utf-8 として 作った場合、ユーザ辞書も utf-8 (utf8ではダメ) と指定しないといけません。 ユーザ辞書に関するバグがたくさんあるので、それを含めて 0.96 で修正いたします。 07/04/25 に 遠藤大二<dendo****@rakun*****> さんは書きました: > 遠藤です > > いつも勉強させていただいております。 > ユーザー辞書を登録したところmecabが実行できなくなりました。 > 問題点および対処方法をご教示いただけると幸いです。 > > OSはSuse linux 10.1 > mecab は 0.95をutf8で使用しています。 > > 実施したこと > 1 > ファイル(flutd.utf8.csv)をユーザー辞書(oka.dic)として作成登録しました。 > > **************** > flutd.utf8.csv は > > 圧痛,120,120,6058,名詞,一般,*,*,*,*,圧痛,アッツウ,アッツー > 圧迫排尿,120,120,6058,名詞,一般,*,*,*,*,圧迫排尿,アッパクハイニョウ,アッパクハイニョー > 異所,120,120,6058,名詞,一般,*,*,*,*,異所,イショ,イショ > > のようになっています。 > **************************** > > oka @ Geneknot14:~> cd oka > oka @ Geneknot14:~/oka> /usr/local/libexec/mecab/mecab-dict-index > -d/usr/local/lib/mecab/dic/ipadic -u oka.dic -f utf8 -t utf8 > flutd.utf8.csv > reading flutd.utf8.csv ... 53 > emitting double-array: 100% |###########################################| > > done! > > 2 > configファイルにユーザー辞書(oka.dic)を追加しました。 > > ; > ; Configuration file of MeCab > ; > ; $Id: mecabrc.in,v 1.3 2006/05/29 15:36:08 taku-ku Exp $; > ; > dicdir = /usr/local/lib/mecab/dic/ipadic > > userdic = /home/oka/oka/oka.dic > > ; output-format-type = wakati > ; input-buffer-size = 8192 > > ; node-format = %m\n > ; bos-format = %S\n > ; eos-format = EOS\n > > 3 > 追加後、ファイル(flutd.txt)に対してmecab処理をしたところ不備が生じました > > oka @ Geneknot14:~> cd oka > oka @ Geneknot14:~/oka> mecab ./flutd.txt > tagger.cpp(149) [tokenizer_.open(*param)] tokenizer.cpp(134) > [sysdic->isCompatible(*d)] incompatible dictionary: > /home/oka/oka/oka.dic > > ******************* > flutd.txt : > マグネシウム過剰摂取 > 頻尿 > 排尿困難 > 有痛性排尿困難 > 不適切な場所での排尿 > ********************** > > ユーザー辞書が正しく登録されていないようなのですが、対処方法がわかりません。なにとぞよろしくお願いします。 > > _______________________________________________ > mecab-users mailing list > mecab****@lists***** > http://lists.sourceforge.jp/mailman/listinfo/mecab-users >