[mecab-users 430] 中古和文UniDic 0.5のご案内

Back to archive index

Toshinobu OGISO ogiso****@ogiso*****
2010年 10月 27日 (水) 11:21:02 JST


(重複して受け取られた場合はご容赦ください)

国立国語研究所の小木曽と申します。
私どもは、UniDicをもとにした歴史的な資料を対象とした形態素解析辞書を開
発してきましたが、このたび新たに「中古和文UniDic」ver.0.5を公開しました。
中古和文UniDicは日本語形態素解析辞書UniDicをもとにして平安時代の仮名文
学作品をはじめとする和文系の資料(いわゆる古文)を解析できるようにした
形態素解析辞書です。「短単位」や「見出しの階層構造」などのUniDicの特長
をそのまま引き継いでいます。見出し語や品詞体系は、他のUniDic(現代語用
のUniDic,近代文語UniDic)と互換性があります。
校訂され仮名遣いなどもよく整備された本文であれば、96〜98%程度の精度で
解析できています。

中古和文UniDicは次のページから無償でダウンロードできます。
http://www2.ninjal.ac.jp/lrc/index.php?UniDic%2F%C3%E6%B8%C5%CF%C2%CA%B8UniDichttp://bit.ly/avNQWY)
形態素解析システム「和布蕪(MeCab)」で利用できるUTF-8版の辞書を公開し
ています。また、簡単に利用できるようにまとめたWindows用のパッケージを
用意しています。
ぜひお試しください。

--
人間文化研究機構国立国語研究所 言語資源研究系
小木曽 智信 (おぎそ としのぶ)




mecab-users メーリングリストの案内
Back to archive index