yusuk****@cheru*****
yusuk****@cheru*****
2003年 2月 4日 (火) 22:51:39 JST
田畑です。 2chのスレを見ている人は御存じかと思いますが、 anthy-3800を含めていくつかのバグ入りリリースを 繰り返したあとanthy-3803をリリースしました。 今のところ、anthy-3500からあまり変わっていないんですが、 長いこと安定版リリースをしていないので、 今月末にanthy-3900をリリースしようと思っています。 その次こそ、ユニコード対応と付属語グラフの整理を 、、、やれるのかしら、、、 んで、共起関係の処理のために下のような表を作ろうと 考えています。変換対象の文字列から生成した候補を キーにこの表を引いて候補どうしの共起関係を調べる つもりです。 たとえば「あついおゆ」というのを変換すると 「あつい」で1つめ,3つめ,4つめの例文が取り出され 「おゆ」で2つめの例文が取り出されるという感じです。 そして、1つめから2つめ、2つめから1つめというループが 検出できるので、「熱い」に高いスコアを与えることが できるという感じです。 # #読み (おくりがな) 品詞 候補 あつ (い) #KY 熱 ふろ () #T35 風呂 ------------------- ふろ (の) #T35 風呂 おゆ () #T35 お湯 ------------------- あつ (い) #KY 厚 ふろ () #T35 本 ------------------- あつ (い) #KY 暑 なつ () #T35 夏 ------------------- -- PUBLISH OR PERISH! Yusuke TABATA (yusuk****@cheru*****)