[Anthy-dev 2605] 個人辞書の処理の変更

Back to archive index

Yusuke TABATA yusuk****@w5*****
2005年 11月 4日 (金) 02:26:17 JST


田畑です。

anthyで数千語以上の単語を登録するとメモリの消費が大きくなって
初期化にも時間がかかるという弱点があるので、新しい検索しやすい
形式のファイルを ~/.anthy/ 以下に置くというような改善を
行なってます。
現時点での作業はgitリポジトリに入れてますが、データ形式を確定
させていないので、使った場合に互換性の問題がある可能性があります。
フロントエンドのAPIは変更せずに少しずつ移行を進めていく予定です。

1行64文字で固定したファイルの各行にtrie treeのノードを
テキスト形式で詰めるという方法をとっていて、ファイルサイズの
効率はそんなに良く無いのですが、検索の速さは良い感じです。
単語の追加、削除も問題無さそうです。

*特定分野の辞書の単語を登録する
*なんらかのサーバから定期的に単語をダウンロードして登録する
などのアイデアを実行するインフラとなることを目指してます。

-- 
--
 CHAOS AND CHANCE!
  Yusuke TABATA



Anthy-dev メーリングリストの案内
Back to archive index