NIIBE Yutaka
gniib****@fsij*****
2010年 7月 1日 (木) 14:30:49 JST
皆様: いろいろと溜まっていますが、少しずつ進んでいると思うのでよろしくお願い します。 下記にこれまでの進捗/今後の予定を示します。ご意見ありましたらお願いしま す。 Egg v4: 進展なし。 郵便番号: リポジトリができた。6/30 版まで入れた。ITP は出した。 Anthy: (1) テスト: 進展なし。 (2) Ubuntu の変更の取り込み: わりと進んだ。 (3) これまでの変更: * 辞書を更新した(alt-depgraph-new branch より)。 * corpus を移動した。 * 辞書の bootstrap の手順の間違いを修正した。 * textdic を書き換え( mmap やめた)。 * bug fixes: * last-record1_.utf8 とかできるのを修正。 * anthy_trie_delete が呼ばれるのを修正。 * 途中まで、(alt-depgraph-new branch より) (4) alt-depgraph-new の中で残るは本体の depgraph の変更。 現状、alt-depgraph-new の途中までが master にあるので、微妙な所です。 wtab.h/ptab.h を変更したけれど depgraph はそのままです。 少し時間をかけて取り組みたいと思います。 まず、mkdepgraph を変更して optimize して DFA を作るのはどうかやってみ ます。anthy.dep の内容とフォーマットが変更になります。状態のサイズが大 きくなりすぎなければ、この変更にも意味があるでしょう。 feature/depgraph-dfa branch を作って作業しようと思います。 次に、現在の node 遷移がどうなのか見てみます。 alt-depgraph-new の node 遷移を見てみます。 さらに、正規表現での記述が使えるかどうか検討したいと思います。 (5) その他予定 下記の変更を検討中です。 feature/wtab-ptab-merge janitor/no-japanese-literal-ptab-access janitor/texttrie-read-only-or-kill --