Anthyで使う

【入れ方】

※extra/ 以下にある辞書を使いたい場合は、こちらも参照。

Anthy のソースとそれをビルドする環境が必要ですので、まずそれらを準備してください。
※anthy.dic のみを置き換える場合は、Anthy は、既にインストール済みのと同じバージョンのものを用意。

  1. 準備作業
    /tmp に anthy-9100?.tar.gz と alt-cannadic-0?????.tar.bz2 があるものとして説明します。
    $ cd /tmp
    $ tar xzf anthy-9100?.tar.gz
    $ tar xjf alt-cannadic-0?????.tar.bz2
    $ cd alt-cannadic-0?????/
    $ ./prepare
    $ cd ../anthy-9100?/
    
    ;; 辞書の追加/削除をしたければ編集
    $ vi anthy-9100?/mkworddic/dict.args.in
    
    * 通常は dict.args.in の内容のままでいいはずです。
    * 090921版から、丸数字等、JIS 第3水準の記号をデフォルトで入れるようにしました。お使いのフロントエンドが UTF-8 に対応してない場合は、「gt-tankanji_hikanji-34.t」の行をコメントアウトして下さい。尤も、入れてあっても EUC-JP 外の文字が「〓」(ゲタ)になるだけで、問題はないと思います。
    * 071023版から name.t は g_fname.t に統合されたので不要です。
    * tankanji.t も gtankan.ctd があれば不要、utf8.t は単なるサンプル(?)なので不要です。
    * base.t は 9100c までのものは取り込み済みですが、今後 anthy 側でまた追加されるかもしれないので、コメントアウトするだけにします。
  2. コンパイル
    $ ./configure --prefix=/usr --sysconfdir=/etc
    $ make
    
  3. インストール
    ;; [anthy 本体もインストールする場合]
    $ sudo make install
    
    ;; [anthy がインストール済みで anthy.dic のみを置き換える場合]
    ;; anthy.dic の path は環境によって違うかもしれません
    $ sudo mv /usr/share/anthy/anthy.dic /usr/share/anthy/anthy.dic.orig
    $ sudo cp mkanthydic/anthy.dic /usr/share/anthy/
    
    お使いの IM を再起動、もしくは再ログイン

番外: corpus のパラメータ更新

辞書、付属語グラフ、corpus例文のどれかを変更した場合、corpus のパラメータを更新する必要があります。
alt-cannadic-091122 以降は、更新したものを同梱してあるので、そのまま使う場合は、この作業は不要です。
※この作業は、変換結果を変換履歴ファイル(~/.anthy/last-record*)に吐き出してしまうので、専用ユーザを作って行うことをお勧めします。

;; ※説明は推測で書いてます。間違ってるかもしれません。

;; LD_LIBRARY_PATH の設定
;; 基本的にはしなくていいが、稀に、今ビルドした anthy ではなく、インストール済みの
;; 方の anthy を使ってしまうことがあるらしいので、その場合は明示的に設定する。
;; 設定するパスがこれでいいかどうかは正直自信ないです。
;; (Fedora の spec ファイルを参考にさせて貰った)
$ LD_LIBRARY_PATH="`pwd`"/src-main/.libs:"`pwd`"/src-worddic/.libs:"`pwd`"/src-util
$ export LD_LIBRARY_PATH

;; 初期化(mkanthydic/anthy.dic を辞書と付属語グラフだけからなるものにする)
$ make update_params0

;; 初期化された anthy.dic を使って例文からパラメータを生成し、anthy.dic を作り直す
;; 環境変数 ANTHY_HISTORY_FILE を設定している場合は、設定を解除しないと、この変数に
;; 指定されたファイルに例文が吐き出されてしまうので注意。
;; $ unset ANTHY_HISTORY_FILE
$ make update_params

;; 作り直された anthy.dic でまた例文を parse し直して学習し、再度 anthy.dic を作り直す
$ make update_params2
$ unset LD_LIBRARY_PATH

* update_params2 は何度でも繰り返せます。
* どのくらいやるといいのかはよく分かりませんが、自分は 3回にしています
* calctrans/{corpus_info,weak_words}が更新されたパラメータのファイルです