[fess-user 596] インデックスの有効期限とクロール実行の間隔について

Back to archive index

hi fu hi06f****@mh*****
2012年 8月 6日 (月) 21:10:43 JST


はじめまして。
fessを最近知り、やりたかったことが簡単にできそうでとても有難いです。
表題についての適切な設定がよく解らないので教えて頂きたいのですが、

Windowsサーバに Tomcat7.0 と fess-server-6.0.0 を導入し、フォルダの
中のファイル(Excel、Word、PDF、html・・・)を全文検索しています。
このフォルダは共有フォルダで、ほかのパソコンからファイルの登録や
参照・変更、ファイル削除など自由に随時行います。
フォルダの中には何ケ月も変更されないままのファイルもあれば、1週間前
に更新されたものや、10分前に新規保存されたものまで様々です。
中には1時間前に削除されたものもあります。

クロールを実行する時点で、そのフォルダの中にあるすべてのファイルの
インデックスを作成(全文検索できるように)したいのですが、現在の設定
は、
・「差分クロール」:有効
・「インデックスの有効期限」:1日
・クロールの実行:0 0 * * * ?      (←○○時ちょうど:1時間おき:のつもり) 


  ※サーバは毎朝起動し、夕方終業時にシャットダウン

上記の設定・運用だと、ちょうど24時間後のクロール実行後に
「追加されたドキュメント」がすべて消えたような状態になっているんです。
で、その1時間後のクロールでまたドキュメントが追加されます。(空白の1時間)
この時は、フォルダの文書はどれも更新していないので、そのためにインデックス
の有効期限の「1日」が効いて全て消えたのかと思うのですが、
ファイルをどれも更新しないと、このような動きになるのでしょうか?
その空白の1時間の間に運悪く利用者が全文検索をかけると何も検索されな
いとなってしまいますが、これは仕方ないのでしょうか?
(「インデックスの有効期限」:なし は削除したファイルの情報がずっと残るよう
 なので使いたくないです。)

よろしくお願いします。




Fess-user メーリングリストの案内
Back to archive index