Shinsuke Sugaya
shins****@yahoo*****
2011年 3月 11日 (金) 14:22:46 JST
菅谷です. 情報をありがとうございます. 利用しているpdfbox関連の問題かと思うので 確認してみます. よろしくお願いいたします. shinsuke 2011年3月11日12:01 小島拓也 <t-koj****@minor*****>: > 以前マルチコアの件でお世話になった小島です。 > > このたび、実運用させていただいているFess3.1.3→Fess4.0.0への > バージョンアップをしました。 > > これまで(Fess3.1.3)は、どのPDFファイルも正常にクロールできて > いたのですが、Fess4.0.0にするとファイル内容が文字化けしてしまう > PDFファイルが一部でてきました。(ファイル名は文字化けしません) > ファイル名は化けていないため、リンクは正常に飛ばせますが > ファイル内容へのキーワード検索が効いていない状態です。 > > PDFファイルを調べてみたところ、 > > ファイル内容が文字化けするPDF ・・・ エンコーディング > 90ms-RKSJ-H > 文字化けしないPDF ・・・ エンコーディング > Identity-H > > という違いはありました。 > > 具体的な文字化けが発生した状況のイメージは以下のようになります。 > (ファイル名は化けずに要約部分だけ化ける) > ? pdf - Google 検索 > http://www.google.com/search?num=50&hl=ja&lr=&q=%E8%85%80%E3%80%80pdf&aq=f&aqi=&aql=&oq= > > なにか対応策のヒントになるようなことがもしありましたら > 教えていただけないでしょうか? > > よろしくお願いします。 > > p.s. バージョンアップの際、以前教えていただいたマルチコア化はうまくいき > ました。1PCで2つの検索サイトを運用可能となり大変助かっています。 > 有難うございます。 > > _______________________________________________ > Fess-user mailing list > Fess-****@lists***** > http://lists.sourceforge.jp/mailman/listinfo/fess-user >