[fess-user 433] Re: ファイルシステムクロール時のPDF文字化けについて

Back to archive index

Shinsuke Sugaya shins****@yahoo*****
2011年 3月 11日 (金) 14:22:46 JST


菅谷です.

情報をありがとうございます.
利用しているpdfbox関連の問題かと思うので
確認してみます.

よろしくお願いいたします.

shinsuke


2011年3月11日12:01 小島拓也 <t-koj****@minor*****>:
> 以前マルチコアの件でお世話になった小島です。
>
> このたび、実運用させていただいているFess3.1.3→Fess4.0.0への
> バージョンアップをしました。
>
> これまで(Fess3.1.3)は、どのPDFファイルも正常にクロールできて
> いたのですが、Fess4.0.0にするとファイル内容が文字化けしてしまう
> PDFファイルが一部でてきました。(ファイル名は文字化けしません)
> ファイル名は化けていないため、リンクは正常に飛ばせますが
> ファイル内容へのキーワード検索が効いていない状態です。
>
> PDFファイルを調べてみたところ、
>
> ファイル内容が文字化けするPDF ・・・ エンコーディング
> 90ms-RKSJ-H
> 文字化けしないPDF ・・・ エンコーディング
> Identity-H
>
> という違いはありました。
>
> 具体的な文字化けが発生した状況のイメージは以下のようになります。
> (ファイル名は化けずに要約部分だけ化ける)
> ? pdf - Google 検索
> http://www.google.com/search?num=50&hl=ja&lr=&q=%E8%85%80%E3%80%80pdf&aq=f&aqi=&aql=&oq=
>
> なにか対応策のヒントになるようなことがもしありましたら
> 教えていただけないでしょうか?
>
> よろしくお願いします。
>
> p.s. バージョンアップの際、以前教えていただいたマルチコア化はうまくいき
> ました。1PCで2つの検索サイトを運用可能となり大変助かっています。
> 有難うございます。
>
> _______________________________________________
> Fess-user mailing list
> Fess-****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/fess-user
>




Fess-user メーリングリストの案内
Back to archive index