limol****@nifty*****
limol****@nifty*****
2011年 3月 31日 (木) 21:12:12 JST
クニカタです。お世話になっております。 すばやい対応ありがとうございます! Fessで試してみました。 s2-robot-0.5.0.jar ↓ s2-robot-0.5.1-20110330.192026-5.jar に差し替えて、 以下のようなdicon設定で、うまくテキスト抽出できました。 -------------- <component name="msOfficeCmdExtractor" class="org.seasar.robot.extractor.impl.CommandExtractor"> <property name="command"> "cmd /c xdoc2txt -s -r=0 $INPUT_FILE > $OUTPUT_FILE" </property> <property name="outputEncoding">"Shift_JIS"</property> <property name="outputExtension">".txt"</property> </component> -------------- #「outputExtension」フィールド追加も、いい感じす! ありがとうございました〜 ----- Original Message ----- >Date: Thu, 31 Mar 2011 04:22:42 +0900 >From: Shinsuke Sugaya <shins****@yahoo*****> >To: fess-****@lists***** >Subject: [fess-user 447] Re: > CommandExtractor 仕様について提案 > > >菅谷です。 > >情報をありがとうございます。 >Fessで差し替えて動くかは確認してませんが、 >S2Robotの方を修正しました。 > >https://www.seasar.org/maven/maven2-snapshot/org/seasar/robot/s2-robot/0.5.1- SNAPSHOT/s2-robot-0.5.1-20110330.192026-5.jar > >よろしくお願いいたします。 > >shinsuke > >2011年3月30日22:30 <limol****@nifty*****>: >> クニカタです。お世話になっております。 >> >> http://s2robot.sandbox.seasar.org/ja/extractor-guide.html >> ↑を参考にして、 >> CommandExtractorの使用を検討しています。 >> >> xdoc2txt.exeを呼び出しで、以下のように設定をしたところ >> うまくテキスト抽出できませんでした。 >> <component name="msOfficeCmdExtractor" class="org.seasar.robot.extractor.im pl. >> CommandExtractor"> >> <property name="command">"cmd /c xdoc2txt -s -r=0 $INPUT_FILE > $OUTPUT_F >> ILE"</property> >> <property name="outputEncoding">"Shift_JIS"</property> >> </component> >> >> CommandExtractorの処理で、入力用テンポラリファイルを作成している部分で >> 拡張子の前に「.」がつかないテンポラリファイルが作成されていることが原因でし た >> 。 >> xdoc2txt.exeでは拡張子によってファイル種を判別しているため、うまく動きませ んで >> した。 >> (※pdftotext.exeなどでは問題ないです。) >> >> とりあえずクラスファイルをDIする感じでは対応できるのですが、 >> 次バージョンで、なにか対応願えませんでしょうか? >> >> _______________________________________________ >> Fess-user mailing list >> Fess-****@lists***** >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > >_______________________________________________ >Fess-user mailing list >Fess-****@lists***** >http://lists.sourceforge.jp/mailman/listinfo/fess-user