Naoya Murakami
visio****@gmail*****
2016年 2月 17日 (水) 20:54:38 JST
村上と申します。 2016年2月17日 16:22 Seto Ryuta <rseto****@gmail*****>: > お世話になっております。瀬戸と申します。 > > Groongaのベクターカラムを対象とした全文検索について質問があります。 > 以下の設定で語彙表ができ、全文検索ができることがわかりました。 > しかし、Groongaのドキュメントには、「ShortText, Text, > LongTextの3つの型についてはベクターとして保存したり出力したりすることはできますが、検索条件やドリルダウン条件に指定することができません。」 > という記述があります。 > ( http://groonga.org/ja/docs/reference/types.html#limitations-about-types > ) > > 上記のような検索はしないほうが良いのでしょうか? > ご教示いただければ幸いです。 > ( Groongaは5.1.2を使っています。 ) > > 問題ないと思います。 Groongaではベクターを指定してもちゃんとBigramにトークナイズ してくれて、転置索引を使って高速に検索できます。 昔はインデックスを使わない検索ができなかったようですが、 今はインデックス無しでもfilterならシーケンシャルでも一致検索は できるようです。queryは今もできなそうです。 http://groonga.org/ja/blog/2015/07/29/release.html ドリルダウンもできると思います。 ただし、数値型のドリルダウンに比べて遅いと思います。 参照型ベクター(テーブル型)の形にしておけば、テキストでも 高速にドリルダウンできます。 参考 http://qiita.com/groonga/items/3b41893f3fe5230f5b1f column_create BigramTerms entry_vector > COLUMN_INDEX|WITH_SECTION|WITH_POSITION Entry vector > 余談ですが、インデックス対象のカラムを複数にする必要がなければ、 WITH_SECTIONはなくても大丈夫です。 -------------- next part -------------- HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B...Télécharger