[groonga-dev,03940] Re: ベクターカラムの全文検索について

Back to archive index

Naoya Murakami visio****@gmail*****
2016年 2月 17日 (水) 20:54:38 JST


村上と申します。

2016年2月17日 16:22 Seto Ryuta <rseto****@gmail*****>:

> お世話になっております。瀬戸と申します。
>
> Groongaのベクターカラムを対象とした全文検索について質問があります。
> 以下の設定で語彙表ができ、全文検索ができることがわかりました。
> しかし、Groongaのドキュメントには、「ShortText, Text,
> LongTextの3つの型についてはベクターとして保存したり出力したりすることはできますが、検索条件やドリルダウン条件に指定することができません。」
> という記述があります。
> ( http://groonga.org/ja/docs/reference/types.html#limitations-about-types
> )
>
> 上記のような検索はしないほうが良いのでしょうか?
> ご教示いただければ幸いです。
> ( Groongaは5.1.2を使っています。 )
>
>
問題ないと思います。
Groongaではベクターを指定してもちゃんとBigramにトークナイズ
してくれて、転置索引を使って高速に検索できます。

昔はインデックスを使わない検索ができなかったようですが、
今はインデックス無しでもfilterならシーケンシャルでも一致検索は
できるようです。queryは今もできなそうです。
http://groonga.org/ja/blog/2015/07/29/release.html

ドリルダウンもできると思います。
ただし、数値型のドリルダウンに比べて遅いと思います。
参照型ベクター(テーブル型)の形にしておけば、テキストでも
高速にドリルダウンできます。

参考
http://qiita.com/groonga/items/3b41893f3fe5230f5b1f

column_create BigramTerms entry_vector
> COLUMN_INDEX|WITH_SECTION|WITH_POSITION Entry vector
>

余談ですが、インデックス対象のカラムを複数にする必要がなければ、
WITH_SECTIONはなくても大丈夫です。
-------------- next part --------------
HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B...
Télécharger 



groonga-dev メーリングリストの案内
Back to archive index