[groonga-dev,03265] Re: TokenTrigramを使った環境での2文字検索について

Back to archive index

Naoya Murakami visio****@gmail*****
2015年 5月 21日 (木) 20:22:09 JST


村上です。

お久しぶりです!

すいません。
ついメールしちゃいましたが、よくよく考えるともう少し考慮が必要ですね。。

次のトークンが字種境界であるかどうかという判定もいるかもしれません。
(このあたり無駄なく奇麗に書く自身がないからPRを投げるのをやめておいたのを
思い出しました。)

(1) 1トークンでクエリが2文字だけ(UNMATURED)の場合
クエリ:"だよ"
本文:"だよね"
はヒットするべき(強制前方一致フラグつける)

(2) 複数トークンで2つめのトークンが2文字だけの場合
クエリ:"ABCだよ"
本文:"ABCだよね"
はヒットするべき(強制前方一致フラグつける)

(3) 複数トークンで1つめのトークンが2文字だけの場合
クエリ:"これABC"
本文:"これはABC"
はヒットしないべき(強制前方一致フラグつけない)

以上です。


2015年5月21日 19:57 yoku ts. <yoku0****@gmail*****>:

> わあ、お久しぶりです :)
> ありがとうございます。
>
> このへんをホゲればいいいみたいですよ! 須藤さん! (??????
>
>
> ところで、メーリングリストのドメイン変わったんですね。
> これか。。
> Slashdot JapanならびにSourceForge.JP、サイト名称変更のお知らせ | OSDN株式会社
>
> http://osdn.co.jp/press/2015/04/%E3%82%B5%E3%82%A4%E3%83%88%E5%90%8D%E7%A7%B0%E5%A4%89%E6%9B%B4%E3%81%AE%E3%81%8A%E7%9F%A5%E3%82%89%E3%81%9B
>
>
> yoku0825,
>
>
>
> 2015年5月21日 19:44 Naoya Murakami <visio****@gmail*****>:
> > 村上です。
> >
> > たしか、今のTokenTrigramはそんな感じでした。
> > (かなり久しぶりにGroongaのソース見ました)
> >
> >
> https://github.com/groonga/groonga/blob/master/lib/token_cursor.c#L248-L250
> > (1個目のトークンはUNMATUREDでGRN_TOKEN_REACH_ENDですがGRN_TOKEN_LASTじゃない)
> >
> >
> https://github.com/groonga/groonga/blob/master/lib/tokenizers.c#L433-L435
> >
> > GET時のトークンが1個で、且つ、REACH_ENDの場合(字種境界じゃない場合)は、
> > TokenTrigramでも強制前方一致検索されるとよさそうに思いました。
> >
> > 以上です。
> >
> >
> > 2015年5月21日 19:28 yoku ts. <yoku0****@gmail*****>:
> >>
> >> こんばんは、yoku0825といいます。
> >>
> >> TokenTrigramでトークナイズした文書を2文字で検索したいのですが、
> >>
> TokenTrigramって「TokenBigramに1文字の検索文字列を投げた時のように前方一致で上手くやってくれる」機能はなかったりしますか?
> >>
> >> 1文字のクエリーを投げると前方一致にすり替えてくれてそうなんですが、2文字はマッチ検索しているっぽいです。こういう仕様でしたっけ?
> >>
> >> https://gist.github.com/yoku0825/1da3aa16a2dd14e99f55
> >>
> >>
> >> 取り敢えずyumでmysql-community-mroongaを突っ込んだもので再現しています。
> >>
> >>
> >> ( ´-`).oO(TokenBigramからTokenTrigramに乗り換えようとしたら、2文字のクエリーだけ盛大におかしくて。。
> >> ( ´-`).oO(mroonga_match_escalation_thresholdを有効にしろとかそんな感じですかね…?
> >>
> >>
> >> yoku0825,
> >> _______________________________________________
> >> groonga-dev mailing list
> >> groon****@lists*****
> >> http://lists.osdn.me/mailman/listinfo/groonga-dev
> >
> >
> >
> > _______________________________________________
> > groonga-dev mailing list
> > groon****@lists*****
> > http://lists.osdn.me/mailman/listinfo/groonga-dev
> >
> _______________________________________________
> groonga-dev mailing list
> groon****@lists*****
> http://lists.osdn.me/mailman/listinfo/groonga-dev
>
-------------- next part --------------
HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B...
Télécharger 



groonga-dev メーリングリストの案内
Back to archive index