「TokenBigramIgnoreBlankSplitSymbolAlphaDigit」設定に関して (groonga-dev,03215) - Groonga - fulltext search engine.

はじめまして。三井と申します。

parserとして、表題の
「TokenBigramIgnoreBlankSplitSymbolAlphaDigit」設定に関してですが、

・空白を無視して処理する。
・「090 0123 4567」に「9001」でマッチする。

と言う例がよく紹介されています。

今回データの例として、
「ゴルフ△青森』 ※△は全角スペース
に対して、下記何れのキーワードでも検索結果が応答されるようにしたいと考えています。
１．「ゴルフ青森」※全角スペースなし
２．「ごるふ青森」※全角スペースなし
３．「ゴルフ」
４．「ごるふ」

かな、カナを無視したいので、
normalizerに、
「NormalizerMySQLUnicodeCIExceptKanaCIKanaWithVoicedSoundMark」
を設定したところ、３、４ではヒットしますが、１、２ではヒットしませんでした。
※空白が無視されない

参考までに「NormalizerAuto」を利用すると、１、３でヒットしますが、２、４ではヒットしませんでした。
※空白は無視されるが、かな、カナは同一視できない

どういった設定をすれば良いかわからず、設定について何とかご教授いただきたいと
考えております。

＜環境＞
CentOS 6.6
MySQL 5.6.24 (utf8)
mroonga 5.0.2

以上、よろしくお願いいたします。
-------------- next part --------------
HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B...
Télécharger

Groonga - fulltext search engine.

[groonga-dev,03215] 「TokenBigramIgnoreBlankSplitSymbolAlphaDigit」設定に関して