三井しょうた
01035****@gmail*****
2015年 5月 13日 (水) 15:09:47 JST
はじめまして。三井と申します。 parserとして、表題の 「TokenBigramIgnoreBlankSplitSymbolAlphaDigit」設定に関してですが、 ・空白を無視して処理する。 ・「090 0123 4567」に「9001」でマッチする。 と言う例がよく紹介されています。 今回データの例として、 「ゴルフ△青森』 ※△は全角スペース に対して、下記何れのキーワードでも検索結果が応答されるようにしたいと考えています。 1.「ゴルフ青森」※全角スペースなし 2.「ごるふ青森」※全角スペースなし 3.「ゴルフ」 4.「ごるふ」 かな、カナを無視したいので、 normalizerに、 「NormalizerMySQLUnicodeCIExceptKanaCIKanaWithVoicedSoundMark」 を設定したところ、3、4ではヒットしますが、1、2ではヒットしませんでした。 ※空白が無視されない 参考までに「NormalizerAuto」を利用すると、1、3でヒットしますが、2、4ではヒットしませんでした。 ※空白は無視されるが、かな、カナは同一視できない どういった設定をすれば良いかわからず、設定について何とかご教授いただきたいと 考えております。 <環境> CentOS 6.6 MySQL 5.6.24 (utf8) mroonga 5.0.2 以上、よろしくお願いいたします。 -------------- next part -------------- HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B...Télécharger