[Senna-dev 179] Re: バージョンアップ手順

Back to archive index

taro****@taf***** taro****@taf*****
2005年 11月 18日 (金) 16:44:35 JST


坂本です。

From: taro****@taf*****
Subject: [Senna-dev 178] Re: バージョンアップ手順
Date: Fri, 18 Nov 2005 16:03:45 +0900

> > // share->keyinfo[i].senna = sen_index_create(buf, sizeof(my_off_t), SEN_INDEX_NORMALIZE, 0, sen_enc_default);
> > share->keyinfo[i].senna = sen_index_create(buf, sizeof(my_off_t), SEN_INDEX_NORMALIZE|SEN_INDEX_SPLIT_ALPHA|SEN_INDEX_SPLIT_DIGIT|SEN_INDEX_SPLIT_SYMBOL|SEN_INDEX_NGRAM, 0, sen_enc_default);
> > 
> > こういうフラグは、
> > ビットが立ってるか立ってないかなので、| ですよ。
> 
> とんだ勘違いですね。コンパイルしなおしてみます。
> 
> SEN_INDEX_SPLIT_* 
> 
> がなにものか理解してないですが...

NORMALIZE のみ

-rw-rw----  1 mysql mysql   8458240 Nov 18 16:21 urld3.002.SEN
-rw-rw----  1 mysql mysql 537464832 Nov 18 16:21 urld3.002.SEN.i
-rw-rw----  1 mysql mysql  22614016 Nov 18 16:22 urld3.002.SEN.i.c
-rw-rw----  1 mysql mysql  12652544 Nov 18 16:21 urld3.002.SEN.l
-rw-rw----  1 mysql mysql  62349552 Nov 18 16:21 urld3.MYD
-rw-rw----  1 mysql mysql   2312192 Nov 18 16:22 urld3.MYI
-rw-rw----  1 mysql mysql      8910 Nov 18 16:21 urld3.frm

全部フラグ

-rw-rw----  1 mysql mysql   8458240 Nov 18 16:19 urld3.002.SEN
-rw-rw----  1 mysql mysql 538251264 Nov 18 16:20 urld3.002.SEN.i
-rw-rw----  1 mysql mysql   8196096 Nov 18 16:20 urld3.002.SEN.i.c
-rw-rw----  1 mysql mysql  12652544 Nov 18 16:19 urld3.002.SEN.l
-rw-rw----  1 mysql mysql  62349552 Nov 18 16:19 urld3.MYD
-rw-rw----  1 mysql mysql   2312192 Nov 18 16:20 urld3.MYI
-rw-rw----  1 mysql mysql      8910 Nov 18 16:19 urld3.frm


ファイルサイズ若干違って、たしかに検索結果もちょっと違います。

■ケース1

オリジナル文書  1610612033       検索キーワード  1610612033

どちらもあたる。

■ケース2

オリジナル文書  1610612033       検索キーワード  161061203

どちらもあたる。

■ケース3
オリジナル文書  1610612033       検索キーワード   61061203

N-gram のみあたる。

■ケース3
オリジナル文書  1610612033       検索キーワード  1610

N-gram のみあたる。

単語インデックスほうは前方一致で、文字列が5byte 以上なら意味のある
単語として認識するようです。



Senna-dev メーリングリストの案内
Back to archive index