MySQL 全文索引的原理與缺陷
MySQL全文索引一種特殊的索引,它會(huì)把某個(gè)數(shù)據(jù)表的某個(gè)數(shù)據(jù)列出現(xiàn)過的所有單詞生成一份清單。
alter table tablename add fulltext(column1,column2)
說明:
只能在MyISAM數(shù)據(jù)表中創(chuàng)建
全文索引是以空格或標(biāo)點(diǎn)隔開才能搜到的,搜中文是搜不到(有專門的應(yīng)用支持中文分詞可以搜中文,但都不理想)
少于3個(gè)字符的單詞不會(huì)被包含在全文索引里,可以通過修改my.cnf修改選項(xiàng)
ft_min_word_len=3
重新啟動(dòng)MySQL服務(wù)器,用repair table tablename quick
為有關(guān)數(shù)據(jù)表重新生成全文索引
select * from tablename where match(column1,column2) against('word1 word2 word3')>0.001
match ... against 把column1,column2數(shù)據(jù)列中至少包含word1,word2,word3三個(gè)單詞之一的數(shù)據(jù)記錄查找到,在關(guān)鍵字match后的數(shù)據(jù)列必須 跟創(chuàng)建全文索引的數(shù)據(jù)列相同,檢索詞不區(qū)分大小寫和先后順序,少于3個(gè)字符的單詞通常被忽略。match... against ...表達(dá)式返回一個(gè)浮點(diǎn)數(shù)作為它本身的求值結(jié)果,這個(gè)數(shù)字反映了結(jié)果記錄與被檢索單詞的匹配程度。如果沒有匹配到任何記錄,或者匹配到的結(jié)果記錄太多反 而被忽略,表達(dá)式將返回0,表達(dá)式>0.001的作用是排除match的返回值太小的結(jié)果記錄。
select *,match(column1,column2) against ('word1 word2 word3') as mtch from tablename having mtch>0.01 order by mtch desc limit 5
找出最匹配的5條記錄,在where字句中不能使用假名,所以用having
布爾全文搜索的性能支持以下操作符:
+word:一個(gè)前導(dǎo)的加號(hào)表示該單詞必須 出現(xiàn)在返回的每一行的開頭位置。
-word: 一個(gè)前導(dǎo)的減號(hào)表示該單詞一定不能出現(xiàn)在任何返回的行中。
(無操作符):在默認(rèn)狀態(tài)下(當(dāng)沒有指定 + 或–的情況下),該單詞可有可無,但含有該單詞的行等級較高。這和MATCH() ... AGAINST()不使用IN BOOLEAN MODE修改程序時(shí)的運(yùn)作很類似。
> <這兩個(gè)操作符用來改變一個(gè)單詞對賦予某一行的相關(guān)值的影響。 > 操作符增強(qiáng)其影響,而 <操作符則減弱其影響。請參見下面的例子。
( )括號(hào)用來將單詞分成子表達(dá)式。括入括號(hào)的部分可以被嵌套。
~word:一個(gè)前導(dǎo)的代字號(hào)用作否定符, 用來否定單詞對該行相關(guān)性的影響。 這對于標(biāo)記“noise(無用信息)”的單詞很有用。包含這類單詞的行較其它行等級低。
word* :搜索以word開頭的單詞,只允許出現(xiàn)在單詞的末尾
"word1 word" :給定單詞必須出現(xiàn)在數(shù)據(jù)記錄中,先后順序也必須匹配,區(qū)分字母大小寫
select * from tablename where match(column1,column2) against ('+word1 +word2 -word3' in boolean mode')
布爾檢索只能返回1或者0,不再返回表示匹配程度的浮點(diǎn)數(shù)
全文索引的缺陷:
1.數(shù)據(jù)表越大,全文索引效果好,比較小的數(shù)據(jù)表會(huì)返回一些難以理解的結(jié)果。
2.全文檢索以整個(gè)單詞作為匹配對象,單詞變形(加上后綴,復(fù)數(shù)形式),就被認(rèn)為另一個(gè)單詞。
3.只有由字母,數(shù)字,單引號(hào),下劃線構(gòu)成的字符串被認(rèn)為是單詞,帶注音符號(hào)的字母仍是字母,像C++不再認(rèn)為是單詞
4.不區(qū)分大小寫
5.只能在MyISAM上使用
6.全文索引創(chuàng)建速度慢,而且對有全文索引的各種數(shù)據(jù)修改操作也慢
7.不支持中文
以上就是MySQL 全文索引的原理與缺陷的詳細(xì)內(nèi)容,更多關(guān)于MySQL 全文索引的資料請關(guān)注本站其它相關(guān)文章!
版權(quán)聲明:本站文章來源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有,歡迎引用、轉(zhuǎn)載,請保持原文完整并注明來源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站,禁止在非www.sddonglingsh.com所屬的服務(wù)器上建立鏡像,否則將依法追究法律責(zé)任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來,僅供學(xué)習(xí)參考,不代表本站立場,如有內(nèi)容涉嫌侵權(quán),請聯(lián)系alex-e#qq.com處理。