zl程序教程

您现在的位置是:首页 >  数据库

当前栏目

mysql模糊搜索的方法介绍

mysql搜索方法 介绍 模糊
2023-06-13 09:14:40 时间
网上查了一下,有两种方法,第一种最土的方法:使用like语句第二种听涛哥说用全文索引,就在网上搜一下:如何在MySQL中获得更好的全文搜索结果

很多互联网应用程序都提供了全文搜索功能,用户可以使用一个词或者词语片断作为查询项目来定位匹配的记录。在后台,这些程序使用在一个SELECT查询中的LIKE语句来执行这种查询,尽管这种方法可行,但对于全文查找而言,这是一种效率极端低下的方法,尤其在处理大量数据的时候。

mysql针对这一问题提供了一种基于内建的全文查找方式的解决方案。在此,开发者只需要简单地标记出需要全文查找的字段,然后使用特殊的MySQL方法在那些字段运行搜索,这不仅仅提高了性能和效率(因为MySQL对这些字段做了索引来优化搜索),而且实现了更高质量的搜索,因为MySQL使用自然  语言来智能地对结果评级,以去掉不相关的项目。
这篇文章将向您讲述在MySQL中如何进行全文搜索。

在进行数据库查询时,有完整查询和模糊查询之分。
SELECT字段FROM表WHERE某字段Like条件
其中关于条件,SQL提供了四种匹配模式:
1,%:表示任意0个或多个字符。可匹配任意类型和长度的字符,有些情况下若是中文,请使用两个百分号(%%)表示。
比如SELECT*FROM[user]WHEREu_nameLIKE"%三%"
将会把u_name为“张三”,“张猫三”、“三脚猫”,“唐三藏”等等有“三”的记录全找出来。
另外,如果需要找出u_name中既有“三”又有“猫”的记录,请使用and条件
SELECT*FROM[user]WHEREu_nameLIKE"%三%"ANDu_nameLIKE"%猫%"
若使用SELECT*FROM[user]WHEREu_nameLIKE"%三%猫%"
虽然能搜索出“三脚猫”,但不能搜索出符合条件的“张猫三”。
2,_:表示任意单个字符。匹配单个任意字符,它常用来限制表达式的字符长度语句:
比如SELECT*FROM[user]WHEREu_nameLIKE"_三_"
只找出“唐三藏”这样u_name为三个字且中间一个字是“三”的;
再比如SELECT*FROM[user]WHEREu_nameLIKE"三__";
只找出“三脚猫”这样name为三个字且第一个字是“三”的;
3,[]:表示括号内所列字符中的一个(类似正则表达式)。指定一个字符、字符串或范围,要求所匹配对象为它们中的任一个。
比如SELECT*FROM[user]WHEREu_nameLIKE"[张李王]三"
将找出“张三”、“李三”、“王三”(而不是“张李王三”);
如[]内有一系列字符(01234、abcde之类的)则可略写为“0-4”、“a-e”
SELECT*FROM[user]WHEREu_nameLIKE"老[1-9]"
将找出“老1”、“老2”、……、“老9”;
4,[^]:表示不在括号所列之内的单个字符。其取值和[]相同,但它要求所匹配对象为指定字符以外的任一个字符。
比如SELECT*FROM[user]WHEREu_nameLIKE"[^张李王]三"
将找出不姓“张”、“李”、“王”的“赵三”、“孙三”等;
SELECT*FROM[user]WHEREu_nameLIKE"老[^1-4]";
将排除“老1”到“老4”,寻找“老5”、“老6”、……
5,查询内容包含通配符时
由于通配符的缘故,导致我们查询特殊字符“%”、“_”、“[”的语句无法正常实现,而把特殊字符用“[]”括起便可正常查询。据此我们写出以下函数:
functionsqlencode(str)
str=replace(str,"[","[[]")"此句一定要在最前
str=replace(str,"_","[_]")
str=replace(str,"%","[%]")
sqlencode=str
endfunction
在查询前将待查字符串先经该函数处理即可。

1、设置基本表格
从创建例子表格开始,使用以下的SQL命令:
mysql>CREATETABLEreviews(idINT(5)PRIMARYKEYNOTNULLAUTO_INCREMENT,dataTEXT);
以上命令创建了一个简单的音乐专集资料库(主要是整段的文字),然后向这个表格中添加一些记录:
mysql>INSERTINTO`reviews`(`id`,`data`)VALUES
(1,"GingerboyhasanewsingleoutcalledThrowingRocks.It\"sgreat!");
mysql>INSERTINTO`reviews`(`id`,`data`)VALUES
(2,"Helloall,IreallylikethenewMadonnasingle.
Oneofthehottesttrackscurrentlyplaying...I\"vebeenlisteningtoitallday");
mysql>INSERTINTO`reviews`(`id`,`data`)
VALUES(3,"HaveyouheardthenewbandHotterThanHell?
Theyhavefivemembersandtheyburntheirinstrumentswhentheyplayinconcerts.
Theseguystotallyrock!Like,awesome,dude!");
验证数据的正确录入:
mysql>SELECT*FROMreviews;
+----+--------------------------------------------+
iddata
+----+--------------------------------------------+
1Gingerboyhasanewsingleoutcalled...

2Helloall,IreallylikethenewMadon...
3HaveyouheardthenewbandHotterThan...
+----+--------------------------------------------+
3rowsinset(0.00sec)
2、定义全文搜索字段
接下来,定义您要作为全文搜索索引的字段
mysql>ALTERTABLEreviewsADDFULLTEXTINDEX(data);
QueryOK,3rowsaffected(0.21sec)
Records:3Duplicates:0Warnings:0
使用SHOWINDEXES命令来检查索引已经被添加了:
mysql>SHOWINDEXESFROMreviews;
+---------+---------------+--------+------+------------+---------+
TableColumn_namePackedNullIndex_typeComment
----------+---------------+--------+------+------------+---------+
reviewsidNULLBTREE
reviewsdataNULLYESFULLTEXT
+---------+---------------+--------+------+------------+---------+
3、运行全文搜索
当您拥有了数据和索引,就可以使用MySQL的全文搜索了,最简单的全文搜索方式是带有MATCH...AGAINST语句的SELECT查询,以下是一个简单的例子,可以来查找含有单词“single”的记录:
mysql>SELECTidFROMreviewsWHEREMATCH(data)AGAINST("single");+----+
id
+----+
1
2
+----+
2rowsinset(0.00sec)
在此,MATCH()将作为参数传递给它的字段中的文字与传递给AGAINST()的参数进行比较,如果有匹配的,那就按照正常的方式返回。注意您可以传递不止一个字段用MATCH()来查看­-只需用逗号来分割字段列表。
当MySQL收到了一个全文搜索的请求,它就在内部对每个记录进行评分,不匹配的记录得分为零,而“更相关”的记录会得到比“不太相关”的记录相对更高的分数。相关性是由MySQL的一系列区分标准来决定的,查看MySQL的用户手册可以得到更多的信息。
想看到每个记录的评分如何,只需要返回MATCH()方法作为结果集的一部分,如下所示:
mysql>SELECTid,MATCH(data)AGAINST("rock")FROMreviews;

+----+-------------------------------+
idMATCH(data)AGAINST("rock")
+----+-------------------------------+
10
20
31.3862514533815
+----+-------------------------------+
3rowsinset(0.00sec)
4、使用逻辑搜索修饰符(Booleansearchmodifiers)
您还可以使用逻辑搜索修饰符来进行更精确的搜索,这通过在AGAINST语句中添加特殊的INBOOLEANMODE修饰符来实现,在以下的例子中,将查找含有单词“single”但是没有“Madonna”的记录:
mysql>SELECTidFROMreviewsWHEREMATCH(data)AGAINST("+single-madonna"INBOOLEANMODE);
+----+
id
+----+
1
+----+
1rowinset(0.00sec)
这一搜索特性通常用于搜索单词片断(而不是完整的词语),这可以通过在INBOOLEANMODE语句中的*(星号)操作符来实现,以下的例子展示了如何查找单词中含有“hot”的记录:
mysql>SELECTidFROMreviewsWHEREMATCH(data)AGAINST("hot*"INBOOLEANMODE);+----+
id
+----+
3
2
+----+
2rowsinset(0.00sec)
您还可以使用这种方法来查找至少一个传递到AGAINST的参数中,以下的例子查找了至少包含单词“hell”和“rocks”中的一个的记录:
mysql>SELECTidFROMreviewsWHEREMATCH(data)AGAINST("hellrocks"INBOOLEANMODE);
+----+
id
+----+
1
3
+----+
3rowsinset(0.00sec)
以上的这些例子演示了相对于传统的SELECT...LIKE语句,进行全文搜索的更有效的方法,当您下一次需要编写MySQL数据库搜索界面的时候,您可以尝试这一方法。最终发现使用不了,原因是只有MyISAM引擎才支持全文索引,晕。好吧,还是用like进行搜索。。。