mysql模糊搜索的方法介绍
2023-06-13 09:14:40 时间
网上查了一下,有两种方法,第一种最土的方法:使用like语句第二种听涛哥说用全文索引,就在网上搜一下:如何在MySQL中获得更好的全文搜索结果
很多互联网应用程序都提供了全文搜索功能,用户可以使用一个词或者词语片断作为查询项目来定位匹配的记录。在后台,这些程序使用在一个SELECT查询中的LIKE语句来执行这种查询,尽管这种方法可行,但对于全文查找而言,这是一种效率极端低下的方法,尤其在处理大量数据的时候。
mysql针对这一问题提供了一种基于内建的全文查找方式的解决方案。在此,开发者只需要简单地标记出需要全文查找的字段,然后使用特殊的MySQL方法在那些字段运行搜索,这不仅仅提高了性能和效率(因为MySQL对这些字段做了索引来优化搜索),而且实现了更高质量的搜索,因为MySQL使用自然 语言来智能地对结果评级,以去掉不相关的项目。
这篇文章将向您讲述在MySQL中如何进行全文搜索。
在进行数据库查询时,有完整查询和模糊查询之分。
SELECT字段FROM表WHERE某字段Like条件
其中关于条件,SQL提供了四种匹配模式:
1,%:表示任意0个或多个字符。可匹配任意类型和长度的字符,有些情况下若是中文,请使用两个百分号(%%)表示。
比如SELECT*FROM[user]WHEREu_nameLIKE"%三%"
将会把u_name为“张三”,“张猫三”、“三脚猫”,“唐三藏”等等有“三”的记录全找出来。
另外,如果需要找出u_name中既有“三”又有“猫”的记录,请使用and条件
SELECT*FROM[user]WHEREu_nameLIKE"%三%"ANDu_nameLIKE"%猫%"
若使用SELECT*FROM[user]WHEREu_nameLIKE"%三%猫%"
虽然能搜索出“三脚猫”,但不能搜索出符合条件的“张猫三”。
2,_:表示任意单个字符。匹配单个任意字符,它常用来限制表达式的字符长度语句:
比如SELECT*FROM[user]WHEREu_nameLIKE"_三_"
只找出“唐三藏”这样u_name为三个字且中间一个字是“三”的;
再比如SELECT*FROM[user]WHEREu_nameLIKE"三__";
只找出“三脚猫”这样name为三个字且第一个字是“三”的;
3,[]:表示括号内所列字符中的一个(类似正则表达式)。指定一个字符、字符串或范围,要求所匹配对象为它们中的任一个。
比如SELECT*FROM[user]WHEREu_nameLIKE"[张李王]三"
将找出“张三”、“李三”、“王三”(而不是“张李王三”);
如[]内有一系列字符(01234、abcde之类的)则可略写为“0-4”、“a-e”
SELECT*FROM[user]WHEREu_nameLIKE"老[1-9]"
将找出“老1”、“老2”、……、“老9”;
4,[^]:表示不在括号所列之内的单个字符。其取值和[]相同,但它要求所匹配对象为指定字符以外的任一个字符。
比如SELECT*FROM[user]WHEREu_nameLIKE"[^张李王]三"
将找出不姓“张”、“李”、“王”的“赵三”、“孙三”等;
SELECT*FROM[user]WHEREu_nameLIKE"老[^1-4]";
将排除“老1”到“老4”,寻找“老5”、“老6”、……
5,查询内容包含通配符时
由于通配符的缘故,导致我们查询特殊字符“%”、“_”、“[”的语句无法正常实现,而把特殊字符用“[]”括起便可正常查询。据此我们写出以下函数:
functionsqlencode(str)
str=replace(str,"[","[[]")"此句一定要在最前
str=replace(str,"_","[_]")
str=replace(str,"%","[%]")
sqlencode=str
endfunction
在查询前将待查字符串先经该函数处理即可。
1、设置基本表格
从创建例子表格开始,使用以下的SQL命令:
mysql>CREATETABLEreviews(idINT(5)PRIMARYKEYNOTNULLAUTO_INCREMENT,dataTEXT);
以上命令创建了一个简单的音乐专集资料库(主要是整段的文字),然后向这个表格中添加一些记录:
mysql>INSERTINTO`reviews`(`id`,`data`)VALUES
(1,"GingerboyhasanewsingleoutcalledThrowingRocks.It\"sgreat!");
mysql>INSERTINTO`reviews`(`id`,`data`)VALUES
(2,"Helloall,IreallylikethenewMadonnasingle.
Oneofthehottesttrackscurrentlyplaying...I\"vebeenlisteningtoitallday");
mysql>INSERTINTO`reviews`(`id`,`data`)
VALUES(3,"HaveyouheardthenewbandHotterThanHell?
Theyhavefivemembersandtheyburntheirinstrumentswhentheyplayinconcerts.
Theseguystotallyrock!Like,awesome,dude!");
验证数据的正确录入:
mysql>SELECT*FROMreviews;
+----+--------------------------------------------+
iddata
+----+--------------------------------------------+
1Gingerboyhasanewsingleoutcalled...
2Helloall,IreallylikethenewMadon...
3HaveyouheardthenewbandHotterThan...
+----+--------------------------------------------+
3rowsinset(0.00sec)
2、定义全文搜索字段
接下来,定义您要作为全文搜索索引的字段
mysql>ALTERTABLEreviewsADDFULLTEXTINDEX(data);
QueryOK,3rowsaffected(0.21sec)
Records:3Duplicates:0Warnings:0
使用SHOWINDEXES命令来检查索引已经被添加了:
mysql>SHOWINDEXESFROMreviews;
+---------+---------------+--------+------+------------+---------+
TableColumn_namePackedNullIndex_typeComment
----------+---------------+--------+------+------------+---------+
reviewsidNULLBTREE
reviewsdataNULLYESFULLTEXT
+---------+---------------+--------+------+------------+---------+
3、运行全文搜索
当您拥有了数据和索引,就可以使用MySQL的全文搜索了,最简单的全文搜索方式是带有MATCH...AGAINST语句的SELECT查询,以下是一个简单的例子,可以来查找含有单词“single”的记录:
mysql>SELECTidFROMreviewsWHEREMATCH(data)AGAINST("single");+----+
id
+----+
1
2
+----+
2rowsinset(0.00sec)
在此,MATCH()将作为参数传递给它的字段中的文字与传递给AGAINST()的参数进行比较,如果有匹配的,那就按照正常的方式返回。注意您可以传递不止一个字段用MATCH()来查看-只需用逗号来分割字段列表。
当MySQL收到了一个全文搜索的请求,它就在内部对每个记录进行评分,不匹配的记录得分为零,而“更相关”的记录会得到比“不太相关”的记录相对更高的分数。相关性是由MySQL的一系列区分标准来决定的,查看MySQL的用户手册可以得到更多的信息。
想看到每个记录的评分如何,只需要返回MATCH()方法作为结果集的一部分,如下所示:
mysql>SELECTid,MATCH(data)AGAINST("rock")FROMreviews;
+----+-------------------------------+
idMATCH(data)AGAINST("rock")
+----+-------------------------------+
10
20
31.3862514533815
+----+-------------------------------+
3rowsinset(0.00sec)
4、使用逻辑搜索修饰符(Booleansearchmodifiers)
您还可以使用逻辑搜索修饰符来进行更精确的搜索,这通过在AGAINST语句中添加特殊的INBOOLEANMODE修饰符来实现,在以下的例子中,将查找含有单词“single”但是没有“Madonna”的记录:
mysql>SELECTidFROMreviewsWHEREMATCH(data)AGAINST("+single-madonna"INBOOLEANMODE);
+----+
id
+----+
1
+----+
1rowinset(0.00sec)
这一搜索特性通常用于搜索单词片断(而不是完整的词语),这可以通过在INBOOLEANMODE语句中的*(星号)操作符来实现,以下的例子展示了如何查找单词中含有“hot”的记录:
mysql>SELECTidFROMreviewsWHEREMATCH(data)AGAINST("hot*"INBOOLEANMODE);+----+
id
+----+
3
2
+----+
2rowsinset(0.00sec)
您还可以使用这种方法来查找至少一个传递到AGAINST的参数中,以下的例子查找了至少包含单词“hell”和“rocks”中的一个的记录:
mysql>SELECTidFROMreviewsWHEREMATCH(data)AGAINST("hellrocks"INBOOLEANMODE);
+----+
id
+----+
1
3
+----+
3rowsinset(0.00sec)
以上的这些例子演示了相对于传统的SELECT...LIKE语句,进行全文搜索的更有效的方法,当您下一次需要编写MySQL数据库搜索界面的时候,您可以尝试这一方法。最终发现使用不了,原因是只有MyISAM引擎才支持全文索引,晕。好吧,还是用like进行搜索。。。
很多互联网应用程序都提供了全文搜索功能,用户可以使用一个词或者词语片断作为查询项目来定位匹配的记录。在后台,这些程序使用在一个SELECT查询中的LIKE语句来执行这种查询,尽管这种方法可行,但对于全文查找而言,这是一种效率极端低下的方法,尤其在处理大量数据的时候。
mysql针对这一问题提供了一种基于内建的全文查找方式的解决方案。在此,开发者只需要简单地标记出需要全文查找的字段,然后使用特殊的MySQL方法在那些字段运行搜索,这不仅仅提高了性能和效率(因为MySQL对这些字段做了索引来优化搜索),而且实现了更高质量的搜索,因为MySQL使用自然 语言来智能地对结果评级,以去掉不相关的项目。
这篇文章将向您讲述在MySQL中如何进行全文搜索。
在进行数据库查询时,有完整查询和模糊查询之分。
SELECT字段FROM表WHERE某字段Like条件
其中关于条件,SQL提供了四种匹配模式:
1,%:表示任意0个或多个字符。可匹配任意类型和长度的字符,有些情况下若是中文,请使用两个百分号(%%)表示。
比如SELECT*FROM[user]WHEREu_nameLIKE"%三%"
将会把u_name为“张三”,“张猫三”、“三脚猫”,“唐三藏”等等有“三”的记录全找出来。
另外,如果需要找出u_name中既有“三”又有“猫”的记录,请使用and条件
SELECT*FROM[user]WHEREu_nameLIKE"%三%"ANDu_nameLIKE"%猫%"
若使用SELECT*FROM[user]WHEREu_nameLIKE"%三%猫%"
虽然能搜索出“三脚猫”,但不能搜索出符合条件的“张猫三”。
2,_:表示任意单个字符。匹配单个任意字符,它常用来限制表达式的字符长度语句:
比如SELECT*FROM[user]WHEREu_nameLIKE"_三_"
只找出“唐三藏”这样u_name为三个字且中间一个字是“三”的;
再比如SELECT*FROM[user]WHEREu_nameLIKE"三__";
只找出“三脚猫”这样name为三个字且第一个字是“三”的;
3,[]:表示括号内所列字符中的一个(类似正则表达式)。指定一个字符、字符串或范围,要求所匹配对象为它们中的任一个。
比如SELECT*FROM[user]WHEREu_nameLIKE"[张李王]三"
将找出“张三”、“李三”、“王三”(而不是“张李王三”);
如[]内有一系列字符(01234、abcde之类的)则可略写为“0-4”、“a-e”
SELECT*FROM[user]WHEREu_nameLIKE"老[1-9]"
将找出“老1”、“老2”、……、“老9”;
4,[^]:表示不在括号所列之内的单个字符。其取值和[]相同,但它要求所匹配对象为指定字符以外的任一个字符。
比如SELECT*FROM[user]WHEREu_nameLIKE"[^张李王]三"
将找出不姓“张”、“李”、“王”的“赵三”、“孙三”等;
SELECT*FROM[user]WHEREu_nameLIKE"老[^1-4]";
将排除“老1”到“老4”,寻找“老5”、“老6”、……
5,查询内容包含通配符时
由于通配符的缘故,导致我们查询特殊字符“%”、“_”、“[”的语句无法正常实现,而把特殊字符用“[]”括起便可正常查询。据此我们写出以下函数:
functionsqlencode(str)
str=replace(str,"[","[[]")"此句一定要在最前
str=replace(str,"_","[_]")
str=replace(str,"%","[%]")
sqlencode=str
endfunction
在查询前将待查字符串先经该函数处理即可。
1、设置基本表格
从创建例子表格开始,使用以下的SQL命令:
mysql>CREATETABLEreviews(idINT(5)PRIMARYKEYNOTNULLAUTO_INCREMENT,dataTEXT);
以上命令创建了一个简单的音乐专集资料库(主要是整段的文字),然后向这个表格中添加一些记录:
mysql>INSERTINTO`reviews`(`id`,`data`)VALUES
(1,"GingerboyhasanewsingleoutcalledThrowingRocks.It\"sgreat!");
mysql>INSERTINTO`reviews`(`id`,`data`)VALUES
(2,"Helloall,IreallylikethenewMadonnasingle.
Oneofthehottesttrackscurrentlyplaying...I\"vebeenlisteningtoitallday");
mysql>INSERTINTO`reviews`(`id`,`data`)
VALUES(3,"HaveyouheardthenewbandHotterThanHell?
Theyhavefivemembersandtheyburntheirinstrumentswhentheyplayinconcerts.
Theseguystotallyrock!Like,awesome,dude!");
验证数据的正确录入:
mysql>SELECT*FROMreviews;
+----+--------------------------------------------+
iddata
+----+--------------------------------------------+
1Gingerboyhasanewsingleoutcalled...
2Helloall,IreallylikethenewMadon...
3HaveyouheardthenewbandHotterThan...
+----+--------------------------------------------+
3rowsinset(0.00sec)
2、定义全文搜索字段
接下来,定义您要作为全文搜索索引的字段
mysql>ALTERTABLEreviewsADDFULLTEXTINDEX(data);
QueryOK,3rowsaffected(0.21sec)
Records:3Duplicates:0Warnings:0
使用SHOWINDEXES命令来检查索引已经被添加了:
mysql>SHOWINDEXESFROMreviews;
+---------+---------------+--------+------+------------+---------+
TableColumn_namePackedNullIndex_typeComment
----------+---------------+--------+------+------------+---------+
reviewsidNULLBTREE
reviewsdataNULLYESFULLTEXT
+---------+---------------+--------+------+------------+---------+
3、运行全文搜索
当您拥有了数据和索引,就可以使用MySQL的全文搜索了,最简单的全文搜索方式是带有MATCH...AGAINST语句的SELECT查询,以下是一个简单的例子,可以来查找含有单词“single”的记录:
mysql>SELECTidFROMreviewsWHEREMATCH(data)AGAINST("single");+----+
id
+----+
1
2
+----+
2rowsinset(0.00sec)
在此,MATCH()将作为参数传递给它的字段中的文字与传递给AGAINST()的参数进行比较,如果有匹配的,那就按照正常的方式返回。注意您可以传递不止一个字段用MATCH()来查看-只需用逗号来分割字段列表。
当MySQL收到了一个全文搜索的请求,它就在内部对每个记录进行评分,不匹配的记录得分为零,而“更相关”的记录会得到比“不太相关”的记录相对更高的分数。相关性是由MySQL的一系列区分标准来决定的,查看MySQL的用户手册可以得到更多的信息。
想看到每个记录的评分如何,只需要返回MATCH()方法作为结果集的一部分,如下所示:
mysql>SELECTid,MATCH(data)AGAINST("rock")FROMreviews;
+----+-------------------------------+
idMATCH(data)AGAINST("rock")
+----+-------------------------------+
10
20
31.3862514533815
+----+-------------------------------+
3rowsinset(0.00sec)
4、使用逻辑搜索修饰符(Booleansearchmodifiers)
您还可以使用逻辑搜索修饰符来进行更精确的搜索,这通过在AGAINST语句中添加特殊的INBOOLEANMODE修饰符来实现,在以下的例子中,将查找含有单词“single”但是没有“Madonna”的记录:
mysql>SELECTidFROMreviewsWHEREMATCH(data)AGAINST("+single-madonna"INBOOLEANMODE);
+----+
id
+----+
1
+----+
1rowinset(0.00sec)
这一搜索特性通常用于搜索单词片断(而不是完整的词语),这可以通过在INBOOLEANMODE语句中的*(星号)操作符来实现,以下的例子展示了如何查找单词中含有“hot”的记录:
mysql>SELECTidFROMreviewsWHEREMATCH(data)AGAINST("hot*"INBOOLEANMODE);+----+
id
+----+
3
2
+----+
2rowsinset(0.00sec)
您还可以使用这种方法来查找至少一个传递到AGAINST的参数中,以下的例子查找了至少包含单词“hell”和“rocks”中的一个的记录:
mysql>SELECTidFROMreviewsWHEREMATCH(data)AGAINST("hellrocks"INBOOLEANMODE);
+----+
id
+----+
1
3
+----+
3rowsinset(0.00sec)
以上的这些例子演示了相对于传统的SELECT...LIKE语句,进行全文搜索的更有效的方法,当您下一次需要编写MySQL数据库搜索界面的时候,您可以尝试这一方法。最终发现使用不了,原因是只有MyISAM引擎才支持全文索引,晕。好吧,还是用like进行搜索。。。
相关文章
- MySQL实现快速取行数方法(mysql取行数)
- MySQL快速掌握删除数据语句(mysql删除数据语句)
- MySQL注册系统:建立您自己的服务!(mysql注册系统服务)
- MySQL 数据库:如何添加注释(mysql数据库注释)
- MySQL安装及其使用入门(mysql安装和使用)
- MySQL跨库之间表格数据复制(mysql跨库复制表)
- MySQL中添加字段的ALTER语句(mysql添加字段的命令)
- MySQL自动创建不存在的数据库(mysql不存在则创建)
- MySQL驱动程序:简单实用的加载操作(加载mysql驱动程序)
- MySQL 对中文排序的挑战(mysql对中文排序)
- MySQL转换成PHP数组的方法(mysql转数组)
- 协作MySQL多版本协作:提升数据库性能(mysql多版本)
- MySQL多条件查询:实现高效搜索(mysql多条件查询)
- MySQL实现字符串相加运算(mysql 字符串相加)
- 式处理MySQL实现的不等式查询处理技术(mysql 不等)
- MySQL字段相加操作的方法和技巧(mysql中不同字段相加)
- MySQL中的show语句使用方法和技巧(mysql中show属于)
- MySQL中long数据类型的使用和注意事项(mysql中long数据)
- MySQL数据库中的JOIN方法详解(mysql中join方法)
- MySQL中找不到ini文件的解决方法(mysql中ini没有)
- MySQL实现两项数据相加的方法(mysql 两项相加)
- MySQL实现两表数据相加的方法(mysql两表数据相加)
- 1500并发下MySQL的访问表现(1500访问mysql)
- 如何在 MySQL 中去掉双引号(mysql 中去掉双引号)
- 深入了解MySQL函数的使用方法(mysql中函数用法)
- 解析 MySQL 视图为什么有些视图无法被重写(mysql不能重写的视图)
- MySQL自动递增无效解决方法来了(mysql不能自动递增)
- 解决MySQL切换用户问题的方法及注意事项(mysql不能切换用户)
- MySQL不相关子查询提高查询效率(mysql不相关子查询)
- 解决MySQL自动重启问题的方法(mysql不断自动重启)
- Redis与MySQL联动构建数据融合服务(redis配合mysql)