您现在的位置是：首页 > 数据库

当前栏目

MongoDB之索引

MongoDB 索引

2023-09-11 14:14:42 时间

索引是用来加快查询的,这里不解说索引的原理和数据结构。事实上大部分数据库的索引就是B+Tree，想要了解的同学能够看索引原理，要掌握怎样为查询配置最佳索引会有些难度。

MongoDB索引差点儿和关系型数据库的索引一样.绝大数优化关系型数据库索引的技巧相同适用于MongoDB。
我们举一个样例，如今集合中插入多个文档：

db.lf.insert({“name”:”lf”,”age”:23,”isactive”:true})
db.lf.insert({“name”:”lf”,”age”:24,”isactive”:false})
db.lf.insert({“name”:”aaaa”,”age”:24,”isactive”:false})
db.lf.insert({“name”:”bbbb”,”age”:24,”isactive”:false})
db.lf.insert({“name”:”cccc”,”age”:24,”isactive”:false})
db.lf.insert({“name”:”aaaaa”,”age”:24,”isactive”:false})
db.lf.insert({“name”:”bbbb”,”age”:28,”isactive”:true})
db.lf.insert({“name”:”bbbb”,”age”:21,”isactive”:false})
db.lf.insert({“name”:”rrrr”,”age”:11,”isactive”:true})

这里写图片描写叙述

接下来。我们该创建索引了。

创建索引

要依照name键进行查找,就能够在此键上建立索引,来提高查询速度。
使用ensureIndex方法来创建索引：

db.lf.ensureIndex({"name":1})

这里写图片描写叙述

对某个键创建索引会加速对该键的查询,可是对于其它的查询可能没有帮助,即便查询中包括了被索引的键。

那么怎样查看自己创建了哪些索引呢？

查看索引

使用db.system.indexes.find()就能够查看自己创建的索引了。
这里写图片描写叙述

能够看到，id是一定会有一个索引的，我们创建的name索引在后面。

这里要介绍一个概念，叫做表扫描，表扫描就是在没有索引的集合中查找内容，从第一个到最后一个。当集合过大时，这样的需找方式会显得非常慢，所以我们要避免表扫描。

删除索引

使用dropIndexes命令来删除索引。

比如：

> db.runCommand({"dropIndexes":"lf","index":"*"})
{
"nIndexesWas" : 2,
"msg" : "non-_id indexes dropped for collection",
"ok" : 1
}
> db.lf.ensureIndex({"name":1,"age":1})
> db.lf.ensureIndex({"name":1,"age":-1})
> db.system.indexes.find()
{ "v" : 1, "key" : { "_id" : 1 }, "ns" : "test.lf", "name" : "_id_" }
{ "v" : 1, "key" : { "_id" : 1 }, "ns" : "test.lf", "name" : "_id_" }
{ "v" : 1, "key" : { "_id" : 1 }, "ns" : "test.lf", "name" : "_id_" }
{ "v" : 1, "key" : { "name" : 1, "age" : 1 }, "ns" : "test.lf", "name"
: "name_1_age_1" }
{ "v" : 1, "key" : { "name" : 1, "age" : -1 }, "ns" : "test.lf", "name
" : "name_1_age_-1" }

能够看到，创建的全部会有一个name。在删除相应索引时指定名称即可了。

假设以{“age”:1, “name”:1,}这样的方式创建索引,MongoDB会按例如以下方式组织:
这里写图片描写叙述
用户名安装字母升序排列，同名的组依照年龄升序排列。

创建索引的缺点是每次插入,更新,删除都会产生额外的开销,由于数据库不但须要运行这些操作,还要将这些操作在集合的索引中标记.因此,尽可能少的创建索引。
一般来说,要是查询要返回集合中一半以上的结果,用表扫描会比差点儿每条文档都要索引要快,所以,查询是否存在某个键,或者检查摸个布尔类型的值是真是假,就没有必要利用索引。

扩展索引

假设有个集合存储了用户的状态信息。如今要查询用户和日期,取出某一用户近期的状态.我们可能会建立例如以下索引:

db.users.ensureIndex({"user":1,"date":-1})

这会使对用户和日期的查询非常快,可是并非最好的方式。
由于应用会有数百万的用户,每人每天都有数十条状态更新.若是每条用户状态的索引值咱用相似一页纸的磁盘控件,那么对每次”最新状态”的查询,数据库将会将不同的页加载内存。若是网站太热门,内存放不下全部索引,就会非常慢。要是改变索引的顺序{“date”:-1,”user”:1},则数据库能够将最后几天的索引保存在内存中,能够有效的降低内存交换,这样查询不论什么用户的最新状态都会快非常多。

索引内嵌文档中的键

那么索引怎样作用于NoSQL复杂灵活的内嵌文档呢？
事实上和普通的没有什么差别，还是利用点操作符：

db.blog.insert(
　　{
　　　　"title":" blog",
　　　　"author":
　　　　{
　　　　　　"name":"lf",
　　　　　　"email":"362512489@qq.com"
　　　　}　　
　　}
)

为author.name创建索引：

db.blog.ensureIndex({"author.name":1})

对内嵌文档的键索引和普通键索引没有什么差别。所以说两者能够联合组成复合索引。

索引名称

集合中的每个索引都有一个字符串类型的名字,来唯一标识索引,server通过这个名字来删除或操作索引.默认情况下,索引名相似

keyname1_dir1_keyname2_dir2

这样的形式,当中keyname代表索引的键,dir代表索引的方向(1或-1)。当然了，我们也能够通过ensureIndex来指定索引的名称：

db.blog.ensureIndex({"author.name":1},{"name":"author_name_index"})

注意一点，自己定义的索引名称是不能改动的，仅仅能通过删除索引再重建。

唯一索引

唯一索引能够确保集合的每个文档的指定键都有唯一值.假设想保证文档的username键都有不同的值:

db.lf.ensureIndex({"username":1},{"unique":true})

默认情况下，insert并不会去检測文档是否插入过。所以为了避免插入的文档包括与唯一键反复的值，可能要用到安全插入才干满足要求。

消除反复

当我们为已有的集合创建唯一索引的时候，可能有些值已经反复了，所以会创建失败。我们可能会希望价格全部包括反复值的文档都删掉，这个时候我们就能够使用dropDups方法，来保留发现的第一个文档而删除接下来的有反复值的文档：

db.lf.ensureIndex({"username":1},{"unique":true,"dropDups":true})

当然了。假设是关键数据，这样做未免显得有些鲁莽。还是写个脚本预处理比較好。

猜你喜欢

hibernate ID生成策略配置
精通Python网络爬虫：核心技术、框架与项目实战.3.1　网络爬虫实现原理详解
查询红帽linux/Oracle Linux的发行版本的方法
Sphinx+MySQL5.1x+SphinxSE+mmseg中文分词
消息队列小结
诺基亚称霸C-SON市场领先Amdocs和思科
Java的对象初始化过程
Java参数验证Bean Validation 框架
Java Web实战开发 | Servlet的创建
JavaScript 是如何工作：Shadow DOM 的内部结构 + 如何编写独立的组件！
持续集成---减少持续集成的时间
Java集合源代码剖析（一）【集合框架概述、ArrayList、LinkedList、Vector】
Incorrect column count: expected 1, actual 5，JdbcTemplate queryForList 出错
微信公众号之推送消息
从SAP ECC升级到SAP S4HANA, 几个Key Points
书房与工作室

相关主题

MongoDB Java
MongoDB的索引
MongoDB索引使用
mongodb可靠吗
mongodb的慢查询
Mongodb--安装
MongoDB 入门
mongoDb c driver
docker MongoDB

zl程序教程