【数据库】MySQL索引
一、索引概述
MySQL官方对索引的定义为︰索引( index ))是帮助MySQL高效获取数据的数据结构(有序)。
在数据之外,数据库系统还维护者满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法,这种数据结构就是索引。
如下面的示意图所示:
在没有简历索引时,我们查询数据时,需要全表扫描,因此查询效率很低,当我们建立如图2所示的二叉树索引时,我们以二分查找的方式搜索二叉树,索引中维护着数据和索引之间的关系,这样的话查找效率就比不建立索引要快很多。
二、索引优势劣势
- 优势
1)类似于书籍的目录索引,提高数据检索的效率,降低数据库的IO成本。
2)通过索引列对数据进行排序,降低数据排序的成本,降低CPU的消耗。
- 劣势
1)索引中保存了主键与索引字段,并指向实体类的记录,索引也是一种数据结构,所以索引列也是要占用空间的
2)虽然索引大大提高了查询效率,同时却也降低更新表的速度,如对表进行INSERT、UPDATE、DELETE。因为更新表时,MySQL不仅要保存数据,还要保存一下索引文件每次更新添加了索引列的字段,都会调整因为更新所带来的键值变化后的索引信息。
三、索引结构
索引是在MySQL的存储引擎层中实现的,而不是在服务器层实现的。所以每种存储引擎的索引都不一定完全相同,也不是所有的存储引擎都支持所有的索引类型的。MySQL目前提供了以下4种索引∶
- BTREE 索引∶最常见的索引类型,大部分索引都支持B树索引。
- HASH索引∶只有Memory引擎支持,使用场景简单。
- R-tree索引(空间索引)︰空间索引是MyISAM引擎的一个特殊索引类型,主要用于地理空间数据类型,通常使用较少,不做特别介绍。
- Full-text (全文索引)︰全文索引也是MyISAM的一个特殊索引类型,主要用于全文索引,InnoDB从Mysql5.6版本开始支持全文索引。
我们平常所说的索引,如果没有特别指明,都是指B+树(多路搜索树,并不一定是二叉的)结构组织的索引。其中聚集索引、复合索引、前缀索引、唯一索引默认都是使用B+tree索引,统称为索引。
四、BTREE结构
BTree又叫多路平衡搜索树,一颗m叉的BTree特性如下:
- 树中每个节点最多包含m个孩子
- 除根节点与叶子节点外,每个节点至少有[ceil(m/2)]个孩子
- 若根节点不是叶子节点,则至少有两个孩子
- 所有的叶子节点都在同一层
- 每个非叶子节点由n个key与n+1个指针组成,其中[ceil(m/2)-1]<=n<= m-1
以5叉BTree为例,key的数量∶公式推导[ceil(m/2)-1]<=n <=m-1。所以2<=n<=4。当n>4时,中间节点分裂到父节点,两边节点分裂。
以插入 C N G A H E K Q M F W L T Z D P R X Y S 数据为例。
演变过程如下:
(1)插入前4个字母 C N G A
(2)插入H,n>4,中间元素G字母向上分裂到新的节点
(3)插入E,K,Q不需要分裂
(4)插入M,中间元素M字母向上分裂到父节点G
(5)插入F,W, L,T不需要分裂
(6)插入Z,中间元素T向上分裂到父节点中
(7)插入D,中间元素D向上分裂到父节点中。然后插入P,R,X,Y不需要分裂
(8)最后插入S,NPQR节点n>5,中间节点Q向上分裂,但分裂后父节点DGMT的n>5,中间节点M向上分裂
到此,该BTREE树就已经构建完成了,BTREE树和二叉树相比,查询数据的效率更高,因为对于相同的数据量来说,BTREE的层级结构比二叉树小,因此搜索速度快。
五、B+TREE结构(重点)
B+Tree为BTree的变种,B+Tree与BTree的区别为︰
- 1).n叉B+Tree最多含有n个key,而BTree最多含有n-1个key。
- 2).B+Tree的叶子节点保存所有的key信息,依key大小顺序排列。
- 3).所有的非叶子节点都可以看作是key的索引部分。
由于B+Tree只有叶子节点保存key信息,查询任何key都要从root走到叶子。所以B+Tree的查询效率更加稳定。
六、MySQL中的B+Tree
MySQL索引数据结构对经典的B+Tree进行了优化。在原B+Tree的基础上,增加一个指向相邻叶子节点的链表指针,就形成了带有顺序指针的B+Tree,提高区间访问的性能。I
MySQL中的B+Tree索引结构示意图:
七、索引的分类
- 1)单值索引︰即一个索引只包含单个列,一个表可以有多个单列索引
- 2)唯一索引∶索引列的值必须唯一,但允许有空值
- 3)复合索引︰即一个索引包含多个列
八、索引的语法
- 1.数据准备
-- 数据准备
create database demo_o1 default charset=utf8mb4 ;
use demo_01;
-- 创建表
CREATE TABLE `city`(
`city_id` int(11) NOT NULL AUTO_INCREMENT,
`city_name`varchar(50) NOT NULL,
`country_id` int(11) NOT NULL,PRIMARY KEY ( `city_id `)
)ENGINE=InnoDB DEFAULT CHARSET=utf8;
CREATE TABLE `country`(
`country_id` int(11) NOT NULL AUTO_INCREMENT,
`country_name` varchar(100) NOT NULL,
PRIMARY KEY (`country_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
-- 插入数据
insert into `city`( city_id, city_name, country_id ) values(1,'西安',1);
insert into `city`( city_id, city_name, country_id ) values(2, 'NewYork',2);
insert into `city`( city_id,city_name, country_id ) values(3,'北京',1);
insert into `city`( city_id, city_name, country_id ) values(4, '上海',1);
insert into `country`( country_id , country_name) values(1, 'china');
insert into `country`( country_id , country_name) values(2, 'America');
insert into `country`( country_id , country_name) values(3, 'Japan');
insert into `country`( country_id , country_name) values(4, 'UK');
- 2.索引的创建
语法:CREATE INDEX 索引名 on 表名(字段1,字段2…)
-- 创建为city表的city_name创建唯一索引
CREATE INDEX idx_city_name on city(city_name);
- 3.查看索引
语法:SHOW INDEX FROM 表名
-- 查看city表的索引
SHOW INDEX FROM city;
- 4.删除索引
语法:DROP INDEX 索引名 on 表名
-- 删除city表的idx_city_name索引
DROP INDEX idx_city_name on city;
- 5.alter指令修改表的索引
语法:ALTER TABLE 表名 add 索引类型 索引名(字段1,字段2…)
-- 为city表city_name字段创建唯一索引
ALTER TABLE city add UNIQUE un_index(city_name);
-- 为county表county_name字段创建全文索引
ALTER TABLE country ADD FULLTEXT fu_index(country_name);
九、索引的设计原则
索引的设计可以遵循一些已有的原则,创建索引的时候请尽星考虑符合这些原则,便于提升索引的使用效率,更高效的使用索引。
- 1.对查询频次较高,且数据量比较大的表建立索引。
- 2.索引字段的选择,最佳候选列应当从where子句的条件中提取,如果where子句中的组合比较多,那么应当挑选最常用、过滤效果最好的列的组合。
- 3.尽量使用唯一索引,区分度越高,使用索引的效率越高。
- 4.索引并非多多益善,对于插入、更新、删除等DML操作比较频繁的表来说,索引过多,会引入相当高的维护代价,降低DML操作的效率,增加相应操作的时间消耗。
- 5.尽可能使用短索引,索引创建之后也是使用硬盘来存储的,因此提升索引访问的I/O效率。
- 6.利用最左前缀,N个列组合而成的组合索引,那么相当于是创建了N个索引,如果查询时where子句中使用了组成该索引的前几个字段,那么这条查询SQL可以利用组合索引来提升查询效率。
相关文章
- 【MySQL】批量删除mysql中数据库中的表
- MySQL数据库索引之B+树
- mysql数据库表间内外链接详解
- MySQL 之【视图】【触发器】【存储过程】【函数】【事物】【数据库锁】【数据库备份】
- 阿里规范 - 五、MySQL 数据库 - (三)SQL语句 - 1 - 【强制】不要使用 count(列名)或 count(常量)来替代 count(*),count(*)是 SQL92 定义的 标准统计行数的语法,跟数据库无关,跟 NULL 和非 NULL 无关。
- 数据库 MySQL 基本操作 语法 [MD]
- mysql数据库1067错误
- 〖Python 数据库开发实战 - MySQL篇⑬〗- 数据库的索引机制
- Java学习路线-41:数据库及SQL/MySQL基础
- 【ChatGPT】我同时问 ChatGLM / Sage / ChatGPT :MySQL 添加索引之后 数据库做了些什么? 看看它们分别怎么回答……
- PostgreSQL的学习心得和知识总结(一百二十)|语法级自上而下完美实现MySQL数据库的 update/delete limit 的实现方案
- 第42讲:MySQL数据库索引的基本使用规则以及在正确使用索引的方式
- 第32讲:MySQL数据库的体系结构组成
- 第3讲:MySQL数据库中常见的几种表字段数据类型
- 数据结构与算法_48 _ B+树:MySQL数据库索引是如何实现的
- golang操作mysql数据库(Go-SQL-Driver/MySQL)
- MySQL基础篇 | 存储引擎、事务、索引、视图、DBA命令、数据库设计三范式
- MySQL数据库和SQL语句
- MySQL 配置, 避坑 sqlyog连接mysql错误码2058
- 【MySQL数据库原理】MySQL最有用的150条命令总结与案例使用
- 两个MySQL数据库之间同步表结构及索引模式
- 一万六千字的MySQL数据库操作详细教学,看完别说你不会