zl程序教程

您现在的位置是:首页 >  数据库

当前栏目

【数据库】MySQL索引

2023-09-11 14:17:55 时间

一、索引概述

MySQL官方对索引的定义为︰索引( index ))是帮助MySQL高效获取数据的数据结构(有序)。
在数据之外,数据库系统还维护者满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法,这种数据结构就是索引。
如下面的示意图所示:

在这里插入图片描述

在没有简历索引时,我们查询数据时,需要全表扫描,因此查询效率很低,当我们建立如图2所示的二叉树索引时,我们以二分查找的方式搜索二叉树,索引中维护着数据和索引之间的关系,这样的话查找效率就比不建立索引要快很多。

二、索引优势劣势

  • 优势

1)类似于书籍的目录索引,提高数据检索的效率,降低数据库的IO成本。
2)通过索引列对数据进行排序,降低数据排序的成本,降低CPU的消耗。

  • 劣势

1)索引中保存了主键与索引字段,并指向实体类的记录,索引也是一种数据结构,所以索引列也是要占用空间的
2)虽然索引大大提高了查询效率,同时却也降低更新表的速度,如对表进行INSERT、UPDATE、DELETE。因为更新表时,MySQL不仅要保存数据,还要保存一下索引文件每次更新添加了索引列的字段,都会调整因为更新所带来的键值变化后的索引信息。

三、索引结构

索引是在MySQL的存储引擎层中实现的,而不是在服务器层实现的。所以每种存储引擎的索引都不一定完全相同,也不是所有的存储引擎都支持所有的索引类型的。MySQL目前提供了以下4种索引∶

  • BTREE 索引∶最常见的索引类型,大部分索引都支持B树索引。
  • HASH索引∶只有Memory引擎支持,使用场景简单。
  • R-tree索引(空间索引)︰空间索引是MyISAM引擎的一个特殊索引类型,主要用于地理空间数据类型,通常使用较少,不做特别介绍。
  • Full-text (全文索引)︰全文索引也是MyISAM的一个特殊索引类型,主要用于全文索引,InnoDB从Mysql5.6版本开始支持全文索引。
    在这里插入图片描述
    我们平常所说的索引,如果没有特别指明,都是指B+树(多路搜索树,并不一定是二叉的)结构组织的索引。其中聚集索引、复合索引、前缀索引、唯一索引默认都是使用B+tree索引,统称为索引。

四、BTREE结构

BTree又叫多路平衡搜索树,一颗m叉的BTree特性如下:

  • 树中每个节点最多包含m个孩子
  • 除根节点与叶子节点外,每个节点至少有[ceil(m/2)]个孩子
  • 若根节点不是叶子节点,则至少有两个孩子
  • 所有的叶子节点都在同一层
  • 每个非叶子节点由n个key与n+1个指针组成,其中[ceil(m/2)-1]<=n<= m-1
    以5叉BTree为例,key的数量∶公式推导[ceil(m/2)-1]<=n <=m-1。所以2<=n<=4。当n>4时,中间节点分裂到父节点,两边节点分裂

以插入 C N G A H E K Q M F W L T Z D P R X Y S 数据为例。
演变过程如下:
(1)插入前4个字母 C N G A
在这里插入图片描述

(2)插入H,n>4,中间元素G字母向上分裂到新的节点
在这里插入图片描述
(3)插入E,K,Q不需要分裂
在这里插入图片描述
(4)插入M,中间元素M字母向上分裂到父节点G
在这里插入图片描述
(5)插入F,W, L,T不需要分裂
在这里插入图片描述
(6)插入Z,中间元素T向上分裂到父节点中
在这里插入图片描述

(7)插入D,中间元素D向上分裂到父节点中。然后插入P,R,X,Y不需要分裂
在这里插入图片描述

(8)最后插入S,NPQR节点n>5,中间节点Q向上分裂,但分裂后父节点DGMT的n>5,中间节点M向上分裂
在这里插入图片描述
到此,该BTREE树就已经构建完成了,BTREE树和二叉树相比,查询数据的效率更高,因为对于相同的数据量来说,BTREE的层级结构比二叉树小,因此搜索速度快。

五、B+TREE结构(重点)

B+Tree为BTree的变种,B+Tree与BTree的区别为︰

  • 1).n叉B+Tree最多含有n个key,而BTree最多含有n-1个key。
  • 2).B+Tree的叶子节点保存所有的key信息,依key大小顺序排列。
  • 3).所有的非叶子节点都可以看作是key的索引部分。
    在这里插入图片描述
    由于B+Tree只有叶子节点保存key信息,查询任何key都要从root走到叶子。所以B+Tree的查询效率更加稳定。

六、MySQL中的B+Tree

MySQL索引数据结构对经典的B+Tree进行了优化。在原B+Tree的基础上,增加一个指向相邻叶子节点的链表指针,就形成了带有顺序指针的B+Tree,提高区间访问的性能。I
MySQL中的B+Tree索引结构示意图:
在这里插入图片描述

七、索引的分类

  • 1)单值索引︰即一个索引只包含单个列,一个表可以有多个单列索引
  • 2)唯一索引∶索引列的值必须唯一,但允许有空值
  • 3)复合索引︰即一个索引包含多个列

八、索引的语法

  • 1.数据准备
-- 数据准备
create database demo_o1 default charset=utf8mb4 ;

use demo_01;

-- 创建表
CREATE TABLE `city`(
`city_id` int(11) NOT NULL AUTO_INCREMENT,
`city_name`varchar(50) NOT NULL,
`country_id` int(11) NOT NULL,PRIMARY KEY ( `city_id `)
)ENGINE=InnoDB DEFAULT CHARSET=utf8;

CREATE TABLE `country`(
`country_id` int(11) NOT NULL AUTO_INCREMENT,
`country_name` varchar(100) NOT NULL,
PRIMARY KEY (`country_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

-- 插入数据
insert into `city`( city_id, city_name, country_id ) values(1,'西安',1);
insert into `city`( city_id, city_name, country_id ) values(2, 'NewYork',2);
insert into `city`( city_id,city_name, country_id ) values(3,'北京',1);
insert into `city`( city_id, city_name, country_id ) values(4, '上海',1);

insert into `country`( country_id , country_name) values(1, 'china');
insert into `country`( country_id , country_name) values(2, 'America');
insert into `country`( country_id , country_name) values(3, 'Japan');
insert into `country`( country_id , country_name) values(4, 'UK');

  • 2.索引的创建
    语法:CREATE INDEX 索引名 on 表名(字段1,字段2…)
-- 创建为city表的city_name创建唯一索引
CREATE INDEX idx_city_name on city(city_name);
  • 3.查看索引
    语法:SHOW INDEX FROM 表名
-- 查看city表的索引
SHOW INDEX FROM city;
  • 4.删除索引
    语法:DROP INDEX 索引名 on 表名
-- 删除city表的idx_city_name索引
DROP INDEX idx_city_name on city;
  • 5.alter指令修改表的索引
    语法:ALTER TABLE 表名 add 索引类型 索引名(字段1,字段2…)
-- 为city表city_name字段创建唯一索引
ALTER TABLE city add UNIQUE un_index(city_name);

-- 为county表county_name字段创建全文索引
ALTER TABLE country ADD FULLTEXT fu_index(country_name);

九、索引的设计原则

索引的设计可以遵循一些已有的原则,创建索引的时候请尽星考虑符合这些原则,便于提升索引的使用效率,更高效的使用索引。

  • 1.对查询频次较高,且数据量比较大的表建立索引。
  • 2.索引字段的选择,最佳候选列应当从where子句的条件中提取,如果where子句中的组合比较多,那么应当挑选最常用、过滤效果最好的列的组合。
  • 3.尽量使用唯一索引,区分度越高,使用索引的效率越高。
  • 4.索引并非多多益善,对于插入、更新、删除等DML操作比较频繁的表来说,索引过多,会引入相当高的维护代价,降低DML操作的效率,增加相应操作的时间消耗。
  • 5.尽可能使用短索引,索引创建之后也是使用硬盘来存储的,因此提升索引访问的I/O效率。
  • 6.利用最左前缀,N个列组合而成的组合索引,那么相当于是创建了N个索引,如果查询时where子句中使用了组成该索引的前几个字段,那么这条查询SQL可以利用组合索引来提升查询效率。
    在这里插入图片描述