MySQL到底支不支持哈希索引?
经常有朋友问,MySQL的InnoDB到底支不支持哈希索引?
对于InnoDB的哈希索引,确切的应该这么说:
(1)InnoDB用户无法手动创建哈希索引,这一层上说,InnoDB确实不支持哈希索引;
(2)InnoDB会自调优(self-tuning),如果判定建立自适应哈希索引(Adaptive Hash Index, AHI),能够提升查询效率,InnoDB自己会建立相关哈希索引,这一层上说,InnoDB又是支持哈希索引的;
那什么是自适应哈希索引(Adaptive Hash Index, AHI)呢?原理又是怎样的呢?咱们先从一个例子开始。
不妨设有InnoDB数据表:
t(id PK, name KEY, sex, flag)
画外音:id是主键,name建了普通索引。 假设表中有四条记录:
- 1, shenjian, m, A
- 3, zhangsan, m, A
- 5, lisi, m, A
- 9, wangwu, f, B
如上图,通过前序知识,容易知道InnoDB在主键id上会建立聚集索引(Clustered Index),叶子存储记录本身,在name上会建立普通索引(Secondary Index),叶子存储主键值。
发起主键id查询时,能够通过聚集索引,直接定位到行记录。
select * from t where name='ls';
发起普通索引查询时:
(1)会先从普通索引查询出主键(上图右边);
(2)再由主键,从聚集索引上二次遍历定位到记录(上图左边)。
不管聚集索引还是普通索引,记录定位的寻路路径(Search Path)都很长。
在MySQL运行的过程中,如果InnoDB发现,有很多SQL存在这类很长的寻路,并且有很多SQL会命中相同的页面(page),InnoDB会在自己的内存缓冲区(Buffer)里,开辟一块区域,建立自适应哈希所有AHI,以加速查询。
从这个层面上来说,InnoDB的自使用哈希索引,更像“索引的索引”,毕竟其目的是为了加速索引寻路。
既然是哈希,key是什么,value是什么?
key是索引键值(或者键值前缀)。
value是索引记录页面位置。
为啥叫“自适应(adaptive)”哈希索引?
系统自己判断“应该可以加速查询”而建立的,不需要用户手动建立,故称“自适应”。
系统会不会判断失误,是不是一定能加速?
不是一定能加速,有时候会误判。 当业务场景为下面几种情况时:
(1)很多单行记录查询(例如passport,用户中心等业务);
(2)索引范围查询(此时AHI可以快速定位首行记录);
(3)所有记录内存能放得下;
AHI往往是有效的。
画外音:任何脱离业务的技术方案,都是耍流氓。
当业务有大量like或者join,AHI的维护反而可能成为负担,降低系统效率,此时可以手动关闭AHI功能。
一个小知识点,希望对大家有帮助。
知其然,知其所以然。
相关文章
- 数据分析和数据科学的五大不同之处
- 调整数组元素顺序,你了解几分?
- 终于有人把数据、信息、知识讲明白了
- 156万在校大学生!中国高校第一城诞生
- 令人不安的全球粮价上涨
- 行业大数据有哪些安全风险
- 数据在网络中是如何传输的
- Flink 在 B 站的多元化探索与实践
- 数据分析七大能力:梳理数据需求
- 青蛙跳台阶,能写一个复杂度更低的解法吗?
- 数据分析,如何赋能业务?
- 数据分析的12个神话被揭穿!
- 聊聊数据溢出的事,你明白几分?
- 视频时代的大数据:问题、挑战与解决方案
- 经营分析是什么?为什么大厂这么重视它
- 紧跟业务发展速度的数据治理是什么样的
- 大数据分析是什么?
- 为什么 insert 配置 "SELECT LAST_INSERT_ID()" 返回个0呢?
- 一日一技:二分偏左,二分搜索在分布式系统里面也有用?
- Web1.0到Web3.0,互联网是如何演进的?