您现在的位置是：首页 > 数据库

当前栏目

MySQL到底支不支持哈希索引？

mysql 索引哈希

2023-03-14 09:35:26 时间

经常有朋友问，MySQL的InnoDB到底支不支持哈希索引？

对于InnoDB的哈希索引，确切的应该这么说：

(1)InnoDB用户无法手动创建哈希索引，这一层上说，InnoDB确实不支持哈希索引；

(2)InnoDB会自调优(self-tuning)，如果判定建立自适应哈希索引(Adaptive Hash Index, AHI)，能够提升查询效率，InnoDB自己会建立相关哈希索引，这一层上说，InnoDB又是支持哈希索引的；

那什么是自适应哈希索引(Adaptive Hash Index, AHI)呢？原理又是怎样的呢？咱们先从一个例子开始。

不妨设有InnoDB数据表：

t(id PK, name KEY, sex, flag)

画外音：id是主键，name建了普通索引。假设表中有四条记录：

1, shenjian, m, A
3, zhangsan, m, A
5, lisi, m, A
9, wangwu, f, B

如上图，通过前序知识，容易知道InnoDB在主键id上会建立聚集索引(Clustered Index)，叶子存储记录本身，在name上会建立普通索引(Secondary Index)，叶子存储主键值。

发起主键id查询时，能够通过聚集索引，直接定位到行记录。

select * from t where name='ls';

发起普通索引查询时：

(1)会先从普通索引查询出主键(上图右边)；

(2)再由主键，从聚集索引上二次遍历定位到记录(上图左边)。

不管聚集索引还是普通索引，记录定位的寻路路径(Search Path)都很长。

在MySQL运行的过程中，如果InnoDB发现，有很多SQL存在这类很长的寻路，并且有很多SQL会命中相同的页面(page)，InnoDB会在自己的内存缓冲区(Buffer)里，开辟一块区域，建立自适应哈希所有AHI，以加速查询。

从这个层面上来说，InnoDB的自使用哈希索引，更像“索引的索引”，毕竟其目的是为了加速索引寻路。

既然是哈希，key是什么，value是什么？

key是索引键值(或者键值前缀)。

value是索引记录页面位置。

为啥叫“自适应(adaptive)”哈希索引？

系统自己判断“应该可以加速查询”而建立的，不需要用户手动建立，故称“自适应”。

系统会不会判断失误，是不是一定能加速？

不是一定能加速，有时候会误判。当业务场景为下面几种情况时：

(1)很多单行记录查询(例如passport，用户中心等业务);

(2)索引范围查询(此时AHI可以快速定位首行记录);

(3)所有记录内存能放得下;

AHI往往是有效的。

画外音：任何脱离业务的技术方案，都是耍流氓。

当业务有大量like或者join，AHI的维护反而可能成为负担，降低系统效率，此时可以手动关闭AHI功能。

一个小知识点，希望对大家有帮助。

知其然，知其所以然。

猜你喜欢

鲜为人知但很有用的 HTML 属性
在 Go 里用 CGO？这 7 个问题你要关注！
数据孤岛是业务效率的无声杀手
9款优秀的去中心化通讯软件 Matrix 的客户端
翻转再翻转！有意思的水平横向溢出滚动
发现 Linux SpaceFM 文件管理器的威力
图像处理工具Python扩展库，你了解吗？
求职数据分析，项目经验该怎么写
自定义计数器小技巧！CSS 实现长按点赞累加动画
在OKR中，我看到了数据驱动业务的未来
2023展望：新的一年将给大数据分析领域带来什么？
过五关！React高频面试题指南
阿里云ADB基于Hudi构建Lakehouse的实践
火山引擎云原生大数据在金融行业的实践
OpenHarmony富设备移植指南（二）—从postmarketOS获取移植资源
《数据成熟度指数》报告：64%的企业领袖认为大多数员工“不懂数据”
OpenHarmony 小型系统兼容性测试指南
肯睿中国（Cloudera）：2023年企业数字战略三大趋势预测
适用于 Linux 的十大命令行游戏
软件开发中的十个认知偏差

zl程序教程

当前栏目

MySQL到底支不支持哈希索引？

相关文章