由浅入深讲解MySQL数据库索引的选择性
数据库索引就好比是一本书的目录部分,便于大家查找数据库中数据,方便快捷,给数据库管理员的工作带来了很多的便利。在MySQL数据库中,对于索引的使用并是一直都采用正确的决定。
简单表的示例:
CREATE TABLE `r2` (
ID` int(11) DEFAULT NULL,
ID1` int(11) DEFAULT NULL,
CNAME` varchar(32) DEFAULT NULL,
KEY `ID1` (`ID1`)
) ENGINE=MyISAM DEFAULT CHARSET=latin1
SELECT COUNT(*) FROM r2;
250001 (V1)
SELECT COUNT(*) FROM r2 WHERE ID1=1;
83036 (V2)
(execution time = 110 ms)
(ID1=1)条件查询索引的选择性是 V2/V1 = 0.3321 或 33.21%
一般来说(例如书 “SQL Tuning“),如果选择性超过 20% 那么全表扫描比使用索引性能更优。
我知道Oracle一直是在选择性超过25%时会选择全表扫描。
而MySQL呢:
mysql> EXPLAIN SELECT COUNT(SUBNAME) FROM r2 WHERE ID1=1;
+----+-------------+-------+------+---------------+-----
| id | select_type | TABLE | type | possible_keys | KEY | key_len | ref | rows | Extra |
+----+-------------+-------+------+---------------+-----
| 1 | SIMPLE | t2 | ref | ID1 | ID1 | 5 | const | 81371 | USING WHERE |
+----+-------------+-------+------+---------------+-----
这就是MySQL将会使用索引来完成这个查询。
让我们来对比索引查询和全表扫描的执行时间:
SELECT COUNT(SUBNAME) FROM t2 WHERE ID1=1 - 410 ms
SELECT COUNT(SUBNAME) FROM t2 IGNORE INDEX (ID1) WHERE ID1=1 - 200 ms
如你所看到全表扫描要快2倍。
参考更特殊的例子:选择性 ~95%:
SELECT cnt2 / cnt1 FROM (SELECT count(*) cnt1 FROM r2) d1, (SELECT count(*) cnt2 FROM r2 WHERE ID1=1) d2;
0.9492 = 94.92%;
说明MySQL将会用索引来完成查询。
执行时间:
SELECT COUNT(SUBNAME) FROM t2 WHERE ID1=1 - 1200 ms
SELECT COUNT(SUBNAME) FROM t2 IGNORE INDEX (ID1) WHERE ID1=1 - 260 ms
这次全表扫描要快4.6倍。
为什么MySQL选择索引访问查询?
MySQL没有计算索引的选择性,只是预测逻辑IO操作的数量,并且我们的例子中间的逻辑IO数量,索引访问要少于全表扫描。
最后我们得出结论,对于索引要小心使用,因为它们并不能帮助所有的查询。所以大家在使用数据库索引时还是需要根据具体的情况作出决定。
【编辑推荐】
相关文章
- 从本体论开始说起——运营商关系图谱的构建及应用
- 如何成为一名数据科学家?
- 从未见过的堂兄杀了人,你的DNA是关键证据
- 20个安全可靠的免费数据源,各领域数据任你挑
- 20个安全可靠的免费数据源,各领域数据任你挑
- 阿里云李飞飞:All in Cloud时代,云原生数据库优势明显
- 基于Hadoop生态系统的一高性能数据存储格式CarbonData(性能篇)
- 大数据告诉你:10年漫威,到底有多少角色
- TigerGraph:实时图数据库助力金融风控升级
- Splunk利用Splunk Connected Experiences和Splunk Business Flow 扩大数据访问
- 大数据开发常见的9种数据分析手段
- 以免在景区看人,我爬了5W条全国景点门票数据...
- 【实战解析】基于HBase的大数据存储在京东的应用场景
- 数据科学家告诉你哪些计算机科学书籍是你应该看的
- Kafka作为大数据的核心技术,你了解多少?
- Spring Boot 整合 Redis 实现缓存操作
- 大数据学习必须掌握的五大核心技术有哪些?
- 基于Antlr在Apache Flink中实现监控规则DSL化的探索实践
- 甲骨文再次被Gartner评为分析型数据管理解决方案魔力象限领导者
- 爬取吴亦凡微博102118条转发数据,扒一扒流量的真假