您现在的位置是：首页 > 数据库

当前栏目

MySQL · 引擎特性 · InnoDB COUNT(*) 优化(?)

mysql 引擎优化特性 InnoDB count

2023-09-14 09:03:17 时间

在5.7版本中，InnoDB实现了新的handler的records接口函数，当你需要表上的精确记录个数时，会直接调用该函数进行计算。

实际上records接口函数是在优化阶段调用的，在满足一定条件时，直接去计算行级计数。其explain出来的结果相比老版本也有所不同，这里我们使用sysbench的sbtest表来进行测试，共200万行数据。

mysql show create table sbtest1\G

*************************** 1. row ***************************

 Table: sbtest1

Create Table: CREATE TABLE `sbtest1` (

 `id` int(10) unsigned NOT NULL AUTO_INCREMENT,

 `k` int(10) unsigned NOT NULL DEFAULT 0,

 `c` char(120) NOT NULL DEFAULT ,

 `pad` char(60) NOT NULL DEFAULT ,

 PRIMARY KEY (`id`),

 KEY `k_1` (`k`)

) ENGINE=InnoDB AUTO_INCREMENT=2000001 DEFAULT CHARSET=utf8 MAX_ROWS=1000000

1 row in set (0.00 sec)

mysql explain select count(*) from sbtest1\G

*************************** 1. row ***************************

 id: 1

 select_type: SIMPLE

 table: NULL

 partitions: NULL

 type: NULL

possible_keys: NULL

 key: NULL

 key_len: NULL

 ref: NULL

 rows: NULL

 filtered: NULL

 Extra: Select tables optimized away

1 row in set, 1 warning (0.00 sec)

注意这里Extra里为”Select tables optimized away”，表示在优化器阶段已经被优化掉了。如果给id列带上条件的话，则回退到之前的逻辑

mysql explain select count(*) from sbtest1 where id 0\G

*************************** 1. row ***************************

 id: 1

 select_type: SIMPLE

 table: sbtest1

 partitions: NULL

 type: range

possible_keys: PRIMARY

 key: PRIMARY

 key_len: 4

 ref: NULL

 rows: 960984

 filtered: 100.00

 Extra: Using where; Using index

1 row in set, 1 warning (0.00 sec)

在WL#6742中，为InnoDB实现了handler的records函数接口

函数栈

opt_sum_query

|-- get_exact_record_count

 |-- ha_records

 |-- ha_innobase::records

 |-- row_scan_index_for_mysql

HA_HAS_RECORDS：引擎flag，表示是否可以把count(*)下推到引擎层总是使用聚集索引来进行计算行数只需要读取主键值，无需去读取外部存储列(row_prebuilt_t::read_just_key)，如果行记录较大的话，就可以节省客观的诸如内存拷贝之类的操作开销计算过程可中断，每检索1000条记录，检查事务是否被中断由于只有一次引擎层的调用，减少了Server层和InnoDB的交互，避免了无谓的内存操作或格式转换对于分区表，在5.7版本已经下推到innodb层，因此分区表的计算方式(ha_innopart::records)是针对每个分区调用ha_innobase::records，再将结果累加起来

相关代码:
commit1
commit2

由于总是强制使用聚集索引，缺点很明显：当二级索引的大小远小于聚集索引，且数据不在内存中时，使用二级索引显然要快些，因此文件IO更少。如下例：

默认情况下检索所有行(以下测试都是在清空buffer pool时进行的)：

mysql select count(*) from sbtest1;

+----------+

| count(*) |

+----------+

| 2000000 |

+----------+

1 row in set (3.92 sec)

即时强制指定索引也没用 :(

mysql select count(*) from sbtest1 force index(k_1);

+----------+

| count(*) |

+----------+

| 2000000 |

+----------+

1 row in set (3.86 sec)

但如果带上一个简单的条件，让select count(*)走索引k_1，耗费的时间立马下降了….

mysql select count(*) from sbtest1 where k 0;

+----------+

| count(*) |

+----------+

| 2000000 |

+----------+

1 row in set (1.05 sec)

个人认为这算是一个性能退化，退一步讲，如果用户知道force index能够走一个更好的索引来计算行数，优化器应该做出选择，而不是总是无条件选择聚集索引，提了个Bug到官方

从WL#6742还提到了一个尚未公布的WL#6605，从其只言片语中可以推断官方有意向实现即时获得行数：

The next worklog, WL#6605, is intended to return the COUNT(*) through this handler::records() interface almost immediately in all conditions just by keeping track if the base committed count along with transaction deltas

让我们继续对新版本保持期待吧 :)

华为大佬的“百万级”MySQL笔记，基础+优化+架构一键搞定 MySQL不用多说，大家都知道它是目前最为活跃热门的开源数据库，由于成本低，操作简易的特点，所以在互联网企业中被广泛使用，即使是头部的BATJ。由此可见，想要在互联网行业混得风生水起，或者说想要进入BATJ等一线互联网公司，那么熟练掌握MySQL必定是一块必要的敲门砖。
我又吊打面试官了，凭借MySQL海量数据优化（理论+实战）朋友们，又见面了，上篇文章咱们讲到MySQL分库分表的方法，这篇文章咱们就针对上一篇文章模拟在MySQL中海量数据的优化方法，文章干货较多，建议三连。提示：以下是本篇文章正文内容，案例仅供参考
MySQL优化在我们的实际场景中经常会遇到sql查询较慢的问题,今天特地写一篇文章来聊聊我对于MySQL调优相关内容的知识,以及从哪些点去进行优化.
db匠 rds内核团队秘密研发的全自动卖萌机. 追加特效: 发数据库内核月报. 月报传送: http://mysql.taobao.org/monthly/

猜你喜欢

高等数学（第七版）同济大学习题4-1 个人解答
趣文：程序员最常见的谎话
01-maven环境配置
链式队列---c++版本
手机待办提醒事项如何开启短信同步提醒？
ijkplayer总结
【oracle 导入、导出】escape 的作用。
Alluxio : 开源分布式内存文件系统
zabbix使用snmp监控Linux主机（二十）
js 依据“；”折行
Android之布局属性
面试题 16.21. 交换和-哈希表解法
jQuery.sap.registerModulePath("cus.crm.notes.ext", '/ZCRM_NOTES_W8');
Android Kotlin for循环 when List集合的用法
已解决Pycharm设置Python每个文件开头自定义模板（带上作者名、时间等）
[FAQ] Centos7 解决 gdb 提示 Missing separate debuginfos
关于系统重装的一件小事

相关主题

2.安装MySQL
mysql引擎
mysql数据库引擎
MySQL引擎的和区别
MySQL之数据存储引擎
mysql锁排查
Mysql--between
在MySQL数据库

zl程序教程

当前栏目

MySQL · 引擎特性 · InnoDB COUNT(*) 优化(?)

相关文章