您现在的位置是：首页 > 其他

当前栏目

解析一个通过添加本地分区索引提高SQL性能的案例

案例索引 SQL 性能一个解析添加通过

2023-06-13 09:15:03 时间

该sql如下：

复制代码代码如下:

Select /*+parallel(src,8)*/distinct
src.systemnameassystemname
, src.databasenameasdatabasename
, src.tablenameastablename
, src.usernameasusername
from meta_dbql_table_usage_exp_hstsrc
innerjoinDR_QRY_LOG_EXP_HSTrlon
src.acctstringdate=rl.acctstringdate
andsrc.queryid=rl.queryid
AndSrc.Systemname=Rl.Systemname
andsrc.acctstringdate>sysdate-30
AndRl.Acctstringdate>Sysdate-30
innerjoin meta_dr_qry_log_tgt_all_hsttgton
upper(tgt.systemname)=upper("MOZART")
AndUpper(tgt.Databasename)=Upper("GDW_TABLES")
AndUpper(tgt.Tablename)=Upper("SSA_SLNG_LSTG_MTRC_SD")
ANDsrc.acctstringdate=tgt.acctstringdate
andrl.statement_id=tgt.statement_id
andrl.systemname=tgt.systemname
AndTgt.Acctstringdate>Sysdate-30
AndNot(
 Upper(Tgt.Systemname)=Upper(src.systemname)
 And
 Upper(Tgt.Databasename)=Upper(Src.Databasename)
 And
 Upper(Tgt.Tablename)=Upper(Src.Tablename)
 )
And tgt.Systemnameisnotnull
And tgt.DatabasenameIsNotNull
And tgt.tablenameisnotnull

SQL的简单分析
总得来看，这个SQL就是三个表(meta_dbql_table_usage_exp_hst，DR_QRY_LOG_EXP_HST，meta_dr_qry_log_tgt_all_hst）的INNERJOIN，这三个表数据量都在百万级别，且都是分区表（以acctstringdate为分区键），执行计划如下：
复制代码代码如下:

------------------------------------------------------------------------------------------------------------------------
|Id |Operation |Name |Rows |Bytes|Cost |Pstart|Pstop|
------------------------------------------------------------------------------------------------------------------------
| 0|SELECTSTATEMENT | | 1| 159| 8654| | |
| 1| PXCOORDINATOR | | | | | | |
| 2| PXSENDQC(RANDOM) |:TQ10002 | 1| 159| 8654| | |
| 3| SORTUNIQUE | | 1| 159| 8654| | |
| 4| PXRECEIVE | | 1| 36| 3| | |
| 5| PXSENDHASH |:TQ10001 | 1| 36| 3| | |
|* 6| TABLEACCESSBYLOCALINDEXROWID|DR_QRY_LOG_EXP_HST | 1| 36| 3| | |
| 7| NESTEDLOOPS | | 1| 159| 8633| | |
| 8| NESTEDLOOPS | | 8959| 1076K| 4900| | |
| 9| BUFFERSORT | | | | | | |
| 10| PXRECEIVE | | | | | | |
| 11| PXSENDBROADCAST |:TQ10000 | | | | | |
| 12| PARTITIONRANGEITERATOR | | 1| 56| 4746| KEY| 14|
|*13| TABLEACCESSFULL |META_DR_QRY_LOG_TGT_ALL_HST | 1| 56| 4746| KEY| 14|
| 14| PXBLOCKITERATOR | | 8959| 586K| 154| KEY| KEY|
|*15| TABLEACCESSFULL |META_DBQL_TABLE_USAGE_EXP_HST| 8959| 586K| 154| KEY| KEY|
| 16| PARTITIONRANGEITERATOR | | 1| | 2| KEY| KEY|
|*17| INDEXRANGESCAN |DR_QRY_LOG_EXP_HST_IDX | 1| | 2| KEY| KEY|
------------------------------------------------------------------------------------------------------------------------
PredicateInformation(identifiedbyoperationid):
---------------------------------------------------
 6-filter("RL"."STATEMENT_ID"="TGT"."STATEMENT_ID"AND"RL"."SYSTEMNAME"="TGT"."SYSTEMNAME"AND"SRC"."SYSTEMNAME"="RL"."SYSTEMNAME")
13-filter(UPPER("TGT"."SYSTEMNAME")="MOZART"ANDUPPER("TGT"."DATABASENAME")="GDW_TABLES"AND
 UPPER("TGT"."TABLENAME")="SSA_SLNG_LSTG_MTRC_SD"AND"TGT"."ACCTSTRINGDATE">SYSDATE@!-30AND"TGT"."SYSTEMNAME"ISNOTNULL
 "TGT"."DATABASENAME"ISNOTNULLAND"TGT"."TABLENAME"ISNOTNULL)
15-filter("SRC"."ACCTSTRINGDATE"="TGT"."ACCTSTRINGDATE"AND(UPPER("TGT"."SYSTEMNAME")<>UPPER("SRC"."SYSTEMNAME")OR
 UPPER("TGT"."DATABASENAME")<>UPPER("SRC"."DATABASENAME")ORUPPER("TGT"."TABLENAME")<>UPPER("SRC"."TABLENAME"))AND
 "SRC"."ACCTSTRINGDATE">SYSDATE@!-30)
17-access("SRC"."QUERYID"="RL"."QUERYID"AND"SRC"."ACCTSTRINGDATE"="RL"."ACCTSTRINGDATE")
 filter("RL"."ACCTSTRINGDATE">SYSDATE@!-30)

定位问题
从上面执行计划中的表连接方式可以知道，这三个表之间进行了两次NESTEDLOOP，问题出现在最里层的NESTEDLOOP（对两个表都做了TABLEFULLSCAN），因为表都是百万级别的（即时过滤后的数据量也不小），性能问题就出现在内表（即被驱动表）META_DBQL_TABLE_USAGE_EXP_HST做了太多次的全表扫描。如果能把全表扫描转换成索引，则性能可以大幅度提高。

下面是NESTEDLOOP的介绍：
嵌套连接把要处理的数据集分为外部循环（驱动数据源）和内部循环（被驱动数据源），外部循环只执行一次，内部循环执行的次数等于外部循环执行返回的数据个数。
这种连接的好处是内存使用非常少。
如果驱动数据源有限，且被驱动表在连接列上有相应的索引，则这种连接方式才是高效的。

下面是这三个表上索引的情况：

复制代码代码如下:
SQL>selectindex_name,table_namefromuser_indexeswheretable_namein("DR_QRY_LOG_EXP_HST",upper("meta_dbql_table_usage_exp_hst"),upper("meta_dr_qry_log_tgt_all_hs
INDEX_NAME TABLE_NAME
------------------------------------------------------------------------------------------------------------------------
META_DR_QRY_LOG_TGT_ALL_IDX META_DR_QRY_LOG_TGT_ALL_HST
META_DBQL_TUSAGE_EHST_IDX META_DBQL_TABLE_USAGE_EXP_HST
DR_QRY_LOG_EXP_HST_IDX DR_QRY_LOG_EXP_HST
CREATEINDEX"GV"."META_DR_QRY_LOG_TGT_ALL_IDX"ON"GV"."META_DR_QRY_LOG_TGT_ALL_HST"("STATEMENT_ID","ACCTSTRINGDATE")
CREATEINDEX"GV"."META_DBQL_TUSAGE_EHST_IDX"ON"GV"."META_DBQL_TABLE_USAGE_EXP_HST"("QUERYID","ACCTSTRINGDATE")
CREATEINDEX"GV"."DR_QRY_LOG_EXP_HST_IDX"ON"GV"."DR_QRY_LOG_EXP_HST"("QUERYID","ACCTSTRINGDATE")

这三个索引都是本地分区索引（都包含分区键acctstringdate），很显然，DR_QRY_LOG_EXP_HST表少了个索引，因为它与表meta_dr_qry_log_tgt_all_hst在statement_id上做join，因此应该在它的statement_id上也创建本地分区索引如下：
复制代码代码如下:
createindexDR_QRY_LOG_EXP_HST_IDX2ongv.DR_QRY_LOG_EXP_HST(statement_id,ACCTSTRINGDATE)local;

性能对比
新的执行计划如下：
复制代码代码如下:
------------------------------------------------------------------------------------------------------------------------
|Id |Operation |Name |Rows |Bytes|Cost |Pstart|Pstop|
------------------------------------------------------------------------------------------------------------------------
| 0|SELECTSTATEMENT | | 1| 159| 4838| | |
| 1| SORTUNIQUE | | 1| 159| 4838| | |
|* 2| TABLEACCESSBYLOCALINDEXROWID |META_DBQL_TABLE_USAGE_EXP_HST| 1| 67| 3| | |
| 3| NESTEDLOOPS | | 1| 159| 4816| | |
| 4| NESTEDLOOPS | | 18| 1656| 4762| | |
| 5| PARTITIONRANGEITERATOR | | 1| 56| 4746| KEY| 14|
|* 6| TABLEACCESSFULL |META_DR_QRY_LOG_TGT_ALL_HST | 1| 56| 4746| KEY| 14|
| 7| PARTITIONRANGEITERATOR | | 18| 648| 16| KEY| 14|
|* 8| TABLEACCESSBYLOCALINDEXROWID|DR_QRY_LOG_EXP_HST | 18| 648| 16| KEY| 14|
|* 9| INDEXRANGESCAN |DR_QRY_LOG_EXP_HST_IDX2 | 31| | 15| KEY| 14|
| 10| PARTITIONRANGEITERATOR | | 1| | 2| KEY| KEY|
|*11| INDEXRANGESCAN |META_DBQL_TUSAGE_EHST_IDX | 1| | 2| KEY| KEY|
------------------------------------------------------------------------------------------------------------------------
PredicateInformation(identifiedbyoperationid):
---------------------------------------------------
 2-filter((UPPER("TGT"."SYSTEMNAME")<>UPPER("SRC"."SYSTEMNAME")OR
 UPPER("TGT"."DATABASENAME")<>UPPER("SRC"."DATABASENAME")ORUPPER("TGT"."TABLENAME")<>UPPER("SRC"."TABLENAME"))
 AND"SRC"."SYSTEMNAME"="RL"."SYSTEMNAME")
 6-filter(UPPER("TGT"."SYSTEMNAME")="MOZART"ANDUPPER("TGT"."DATABASENAME")="GDW_TABLES"AND
 UPPER("TGT"."TABLENAME")="SSA_SLNG_LSTG_MTRC_SD"AND"TGT"."ACCTSTRINGDATE">SYSDATE@!-30AND"TGT"."SYSTEMNAME"
 ISNOTNULLAND"TGT"."DATABASENAME"ISNOTNULLAND"TGT"."TABLENAME"ISNOTNULL)
 8-filter("RL"."SYSTEMNAME"="TGT"."SYSTEMNAME")
 9-access("RL"."STATEMENT_ID"="TGT"."STATEMENT_ID"AND"RL"."ACCTSTRINGDATE">SYSDATE@!-30AND
 "RL"."ACCTSTRINGDATE"ISNOTNULL)
11-access("SRC"."QUERYID"="RL"."QUERYID"AND"SRC"."ACCTSTRINGDATE"="RL"."ACCTSTRINGDATE")
 filter("SRC"."ACCTSTRINGDATE"="TGT"."ACCTSTRINGDATE"AND"SRC"."ACCTSTRINGDATE">SYSDATE@!-30)

从新的的执行计划可以看出，它的第一个NESTEDLOOP果然用了最新创建的索引。
下面是执行时间：
复制代码代码如下:
已用时间: 00:00:02.16

两秒种搞定，远远超出他期望的5s：）
方法总结
NESTEDLOOP高效的条件：驱动数据源有限，且被驱动表在连接列上有相应的索引。

猜你喜欢

魅力无穷：开启Linux之旅的天猫魔盒（天猫魔盒linux）
Oracle EM监控乃服务运行保证利器（oracle em监控项）
深入探索Oracle数据库触发器类型（oracle触发器类型）
Oracle仓库模块实现数据集中管理（oracle仓库模块应用）
【C 语言】数组 ( 多维数组操作模型 | 取某个数组元素地址 | 取某个数组元素值 )
百度金融周年回顾：是什么让李彦宏称“愿金融成为百度核心业务” | 2016 影响因子
深入浅出Oracle数据库修复指导（oracle数据库修复）
数据深入浅出用Oracle修改单行数据（oracle 修改一行）
jquery$(this).attr$(this).val方法使用介绍
一群萤火虫为何会同步闪光
【Linux 内核】编译 Linux 内核 ⑥ ( 安装 OpenSSL | 安装其它依赖库 | 内核编译完成 )
基于JavaScript数据类型之Boolean类型分析介绍
PCA9685–16路 PWM模块舵机驱动板–STM32 IIC接口模块[通俗易懂]
Oracle的IN走索引技术（in走索引 oracle）
Pandas Query 方法深度总结
【Groovy】Groovy 脚本调用 ( 命令行执行 Groovy 脚本并传入参数 | 获取 Groovy 脚本执行参数 )
Pr蒙版怎么使用 Pr蒙版的使用教程【详解】
原创 | AI顶会论文很多附带源代码？不少是假开源！
降薪、裁员、转型……校外培训正在凉凉
定时自动实现Linux文件上传（linux定时上传）
Mac端简单好用的系统清理优化工具，Sensei
WordPress 设置 wp_remote_get()用户代理
C++11特性_object.equals
Python实战之MySQL数据库操作详解编程语言

zl程序教程

当前栏目

解析一个通过添加本地分区索引提高SQL性能的案例

相关文章