SQL Server 查询语句中,对索引列做CONVERT的影响

2024-08-24 23:44

本文主要是介绍SQL Server 查询语句中,对索引列做CONVERT的影响,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

        通常,在做SQL Server查询语句优化的时候,如果发现语句对索引列做了函数计算,都会建议改写,将计算的逻辑转移到筛选条件列上。但这种对索引列的计算,有时却会带来一些额外的好处。请看以下的例子:

--测试数据库 adventureworks2022,兼容级别160
--创建如下的索引:
USE AdventureWorks2022
go
CREATE NONCLUSTERED INDEX IX_ModifiedDateON Sales.SalesOrderDetail (ModifiedDate);
GO 
--Query 原语句
DECLARE @a DATE = '2012-06-29'
SELECT Count(1)
FROM   Sales.SalesOrderDetail
WHERE  CONVERT(DATE, ModifiedDate) = @a --Query 改写后语句
SELECT Count(1)
FROM   Sales.SalesOrderDetail
WHERE  ModifiedDate >= @aAND ModifiedDate < Dateadd(day, 1, @a)
GO

        语句执行后,返回值是9。查看实际的执行计划,改写前成本 4%,改写后成本 96%,为什么这样改写后执行成本反而更高了? 

        仔细比较一下执行计划,可以发现在index seek这个步骤,改写前后的估计值是不一样的,改写前是127,改写后变成了19934。 

        为什么这个改写后的预估值会变得这么大?

        改写后的语句,就是遇到了所谓的本地变量(local variable)的情景,也就是在编译时,不管变量的具体值是什么,而是按照固定的估计值进行的编译,生成执行计划。

        这个固定预估值的计算规则如下:

        如果是等值条件,那么就是按照总行数乘以总密度。ModifiedDate列上索引的统计信息如下:表行数是121317行,ModifiedDate列的总密度为 0.0008896797,总行数乘以总密度,即 12317 * 0.0008896797 = 107.9 行     

        而等值的查询条件,其执行计划中的估计值,就是108。

        而对于非等值条件,则按照下表做估计(Guess):

        表Sales.SalesOrderDetail一共有121317行,按照上图中,查询条件是 >= 和 < ,类似between ,于是121317 * 0.16 = 19410,得到的结果与估计值19934很接近。

        

        这就是改写后估计值非常大的原因。

        而为什么改写前的估计值比较小,更接近于实际结果呢?

        比较改写前后的执行计划,会发现改写之前的语句,在生成执行计划时,用到了索引上的统计信息,所以估计的值就比较准确,而改写后就没有用到统计信息,如下图:

        对于这种convert的索引列如何根据统计信息生成估计值,暂时还没有研究出来。不过试了几个不同的值,包括异常的日期值,预估的执行计划中,估计值都是相同的127。例如:

        

        那对于本地变量的问题,可以在语句中加个recompile的提示,就可以用实际的变量值编译执行计划,自然会提高效率。

--Query 改写前
DECLARE @a DATE = '2012-06-29'
SELECT Count(1)
FROM   Sales.SalesOrderDetail
WHERE  CONVERT(DATE, ModifiedDate) = @a --Query 改写后
SELECT Count(1)
FROM   Sales.SalesOrderDetail
WHERE  ModifiedDate >= @aAND ModifiedDate < Dateadd(day, 1, @a)
option(recompile) --重编译提示
GO

        如下图,加上recompile提示后,估计的行数更准确,执行成本有明显的降低。

参考链接:Yet Another Post About Local Variables In SQL Server – Darling Data (erikdarling.com)icon-default.png?t=N7T8https://erikdarling.com/yet-another-post-about-local-variables/

这篇关于SQL Server 查询语句中,对索引列做CONVERT的影响的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1103941

相关文章

Oracle查询优化之高效实现仅查询前10条记录的方法与实践

《Oracle查询优化之高效实现仅查询前10条记录的方法与实践》:本文主要介绍Oracle查询优化之高效实现仅查询前10条记录的相关资料,包括使用ROWNUM、ROW_NUMBER()函数、FET... 目录1. 使用 ROWNUM 查询2. 使用 ROW_NUMBER() 函数3. 使用 FETCH FI

数据库oracle用户密码过期查询及解决方案

《数据库oracle用户密码过期查询及解决方案》:本文主要介绍如何处理ORACLE数据库用户密码过期和修改密码期限的问题,包括创建用户、赋予权限、修改密码、解锁用户和设置密码期限,文中通过代码介绍... 目录前言一、创建用户、赋予权限、修改密码、解锁用户和设置期限二、查询用户密码期限和过期后的修改1.查询用

Mysql虚拟列的使用场景

《Mysql虚拟列的使用场景》MySQL虚拟列是一种在查询时动态生成的特殊列,它不占用存储空间,可以提高查询效率和数据处理便利性,本文给大家介绍Mysql虚拟列的相关知识,感兴趣的朋友一起看看吧... 目录1. 介绍mysql虚拟列1.1 定义和作用1.2 虚拟列与普通列的区别2. MySQL虚拟列的类型2

Window Server创建2台服务器的故障转移群集的图文教程

《WindowServer创建2台服务器的故障转移群集的图文教程》本文主要介绍了在WindowsServer系统上创建一个包含两台成员服务器的故障转移群集,文中通过图文示例介绍的非常详细,对大家的... 目录一、 准备条件二、在ServerB安装故障转移群集三、在ServerC安装故障转移群集,操作与Ser

mysql数据库分区的使用

《mysql数据库分区的使用》MySQL分区技术通过将大表分割成多个较小片段,提高查询性能、管理效率和数据存储效率,本文就来介绍一下mysql数据库分区的使用,感兴趣的可以了解一下... 目录【一】分区的基本概念【1】物理存储与逻辑分割【2】查询性能提升【3】数据管理与维护【4】扩展性与并行处理【二】分区的

MySQL中时区参数time_zone解读

《MySQL中时区参数time_zone解读》MySQL时区参数time_zone用于控制系统函数和字段的DEFAULTCURRENT_TIMESTAMP属性,修改时区可能会影响timestamp类型... 目录前言1.时区参数影响2.如何设置3.字段类型选择总结前言mysql 时区参数 time_zon

Python MySQL如何通过Binlog获取变更记录恢复数据

《PythonMySQL如何通过Binlog获取变更记录恢复数据》本文介绍了如何使用Python和pymysqlreplication库通过MySQL的二进制日志(Binlog)获取数据库的变更记录... 目录python mysql通过Binlog获取变更记录恢复数据1.安装pymysqlreplicat

使用SQL语言查询多个Excel表格的操作方法

《使用SQL语言查询多个Excel表格的操作方法》本文介绍了如何使用SQL语言查询多个Excel表格,通过将所有Excel表格放入一个.xlsx文件中,并使用pandas和pandasql库进行读取和... 目录如何用SQL语言查询多个Excel表格如何使用sql查询excel内容1. 简介2. 实现思路3

Mysql DATETIME 毫秒坑的解决

《MysqlDATETIME毫秒坑的解决》本文主要介绍了MysqlDATETIME毫秒坑的解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着... 今天写代码突发一个诡异的 bug,代码逻辑大概如下。1. 新增退款单记录boolean save = s

mysql-8.0.30压缩包版安装和配置MySQL环境过程

《mysql-8.0.30压缩包版安装和配置MySQL环境过程》该文章介绍了如何在Windows系统中下载、安装和配置MySQL数据库,包括下载地址、解压文件、创建和配置my.ini文件、设置环境变量... 目录压缩包安装配置下载配置环境变量下载和初始化总结压缩包安装配置下载下载地址:https://d