SQL Server-聚焦计算列持久化(二十一)
前言
上一节我们结束了Hash Match Aggregate和Stream Aggregate的讲解,本系列我们来讲讲关于SQL Server中的计算列问题,简短的内容,深入的理解,Always to review the basics。
初探计算列持久化(Compued Column Persisted)
在SQL Server 2005就引入了计算列,我们首先稍微看下在msdn关于计算列的定义:计算列由可以使用同一表中的其他列的表达式计算得来。表达式可以是非计算列的列名、常量、函数,也可以是用一个或多个运算符连接的上述元素的任意组合。表达式不能为子查询。实际上就是为了定义一个列来对其他列来进行计算可以是列名、函数等,那么它的使用场景是什么呢?下面我们首先来举个例子。当需要导出一些值时,此时这些值需要通过计算才能被导出,同时呢,有一些列还依赖于另外的一列或者更多列,如果一个列进行了更新则其依赖的列必须同步进行更新,上述场景通过对一个列或者多个列进行计算,此时我们需要定义一个将一个列或者多个列进行计算得到的值的列,这就是计算列。我们来看一个典型的例子,在一个公司上班的所有员工,在公司内部系统中会存其所有员工的信息,比如员工编号、出生日期等,如果此时我们需要导出员工的退休日期呢,假设在中国现在男性退休时间为60年后,此时我们需要通过出生日期算出60年后的日期,也就说在表中还需要定义一个退休日期列。下面我们创建表来看看计算列。
USE TSQL2012 GO CREATE TABLE Employee ( employeeNumber INT NOT NULL, --员工编号 employeeBirth DATETIME NOT NULL, --出生日期 employeeRetirement AS (DATEADD(YEAR, 60, (employeeBirth)-(1))) PERSISTED --退休日期 )
此时我们看到表中关于退休日期的设计,显示其已经是持久化了的
接下来我们插入测试数据看看
USE TSQL2012 GO INSERT INTO dbo.Employee( employeeNumber, employeeBirth ) SELECT 305423 ,'1985-12-13' UNION ALL SELECT 587650 ,'1989-11-18' UNION ALL SELECT 221836 ,'1990-01-19' UNION ALL SELECT 746104 ,'1993-06-13' UNION ALL SELECT 139024 ,'1995-07-23'
然后我们来查询表
USE TSQL2012 GO SELECT * FROM dbo.Employee
此时我们通过查询雇员表得到其每个雇员的退休日期,到这里是没什么问题的,既然我们设置它是持久化的,也就说当其他列发生改变时计算列也会对应发生改变,突然有一天编号为305423的雇员和录入信息的同事交流,他其实是1986年出生的,上面的1985年是身份证上的,身份证搞错了,此时我们需要更新其出生日期到1986年,如下
UPDATE dbo.Employee SET employeeBirth = '1986-12-13' WHERE employeeNumber = '305423'
接下来我们再来查询数据看看。
此时我们发现当出生日期发生修改时,其对应的计算列也进行了同步由原来的2045更新到了2046,上述我们添加在计算列中添加了Persisted关键字,是不是因为添加这个关键字导致持久化从而当一个列进行更新时,计算列也就同步更新了呢,难道这就是Persisted持久化的作用吗,实际情况不是这样的,当你去掉Persisted关键字此时也会进行同步更新(不信你可以试试),那么Persisted关键字的作用是什么呢?事实情况是这样的,当我们在列上创建了计算列时,此时计算出来的数据并没有存在列中(至于存在哪里我也不知道),计算的数据是在运行时计算出来的,当用Persisted关键字标识计算列之后,这个时候才是将计算结果存在表中计算列上。继续往下看数据存储空间使用情况就可以得到验证。
通过计算列持久化进一步探讨数据存储空间
下面我们来看看当未添加计算列、添加计算列、计算列持久化时表数据存储空间情况。下面我们来创建测试表
USE TSQL2012 GO CREATE TABLE [dbo].[ComputeColumn] ( ID INT, FirstName VARCHAR(100), LastName VARCHAR(100) ) GO
在表中插入10万条数据
INSERT INTO [ComputeColumn] (ID,FirstName,LastName) SELECT TOP 100000 ROW_NUMBER() OVER (ORDER BY a.name) RowID, 'Bob', CASE WHEN ROW_NUMBER() OVER (ORDER BY a.name)%2 = 1 THEN 'Smith' ELSE 'Brown' END FROM sys.all_objects a CROSS JOIN sys.all_objects b GO
此时我们来看看有关表存储空间使用情况
USE TSQL2012 GO sp_spaceused '[ComputeColumn]' GO
上述我们得知存储数据为2680KB,下面我们再来创建计算列看看。
ALTER TABLE dbo.[ComputeColumn] ADD FullName AS (FirstName+' '+LastName) GO
从这里我们可以得出当创建计算列时其数据根本没有存在列上,我们再来看看添加持久化关键字时情况又是怎样的呢
ALTER TABLE dbo.[ComputeColumn] ADD FullName_P AS (FirstName+' '+LastName) PERSISTED GO
当添加持久化关键字时此时表存储数据空间变为了4784KB,到此验证了当未添加Persisted关键字时,在计算列上的数据根本没有存在列上而是在运行时进行了计算,当用Persisted关键字标识计算列时此时数据才存在列上。
通过计算列持久化深入探讨数据存储空间
我们知道如果对列创建索引的话肯定需要一定空间来存储索引,上述我们对列进行了持久化,此时会增加表存储空间,要是我们创建索引是不是会增加表数据存储空间大小呢?我们在未创建计算列前先创建索引看看其表中各种数据空间存储大小,即在创建的列FullName上创建索引。
USE TSQL2012
GO
CREATE NONCLUSTERED INDEX idx_comCol_FullName
ON dbo.ComputeColumn (FullName)
因为创建了索引,所以只是导致索引空间变大了,下面我们再创建计算列持久化并看看其表空间使用情况
USE TSQL2012 GO ALTER TABLE dbo.ComputeColumn ADD FullName_P AS (FirstName+' '+LastName) PERSISTED
从上我们可以看到增加索引未导致表数据大小的增加,而创建计算列持久化则需要额外的空间。分析到这里为止,我们来给出一个基本结论:
计算列分析结论:计算列的用途主要用于多个计算并且比较复杂的计算,如果对计算列进行持久化虽然能够大大减少计算开销但是它会额外增加磁盘空间。
总结
本节我们学习了计算列以及将其持久化的基础内容,下一节我们讲讲关于计算列以及计算列持久化的性能问题,简短的内容,深入的理解,我们下节再会。
相关文章
- 解决开启SQL Server sql Always on Group 事务日志增大的问题
- is-a,has-a,like-a是什么 sql server中,N''表示什么意思? 关于SQL SERVER的N前缀的理解
- C#构造方法(函数) C#方法重载 C#字段和属性 MUI实现上拉加载和下拉刷新 SVN常用功能介绍(二) SVN常用功能介绍(一) ASP.NET常用内置对象之——Server sql server——子查询 C#接口 字符串的本质 AJAX原生JavaScript写法
- sql server 计算2个日期相差的 天数,月数,年数,日期运算/计算
- SQL Server根据地图坐标经纬度计算距离
- ubuntu server vsftpd 匿名用户上传下载及目录设置
- SQL Server 占用内存太高,查找占用内存高以及影响其性能的sql语句及解决方法
- SQL SERVER错误:已超过了锁请求超时时段。 (Microsoft SQL Server,错误: 1222) 解决方案
- SQL SERVER错误:已超过了锁请求超时时段。 (Microsoft SQL Server,错误: 1222)
- MVC3学习:将excel文件导入到sql server数据库
- 《T-SQL性能调优秘笈——基于SQL Server 2012 窗口函数》——1.5 潜在的额外筛选器
- Spring 官方发起Spring Authorization Server 项目
- sql server 小技巧(8) visual studio 2013里使用Sql server compact 4.0及发布问题处理
- sql server 小技巧(4) Sql server 排序时让空值排在最后
- sql: MySQL and Microsoft SQL Server Stored Procedures IN, OUT using csharp code
- Ubuntu Server无桌面无显示器情况下虚拟屏幕xvfb的安装及设置—ubuntu18.04server服务器系统下为python安装虚拟显示器 (使用jupyter notebook在web端播放openai的gym下保存的运行视频——需安装ipython)
- sql server 数据分析优化实战(一)——SQL语句优化
- Server 2008 R2 事件查看器实现日志分析
- SQL Server性能调优——报表数据库与业务数据库分离
- 微软已宣布首次公开预览Linux版本SQL Server
- 优化报表系统结构之报表server计算
- (4.61)sql server执行SQL遇到错误不中断
- (4.52)解决sql server动态SQL中对表字段操作时需要频繁 ISNULL的问题
- (1.2)sql server for linux 开启代理服务(SQL AGENT),使用T-SQL新建作业
- 【sql server复制】教你使用SQL SERVER复制
- Oracle与Sql server 在SQL上的不同
- SQL Server Profiler 跟踪某个数据库某张表sql语句
- 防止开发人员获取到敏感数据(SQL Server的数据加密简介)