SQL Server计算数据库中表、堆、聚集索引和非聚集索引的大小

本文涉及的产品
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
云数据库 RDS SQL Server,基础系列 2核4GB
简介:

前言

在前篇的一篇博客Sql Server中的表组织和索引组织(聚集索引结构,非聚集索引结构,堆结构)中写到了数据中表和索引的结构。当时在写聚集索引的时候说聚集索引的叶子节点就是真实的数据,而非聚集索引的叶子节点是指针,要么指向聚集索引,要么指向行号。当时就在考虑一个,如果索引都带真实数据了,那么到底是索引大还是表呢呢?

今天在msdn上查到了如何估算数据库的大小,其中在估算表的大小时,给出了如下说明:

可以使用下列步骤估计在表中存储数据所需的空间:

  1. 按照估计堆的大小估计聚集索引的大小中的说明计算堆或聚集索引所需的空间。
  2. 对于每个非聚集索引,按照估计非聚集索引的大小中的说明计算其所需的空间。
  3. 对步骤 1 和步骤 2 中计算的值求和。

这就说明了表其实包含索引跟数据两部分,索引是建立在表上的。之前一直将数据跟表分割了,所以才产生开头提到的问题。现在算是明白了。那么又有新的问题了,索引跟数据,哪个大?

计算堆的大小

我们通过以下的一个小实验来计算数据在堆结构中的存储方式。

复制代码
use TESTDB1
go
--step1:创建表
CREATE TABLE Orders2
(
  orderid        INT,--4字节
  orderdate      DATETIME, --8字节
  freight        MONEY,--8字节
  shipname       NCHAR(40),--double-byte存储,40*2=80字节
  shipcountry    CHAR(15) --single-byte存储,15字节
);
go
--step2:计算列大小
--原先的计算这张表的列大小为:4+8+8+80+15=115字节,一页能够存储8060/115=70.08,取整为70行数据
/*
按照http://msdn.microsoft.com/zh-cn/library/ms189124.aspx的方法计算
Row_Size=Fixed_Data_Size + Variable_Data_Size + Null_Bitmap + 4。这里
Fixed_Data_Size=4+8+8+80+15=115
Variable_Data_Size=0,
Null_Bitmap = 2 + ((Num_Cols + 7) / 8)= 2 + ((5 + 7) / 8)=3
Row_Size=115+0+3+4=122
Rows_Per_Page = 8096 / (Row_Size + 2)=8060/(122+2)=8060/124=65
*/
--step3:查看表存储信息
select * from Orders2;
--未插入数据前,查询全部都是0
exec sp_spaceused Orders2

--step4:插入一条记录
INSERT INTO Orders2(orderid, orderdate, freight, shipname,  shipcountry)
  VALUES(10248, '20060704 00:00:00.000',  32.38, N'Ship to 85-B',  'France');
select * from Orders2;

--step5:再次查看表存储信息
--插入数据以后,data=8kb,index=8kb。8kb是最小的IO单位,即使只有一行,也是8kb。
exec sp_spaceused Orders2

--step6:前面插入了一行数据,我们之前算过一页能存65行,下面我们插入60行,然后再一条一条递增。看一下是不是还是8kb
--循环插入60条记录
declare @i int 
set @i=1 
while @i<=60
  begin 
    INSERT INTO Orders2(orderid, orderdate, freight, shipname,  shipcountry)
                VALUES(10248, '20060704 00:00:00.000',  32.38, N'Ship to 85-B',  'France');
    set @i = @i + 1
  end

--step7:查看表存储信息,查询结果还是data=8kb,index=8kb
select * from Orders2;
exec sp_spaceused Orders2

--step8:再次插入一条记录,直到rows=64时,data=16kb,表示数据占用两个page了,
--按照计算应该是65.刚刚满页.这是否表明页不能存满,存满马上分页.
 INSERT INTO Orders2(orderid, orderdate, freight, shipname,  shipcountry)
                VALUES(10248, '20060704 00:00:00.000',  32.38, N'Ship to 85-B',  N'France');
--step9:
exec sp_spaceused Orders2
复制代码

疑问:按照计算,一页刚刚好能够存65条记录,但是在存到64页的时候就占用16kb,也就是两页了,这是为什么?是否表明数据不能满页。

将上述

 shipcountry    CHAR(15)

修改为

 shipcountry    CHAR(20)

那么按照公式计算如下

复制代码
/*
Row_Size=Fixed_Data_Size + Variable_Data_Size + Null_Bitmap + 4。这里
Fixed_Data_Size=4+8+8+80+20=120
Variable_Data_Size=0,
Null_Bitmap = 2 + ((Num_Cols + 7) / 8)= 2 + ((5 + 7) / 8)=3
Row_Size=120+0+3+4=127
Rows_Per_Page = 8096 / (Row_Size + 2)=8060/(127+2)=8060/129=62.4
*/
复制代码

上述公示表明我一页能够存储62行,但是在我插入了60行数据的时候data=8kb,但是当rows=61的时候,data=16kb了。



 本文转自xwdreamer博客园博客,原文链接:http://www.cnblogs.com/xwdreamer/archive/2012/07/12/2588761.html,如需转载请自行联系原作者

相关实践学习
使用SQL语句管理索引
本次实验主要介绍如何在RDS-SQLServer数据库中,使用SQL语句管理索引。
SQL Server on Linux入门教程
SQL Server数据库一直只提供Windows下的版本。2016年微软宣布推出可运行在Linux系统下的SQL Server数据库,该版本目前还是早期预览版本。本课程主要介绍SQLServer On Linux的基本知识。 相关的阿里云产品:云数据库RDS&nbsp;SQL Server版 RDS SQL Server不仅拥有高可用架构和任意时间点的数据恢复功能,强力支撑各种企业应用,同时也包含了微软的License费用,减少额外支出。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/sqlserver
目录
相关文章
|
3月前
|
SQL 数据库
数据库数据恢复—SQL Server数据库报错“错误823”的数据恢复案例
SQL Server附加数据库出现错误823,附加数据库失败。数据库没有备份,无法通过备份恢复数据库。 SQL Server数据库出现823错误的可能原因有:数据库物理页面损坏、数据库物理页面校验值损坏导致无法识别该页面、断电或者文件系统问题导致页面丢失。
104 12
数据库数据恢复—SQL Server数据库报错“错误823”的数据恢复案例
|
18天前
|
SQL 存储 Linux
从配置源到数据库初始化一步步教你在CentOS 7.9上安装SQL Server 2019
【11月更文挑战第16天】本文介绍了在 CentOS 7.9 上安装 SQL Server 2019 的详细步骤,包括配置系统源、安装 SQL Server 2019 软件包以及数据库初始化,确保 SQL Server 正常运行。
|
27天前
|
SQL 存储 Linux
从配置源到数据库初始化一步步教你在CentOS 7.9上安装SQL Server 2019
【11月更文挑战第8天】本文介绍了在 CentOS 7.9 上安装 SQL Server 2019 的详细步骤,包括系统准备、配置安装源、安装 SQL Server 软件包、运行安装程序、初始化数据库以及配置远程连接。通过这些步骤,您可以顺利地在 CentOS 系统上部署和使用 SQL Server 2019。
|
28天前
|
SQL 存储 Linux
从配置源到数据库初始化一步步教你在CentOS 7.9上安装SQL Server 2019
【11月更文挑战第7天】本文介绍了在 CentOS 7.9 上安装 SQL Server 2019 的详细步骤,包括系统要求检查与准备、配置安装源、安装 SQL Server 2019、配置 SQL Server 以及数据库初始化(可选)。通过这些步骤,你可以成功安装并初步配置 SQL Server 2019,进行简单的数据库操作。
|
2月前
|
存储 数据挖掘 数据库
数据库数据恢复—SQLserver数据库ndf文件大小变为0KB的数据恢复案例
一个运行在存储上的SQLServer数据库,有1000多个文件,大小几十TB。数据库每10天生成一个NDF文件,每个NDF几百GB大小。数据库包含两个LDF文件。 存储损坏,数据库不可用。管理员试图恢复数据库,发现有数个ndf文件大小变为0KB。 虽然NDF文件大小变为0KB,但是NDF文件在磁盘上还可能存在。可以尝试通过扫描&拼接数据库碎片来恢复NDF文件,然后修复数据库。
|
2月前
|
SQL 存储 缓存
SQL计算班级语文平均分:详细步骤与技巧
在数据库管理和分析中,经常需要计算某个班级在特定科目上的平均分
|
3月前
|
SQL 存储 并行计算
Lindorm Ganos 一条 SQL 计算轨迹
Lindorm Ganos 针对轨迹距离计算场景提供了内置函数 ST_Length_Rows,结合原生时空二级索引和时空聚合计算下推技术,能够高效过滤数据并并行执行运算任务。该方案通过主键索引和时空索引快速过滤数据,并利用多Region并行计算轨迹点距离,适用于车联网等场景。具体步骤包括根据车辆识别代码和时间戳过滤数据、范围过滤轨迹点以及并行计算距离。使用限制包括只支持点类型列聚合运算及表中轨迹点需按顺序排列等。测试结果显示,Lindorm Ganos 在不同数据量下均能实现秒级响应。
31 3
|
3月前
|
SQL 关系型数据库 MySQL
创建包含MySQL和SQLServer数据库所有字段类型的表的方法
创建一个既包含MySQL又包含SQL Server所有字段类型的表是一个复杂的任务,需要仔细地比较和转换数据类型。通过上述方法,可以在两个数据库系统之间建立起相互兼容的数据结构,为数据迁移和同步提供便利。这一过程不仅要考虑数据类型的直接对应,还要注意特定数据类型在不同系统中的表现差异,确保数据的一致性和完整性。
36 4
|
3月前
|
SQL 存储 索引
SQL Server的Descending Indexes降序索引
【9月更文挑战第21天】在SQL Server中,降序索引允许指定列的排序顺序为降序,可显著优化涉及降序排序的查询性能,特别是在复合索引中。通过创建降序索引,可以更高效地满足特定业务需求,如按交易时间降序获取最新记录。然而,使用时需考虑查询频率、数据分布及维护成本,以确保最佳性能。
|
3月前
|
SQL 存储 数据管理
SQL Server数据库
SQL Server数据库
68 11

热门文章

最新文章