深入SQLServer日志收缩

本文涉及的产品
云数据库 RDS SQL Server,基础系列 2核4GB
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
日志服务 SLS,月写入数据量 50GB 1个月
简介: ### 问题背景 SQLServer的日志是DB级别的这点和MySQL不同,多个DB就需要维护多个日志文件并且每个DB的日志文件可以有多个,所以从空间资源的角度来说这给云上的用户带来一些困扰,毕竟在云上磁盘空间是要收费的,除了性能他们也非常关心这些日志何时截断重用、何时收缩 ### 问题探讨 [事务日志](https://msdn.microsoft.com/en-us/librar

问题背景

SQLServer的日志是DB级别的这点和MySQL不同,多个DB就需要维护多个日志文件并且每个DB的日志文件可以有多个,所以从空间资源的角度来说这给云上的用户带来一些困扰,毕竟在云上磁盘空间是要收费的,除了性能他们也非常关心这些日志何时截断重用、何时收缩

问题探讨

事务日志

在理解事务日志基本概念的基础上我们来做个有关收缩的测试:

    --1. 构建测试用的日志
    --    tpcc是我的测试DB,ITEM表是之前生成的一个测试表,这里不需要关心表内容
    USE [tpcc]
    GO
    DECLARE @VALUE INT
    SET @VALUE = 0
    WHILE @VALUE <= 100
    BEGIN
        SELECT * INTO ITEM_2 FROM ITEM
        DROP TABLE ITEM_2
           SET @VALUE = @VALUE + 1
    END
    GO    
    
    --2. 观察当前等待日志截断重用的原因和每个DB的日志使用量
    select log_reuse_wait_desc from sys.databases where name='tpcc'
    go
    dbcc sqlperf(logspace)
    go

1.png

    --3. 备份数据和日志
    BACKUP DATABASE TPCC TO DISK='D:\BACKUP\TPCC.BAK' WITH COMPRESSION,INIT
    BACKUP LOG TPCC TO DISK='D:\BACKUP\TPCC.TRN' WITH COMPRESSION,INIT
    
    --4. 再次观察当前等待日志截断重用的原因和每个DB的日志使用量
    select log_reuse_wait_desc from sys.databases where name='tpcc'
    go
    dbcc sqlperf(logspace)
    go

2.png

    --5. 收缩日志
    USE [tpcc]
    GO
    dbcc shrinkfile(log)

3.png

    --6. 查看收缩后的日志使用量        
    dbcc sqlperf(logspace)
    go

4.png

这一步也可以通过上一步收缩的结果计算出来(90112*8K = 704 MB);

现在在理解基本概念的基础上产生了第一个疑问,为什么1G的日志使用了4%却只能收缩到704MB?

为了解答这个问题我们需要引入另一个概念 Virtual Log Files(VLF),SQLServer为了方便日志管理,逻辑上将事务日志划分为多个虚拟日志文件,我们要讨论的收缩就是以虚拟日志文件为单位操作的。

具体可以参考日志的结构

我们再来重复一次刚才的测试,这次加入对VLFs的记录观察;

在刚才的1、3、5步骤之后记录如下SQL返回结果,帮助后续分析;

USE [tpcc]
GO    
dbcc loginfo

步骤1结束后
5.png

步骤3结束后
6.png

步骤5结束后
7.png

这里跟收缩日志最相关的是Stats字段,0表示inactive,2表示active,active状态的VLF通过checkpoint+日志备份可以转化为inactive,但有一个原则是header(可理解为最新的活动日志)部分只能后推或回绕(wraps around)不能move forward(跟offset相关);

在开始备份前有11个活动VLF,checkpoint(数据备份的第一阶段)+ 备份日志后只有最新的VLF处于活动状态(日志截断并标记老的VLF为inactive-可重用),收缩后释放掉了未使用的VLF;

截止到这里截断和收缩实际已经达到了充分利用空间的目的,虽然直观看物理文件没有下降多少但新的日志已经开始回绕;但即便如此一些客户还在追求物理文件的进一步减少,实际想达到这个目的也很简单,依据之前讲的header部分已经回绕,再次备份收缩就可以了;

--再次备份
backup database tpcc to disk='d:\backup\tpcc.bak' with compression,init
backup log tpcc to disk='d:\backup\tpcc.trn' with compression,init

--再次收缩
USE [tpcc]
GO
dbcc shrinkfile(log)    

--观察VLF
USE [tpcc]
GO    
dbcc loginfo    

8.png

为什么没有收缩最后一个inactive的VLF跟这个DB的日志初始化大小、shrinkfile的参数有关,简单说不回收最后一个VLF已经可以达到初始化的大小;

我们也可以通过VLF的总大小和物理文件对比做一个验证:

--通过FileSize计算要加8KB的页头                67043328+67043328+67043328+67043328+67043328+67043328+67043328+67559424+8192=536870912B=512MB

--通过最后一个偏移量算
469311488+67559424=536870912B=512MB        

结论和建议

  • 日志截断依赖于checkpoint和日志备份(FULL模式)
  • 日志截断的含义是把VLF标记为可重用
  • 日志收缩的多少需要看VLF的header和VLF的数量以及大小而不是通过sqlperf返回的结果判断(这也是很多DBA和用户误解的地方)
  • VLF的数量是事务日志创建时初始化好的一个初始值后续会随日志增长和增加,大小跟日志文件的大小、增长速度相关没有恒等的计算方法
  • 在非云场景下(传统用户),不建议用户频繁做日志收缩去回收空间,因为这种收缩是有很大开销的,但肯定也不会一直增长,我们通过频繁的日志备份做截断、回绕日志文件以达到节省空间的目的;在云场景下(RDS),依然也不建议频繁收缩,但面对一些希望用其它资源换空间资源且业务场景允许的情况下,建议这部分用户使用OpenAPI定制化自己的备份策略
相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
5月前
|
SQL 数据库 数据安全/隐私保护
SQL Server数据库Owner导致事务复制log reader job无法启动的解决办法
【8月更文挑战第14天】解决SQL Server事务复制Log Reader作业因数据库所有者问题无法启动的方法:首先验证数据库所有者是否有效并具足够权限;若非,使用`ALTER AUTHORIZATION`更改为有效登录名。其次,确认Log Reader使用的登录名拥有读取事务日志所需的角色权限。还需检查复制配置是否准确无误,并验证Log Reader代理的连接信息及参数。重启SQL Server Agent服务或手动启动Log Reader作业亦可能解决问题。最后,审查SQL Server错误日志及Windows事件查看器以获取更多线索。
|
4月前
|
SQL 安全 数据库
基于SQL Server事务日志的数据库恢复技术及实战代码详解
基于事务日志的数据库恢复技术是SQL Server中一个非常强大的功能,它能够帮助数据库管理员在数据丢失或损坏的情况下,有效地恢复数据。通过定期备份数据库和事务日志,并在需要时按照正确的步骤恢复,可以最大限度地减少数据丢失的风险。需要注意的是,恢复数据是一个需要谨慎操作的过程,建议在执行恢复操作之前,详细了解相关的操作步骤和注意事项,以确保数据的安全和完整。
198 0
|
SQL 关系型数据库 数据库
解决 RDS SQL Server 日志空间增长问题
解决 RDS SQL Server 日志空间增长问题
|
存储 SQL Linux
SQLServer On Linux 错误日志检查|学习笔记
快速学习 SQLServer On Linux 错误日志检查
564 0
SQLServer On Linux 错误日志检查|学习笔记
|
SQL BI 数据库
SQL Server 高可用性(六)日志传送
日志传送是非常古老的高可用性技术。
167 0
SQL Server 高可用性(六)日志传送
|
2月前
|
XML 安全 Java
【日志框架整合】Slf4j、Log4j、Log4j2、Logback配置模板
本文介绍了Java日志框架的基本概念和使用方法,重点讨论了SLF4J、Log4j、Logback和Log4j2之间的关系及其性能对比。SLF4J作为一个日志抽象层,允许开发者使用统一的日志接口,而Log4j、Logback和Log4j2则是具体的日志实现框架。Log4j2在性能上优于Logback,推荐在新项目中使用。文章还详细说明了如何在Spring Boot项目中配置Log4j2和Logback,以及如何使用Lombok简化日志记录。最后,提供了一些日志配置的最佳实践,包括滚动日志、统一日志格式和提高日志性能的方法。
554 31
【日志框架整合】Slf4j、Log4j、Log4j2、Logback配置模板
|
29天前
|
监控 安全 Apache
什么是Apache日志?为什么Apache日志分析很重要?
Apache是全球广泛使用的Web服务器软件,支持超过30%的活跃网站。它通过接收和处理HTTP请求,与后端服务器通信,返回响应并记录日志,确保网页请求的快速准确处理。Apache日志分为访问日志和错误日志,对提升用户体验、保障安全及优化性能至关重要。EventLog Analyzer等工具可有效管理和分析这些日志,增强Web服务的安全性和可靠性。
|
3月前
|
XML JSON Java
Logback 与 log4j2 性能对比:谁才是日志框架的性能王者?
【10月更文挑战第5天】在Java开发中,日志框架是不可或缺的工具,它们帮助我们记录系统运行时的信息、警告和错误,对于开发人员来说至关重要。在众多日志框架中,Logback和log4j2以其卓越的性能和丰富的功能脱颖而出,成为开发者们的首选。本文将深入探讨Logback与log4j2在性能方面的对比,通过详细的分析和实例,帮助大家理解两者之间的性能差异,以便在实际项目中做出更明智的选择。
383 3
|
7天前
|
SQL 关系型数据库 MySQL
MySQL事务日志-Undo Log工作原理分析
事务的持久性是交由Redo Log来保证,原子性则是交由Undo Log来保证。如果事务中的SQL执行到一半出现错误,需要把前面已经执行过的SQL撤销以达到原子性的目的,这个过程也叫做"回滚",所以Undo Log也叫回滚日志。
MySQL事务日志-Undo Log工作原理分析