RDS SQL Server死锁(Deadlock)系列之二使用Profiler捕获死锁

简介: # 问题引入 不管是RDS SQL Server还是自建SQL Server数据库,死锁的确是一个非常头疼的问题,上一篇文章我们已经谈到了[使用DBCC捕获死锁](https://yq.aliyun.com/articles/73856?spm=5176.8091938.0.0.rjljJx)。这篇文章是以阿里云RDS客户遇到的死锁问题为背景,分享死锁文章系列之二使用Profiler捕获死锁。

问题引入

不管是RDS SQL Server还是自建SQL Server数据库,死锁的确是一个非常头疼的问题,上一篇文章我们已经谈到了使用DBCC捕获死锁。这篇文章是以阿里云RDS客户遇到的死锁问题为背景,分享死锁文章系列之二使用Profiler捕获死锁。

Profiler捕获死锁

使用Profiler工具的Deadlock graph事件,可以非常方便直观的捕获死锁信息。方法是:
开启MSSQL Profiler:开始 -> 运行 -> 键入profiler
新建Deadlock Graph Trace:在Profiler窗体中,开启一个Trace -> 显示所有事件 -> 依次找到Locks -> DeadLocak Graph -> 运行(详情参见下面的截图,按照字母标号依次点击)。
01.png

注意这里我们仅Trace这一个事件就好了,取消其他多余与死锁无关的事件。
02.png

死锁测试

死锁测试的方法和上一篇文章一致,参见上一篇文章RDS SQL Server死锁(Deadlock)系列之一使用DBCC捕获死锁中死锁测试部分,在此不在累述。

死锁分析

当死锁状况发生时,Profiler捕获到死锁信息,绘制成Deadlock Graph图,非常直观的展示了死锁的进程、牺牲的进程和争抢的资源。

分析Deadlock graph图

接下来就是分析死锁发生时的情况,参加如下截图:
03.png

通过死锁关系图的展示,我们可以分析如下:
牺牲进程:图中最左边被×掉的64号进程是死锁牺牲品,它申请到了test_deadlock2的X锁,再申请test_deadlock1的X锁时,被做为了牺牲品。
死锁进程:图中最右边63号进程首先获取到了test_deadlock1的X锁,然后申请test_deadlock2的X锁,但这个时候64号进程已经拿走了test_deadlock2的X锁。系统选择杀死64号进程(即64做为了牺牲品),让63号进程成功获取到test_deadlock2的X锁,他是本次资源争抢的获胜者。
争抢的资源:图中中部是两个进程争抢的资源,我们可以通过图中资源的HoBt ID获取表和索引名,方法如下:
04.png

分析Deadlock Trace文件

虽然通过Deadlock Graph图可以很清楚的分析出死锁的关系,找到资源的争抢点,但是我个人推荐分析Deadlock Trace文件的方式,这种方式更加简单明了。我们需要首先保存Deadlock Graph监控信息到文件,比如保存到C:TempDeadlock_testing.trc,方法如下:
05.png

文件保存完毕以后的.trc为后缀的文件其实就是xml类型的文件,我们可以使用接下来的语句进行分析XML文件:

use master
go

-- declare variables.
declare 
        @file nvarchar(256)
;
select 
        @file = N'C:\Temp\Deadlock_testing.trc'
;

WITH DATA
AS
(        
        SELECT 
                --[TraceID] = @trace_id , 
                RowNumber = row_number() OVER (ORDER BY StartTime), -- assign a row number to each deadlock
                [DeadlockGraph]=case when TextData like '<deadlock-list%' then convert(xml, TextData) else null end, 
                * 
        from ::fn_trace_gettable(@file, default)
        where TextData like '<deadlock-list%'
)
,
deadlock
AS
(
        SELECT 
                        RowNumber
                        ,OwnerID = T.C.value('@id', 'varchar(50)')
                        ,SPid = T.C.value('(./@spid)[1]','int')
                        ,status = T.C.value('(./@status)[1]','varchar(10)')
                        --,PagelockObject = T.C.value('/deadlock-list[1]/deadlock[1]/resource-list[1]/pagelock[1]/@objectname', 'varchar(200)')
                        --,DeadlockObject = T.C.value('/deadlock-list[1]/deadlock[1]/resource-list[1]/objectlock[1]/@objectname', 'varchar(200)')
                        --,KeylockObject = T.C.value('/deadlock-list[1]/deadlock[1]/resource-list[1]/pagelock[1]/@objectname', 'varchar(200)')
                        --,DeadlockObject = T.C.value('/deadlock-list[1]/deadlock[1]/resource-list[1]/objectlock[1]/@objectname', 'varchar(200)')
                        ,Victim = case when T.C.value('@id', 'varchar(50)') = T.C.value('./../../@victim','varchar(50)') then 1 else 0 end
                        ,LockMode = T.C.value('@lockMode', 'varchar(20)')
                        ,DeadlockGraph
                        ,Inputbuf = T.C.value('(./inputbuf/text())[1]','varchar(max)')
                        ,Code = T.C.value('(./executionStack/frame/text())[1]','VARCHAR(max)')
                        ,SPName = T.C.value('(./executionStack/frame/@procname)[1]','sysname')
                        ,Hostname = T.C.value('(./@hostname)[1]','sysname')
                        ,Clientapp = T.C.value('(./@clientapp)[1]','varchar(max)')
                        ,LoginName = T.C.value('@loginname', 'varchar(20)')
                        ,Action = T.C.value('(./@transactionname)[1]','varchar(max)')
                        ,StartTime
                        ,TransactionTime = T.C.value('@lasttranstarted', 'datetime')
                        --,* 
        FROM DATA AS A
                CROSS APPLY DeadlockGraph.nodes('deadlock-list/deadlock/process-list/process') AS T(C)
)
,
keylock
AS
(
        SELECT
                OwnerID = T.C.value('./owner[1]/@id', 'varchar(50)')
                ,KeylockObject = T.C.value('./../@objectname', 'varchar(200)')
                ,Indexname = T.C.value('./../@indexname', 'varchar(200)')
                ,IndexLockMode = T.C.value('./../@mode', 'varchar(20)')
                --,owner = T.C.query('.')
        FROM DATA AS A
                CROSS APPLY DeadlockGraph.nodes('deadlock-list/deadlock/resource-list/keylock/owner-list') AS T(C)
)
SELECT 
        --A.OwnerID
        A.SPid
        ,is_Vitim = A.Victim
        --,A.DeadlockGraph
        ,A.SPName
        ,A.Code
        ,A.LockMode
        ,A.StartTime
        ,B.Indexname
        ,B.KeylockObject
        ,B.IndexLockMode
        ,A.Inputbuf
        ,A.Hostname
        ,A.LoginName
        ,A.Clientapp
        ,A.Action
        ,status
        ,A.TransactionTime
FROM deadlock AS A
        LEFT JOIN keylock AS B
        ON A.OwnerID = B.OwnerID
ORDER BY A.RowNumber,A.Victim

执行的结果如下截图:
06.png

从这个分析结果来看,我们可以非常清晰明了得到如下信息:
死锁与被死锁进程:63和64号进程
死锁发生时,两个进程执行的语句
死锁的类型:本例是X锁
锁定资源的对象和索引名
死锁的两个进程执行的语句块是什么
进程执行所在的主机
......

分析Deadlock Trace表

我们既可以将Deadlock Graph保存为Trace文件,还可以将其保存到Trace表中,假如我们将这个捕获到的死锁信息保存到本地数据库表test.dbo.Deadlock_testing中,方法如下:
07.png

分析Deadlock Trace Table方法与分析Deadlock Trace File类似,只需要将分析语句中的DATA公用表示稍微修改即可:

WITH DATA
AS
(
        
        SELECT 
                RowNumber = row_number() OVER (ORDER BY StartTime)
                ,DeadlockGraph = CAST(TextData AS xml)
                ,StartTime
                ,spid
        FROM test.dbo.Deadlock_testing WITH (NOLOCK)
        WHERE EventClass = 148
)

阿里云RDS SQL Server

如果你是阿里云RDS SQL Server 2008R2用户,请工单联系阿里云,申请实例的Profiler权限,然后即可按照本方法来自行排查;如果你是阿里云RDS SQL Server 2012用户,默认已经具备Profiler权限,无需申请权限。

最后总结

使用Profiler捕获死锁信息的方法比使用DBCC的方式更加灵活,直观,一目了然。希望阿里云RDS SQL Server客户借助本系列文章都可以自己动起手来,分析死锁,解决死锁的问题。

相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。 &nbsp; 相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/mysql&nbsp;
目录
相关文章
|
3月前
|
关系型数据库 MySQL 数据库
阿里云数据库RDS费用价格:MySQL、SQL Server、PostgreSQL和MariaDB引擎收费标准
阿里云RDS数据库支持MySQL、SQL Server、PostgreSQL、MariaDB,多种引擎优惠上线!MySQL倚天版88元/年,SQL Server 2核4G仅299元/年,PostgreSQL 227元/年起。高可用、可弹性伸缩,安全稳定。详情见官网活动页。
783 152
|
3月前
|
关系型数据库 MySQL 数据库
阿里云数据库RDS支持MySQL、SQL Server、PostgreSQL和MariaDB引擎
阿里云数据库RDS支持MySQL、SQL Server、PostgreSQL和MariaDB引擎,提供高性价比、稳定安全的云数据库服务,适用于多种行业与业务场景。
|
4月前
|
SQL 容灾 安全
云时代SQL Server的终极答案:阿里云 RDS SQL Server如何用异地容灾重构系统可靠性
在数字化转型的浪潮中,数据库的高可用性已成为系统稳定性的生命线。作为经历过多次生产事故的资深开发者,肯定深知传统自建SQL Server架构的脆弱性——直到遇见阿里云 RDS SQL Server,其革命性的异地容灾架构彻底改写了游戏规则。
|
11月前
|
关系型数据库 MySQL 数据库连接
数据库连接工具连接mysql提示:“Host ‘172.23.0.1‘ is not allowed to connect to this MySQL server“
docker-compose部署mysql8服务后,连接时提示不允许连接问题解决
459 69
|
12月前
|
安全 关系型数据库 MySQL
Windows Server 安装 MySQL 8.0 详细指南
安装 MySQL 需要谨慎,特别注意安全配置和权限管理。根据实际业务需求调整配置,确保数据库的性能和安全。
1048 9
|
SQL 开发框架 .NET
突破T-SQL限制:利用CLR集成扩展RDS SQL Server的功能边界
CLR集成为SQL Server提供了强大的扩展能力,突破了T-SQL的限制,极大地拓展了SQL 的应用场景,如:复杂字符串处理、高性能计算、图像处理、机器学习集成、自定义加密解密等,使开发人员能够利用 .NET Framework的丰富功能来处理复杂的数据库任务。
|
SQL PHP 数据库
20 PHP如何捕获sql错误
路老师带你深入学习PHP,掌握技术干货。本文介绍了PDO中捕获SQL错误的三种模式:默认模式、警告模式和异常模式,以及如何使用errorCode()和errorInfo()方法进行错误处理。
273 2
|
关系型数据库 MySQL 网络安全
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
|
SQL 关系型数据库 数据库
数据库空间之谜:彻底解决RDS for SQL Server的空间难题
【8月更文挑战第16天】在管理阿里云RDS for SQL Server时,合理排查与解决空间问题是确保数据库性能稳定的关键。常见问题包括数据文件增长、日志文件膨胀及索引碎片累积。利用SQL Server的动态管理视图(DMV)可有效监测文件使用情况、日志空间及索引碎片化程度。例如,使用`sp_spaceused`检查文件使用量,`sys.dm_db_log_space_usage`监控日志空间,`sys.dm_db_index_physical_stats`识别索引碎片。同时,合理的备份策略和文件组设置也有助于优化空间使用,确保数据库高效运行。
360 2
|
数据采集 关系型数据库 MySQL
大数据-业务数据采集-FlinkCDC The MySQL server is not configured to use a ROW binlog_format
大数据-业务数据采集-FlinkCDC The MySQL server is not configured to use a ROW binlog_format
146 1

热门文章

最新文章

推荐镜像

更多