双十一线上服务调用链路追踪SkyWalking实战分析

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 【11月更文挑战第27天】随着电商行业的飞速发展,双十一购物节已成为全球最大的购物狂欢节之一。在双十一期间,电商平台需要处理海量的用户请求和订单,这对系统的稳定性和性能提出了极高的要求。为了确保系统在高并发环境下的稳定运行,对线上服务的调用链路进行追踪和分析显得尤为重要。本文将通过实战案例,详细介绍如何在双十一期间使用SkyWalking对线上服务进行调用链路追踪,并结合Seata实现分布式事务管理,从而保障系统的稳定性和性能。

序言

随着电商行业的飞速发展,双十一购物节已成为全球最大的购物狂欢节之一。在双十一期间,电商平台需要处理海量的用户请求和订单,这对系统的稳定性和性能提出了极高的要求。为了确保系统在高并发环境下的稳定运行,对线上服务的调用链路进行追踪和分析显得尤为重要。本文将通过实战案例,详细介绍如何在双十一期间使用SkyWalking对线上服务进行调用链路追踪,并结合Seata实现分布式事务管理,从而保障系统的稳定性和性能。

场景案例描述

背景介绍

某知名电商平台计划在双十一期间推出大规模促销活动,预计用户访问量和交易量将激增。为了确保系统能够应对高并发访问,平台技术团队决定引入调用链路追踪和分布式事务管理技术。具体来说,技术团队希望通过SkyWalking实现调用链路的实时监控和分析,同时利用Seata处理分布式事务,确保数据的一致性和完整性。

技术挑战

  1. 高并发处理:双十一期间,系统需要处理比平时高出数倍甚至数十倍的并发请求,这对系统的负载能力和响应速度提出了巨大挑战。
  2. 调用链路复杂:电商平台的业务逻辑通常涉及多个微服务之间的调用,调用链路复杂且难以追踪。
  3. 数据一致性:在分布式系统中,如何确保多个服务之间的数据一致性是一个关键问题。

解决业务场景思路

引入SkyWalking进行调用链路追踪

SkyWalking是一个开源的APM(应用性能监控)和可观测性分析平台,专为微服务、云原生架构和基于容器的架构设计。它提供了分布式追踪、服务网格遥测分析、度量聚合和可视化一体化的解决方案。通过SkyWalking,技术团队可以实时监控和分析系统的调用链路,快速定位性能瓶颈和故障点。

SkyWalking的核心功能

  • 分布式追踪:追踪分布式系统中的请求流,记录请求在各个组件之间的传递过程,识别性能瓶颈。
  • 性能监控:监控关键性能指标,如响应时间、吞吐量等,帮助了解系统的整体性能表现。
  • 问题排查:提供详细的跟踪信息,帮助快速定位和解决系统中的问题。
  • 可视化界面:提供丰富的图表分析功能,如拓扑图、调用链路分析、性能趋势等。

SkyWalking的架构组件

  • 探针(Agent):负责收集应用运行时的性能数据,如方法调用、服务调用、异常等。探针以非侵入的方式工作,对应用程序的性能影响非常小。
  • 平台后端(OAP):负责接收探针发送的数据,并进行数据的聚合、分析和存储。OAP支持水平扩展,可以通过增加节点来处理更多的数据。
  • 展示页面(UI):提供了一个直观的界面,用于展示监控数据和分析结果。UI支持多种图表和视图,如拓扑图、服务地图、调用链、性能指标等。
  • 存储:支持多种存储解决方案,如MySQL、ElasticSearch、H2等,以适应不同的部署需求和性能要求。

使用Seata管理分布式事务

Seata是一个开源的分布式事务解决方案,由阿里巴巴和蚂蚁金服共同研发。它提供了一种对业务代码侵入性较小的方式来处理分布式事务问题,确保多个服务间的操作可以保持原子性和一致性。

Seata的核心组件

  • TC(Transaction Coordinator):事务协调者,负责维护全局和分支事务的状态,驱动全局事务提交或回滚。
  • TM(Transaction Manager):事务管理器,定义全局事务的范围,负责开始全局事务,并在事务结束时根据业务执行的结果发起全局提交或全局回滚的请求给TC。
  • RM(Resource Manager):资源管理器,管理分支事务处理的资源,与TC交谈以注册分支事务和报告分支事务的状态,并驱动分支事务的提交或回滚。

Seata的事务模式

  • AT模式:基于数据库层面的自动补偿机制,通过拦截SQL语句并在数据库中记录回滚日志来达到分布式事务的一致性。
  • TCC模式:一种编程模型,要求业务开发人员实现Try(尝试)、Confirm(确认)和Cancel(取消)三个接口方法,以手动编写业务补偿逻辑。
  • SAGA模式:通过一系列子事务的正向和逆向操作序列来实现最终一致性。

实战步骤

1. 部署SkyWalking

首先,需要在服务器上部署SkyWalking。下载SkyWalking的压缩包并解压,然后编辑配置文件application.yml,配置存储后端(如ElasticSearch)和其他相关参数。启动SkyWalking OAP服务和Web UI服务。

yaml复制代码
# application.yml 配置文件示例
storage:
selector: ${SW_STORAGE:elasticsearch}
elasticsearch:
properties:
jdbcUrl: ${SW_JDBC_URL:"jdbc:mysql://localhost:3306/skywalking"}
dataSource.user: ${SW_DATA_SOURCE_USER:root}
dataSource.password: ${SW_DATA_SOURCE_PASSWORD:root}

启动命令:

bash复制代码
# 启动SkyWalking OAP服务
./bin/startup.sh oap
# 启动SkyWalking Web UI服务
./bin/startup.sh webapp

2. 集成SkyWalking Agent

在电商平台的各个微服务中集成SkyWalking Agent,以便收集调用链路数据。将Agent的JAR包添加到每个服务的启动参数中,并配置服务名称和Collector地址。

bash复制代码
# 启动服务时添加SkyWalking Agent参数
java -javaagent:/path/to/skywalking-agent.jar -Dskywalking.agent.service_name=YourServiceName -Dskywalking.collector.backend_service=localhost:11800 -jar your-application.jar

3. 部署Seata服务

下载并部署Seata服务,配置事务日志存储(如MySQL)和其他相关参数。启动Seata服务。

yaml复制代码
# Seata配置文件示例
store:
mode: db
db:
datasource: druid
dbType: mysql
driverClassName: com.mysql.cj.jdbc.Driver
url: jdbc:mysql://localhost:3306/seata
user: mysql
password: mysql

启动命令:

bash复制代码
# 启动Seata服务
./seata-server.sh start

4. 集成Seata客户端

在电商平台的各个微服务中集成Seata客户端,配置事务组名称和服务地址。在每个需要分布式事务支持的方法上添加@GlobalTransactional注解。

java复制代码
// 在Spring Boot应用的主类上添加注解
@EnableAutoConfiguration
@EnableTransactionManagement
@EnableGlobalTransaction
public class YourApplication {
public static void main(String[] args) {
        SpringApplication.run(YourApplication.class, args);
    }
}
// 在需要分布式事务支持的方法上添加注解
@Service
public class YourService {
@GlobalTransactional
public void yourTransactionalMethod() {
// 业务逻辑代码
    }
}

5. 监控与分析

启动电商平台服务,并通过SkyWalking Web UI监控调用链路和性能指标。在双十一期间,技术团队可以实时监控系统的调用情况和性能指标,快速定位和解决性能瓶颈和故障点。

同时,通过Seata确保分布式事务的一致性。在事务提交或回滚时,Seata会协调各个分支事务的状态,确保数据的一致性。

底层原理介绍

SkyWalking的工作原理

SkyWalking通过探针(Agent)收集应用运行时的性能数据,并将数据发送到平台后端(OAP)进行处理和存储。OAP对收集到的数据进行聚合、分析和存储,并通过展示页面(UI)提供可视化展示。

Trace与Span

  • Trace:表示一次完整的请求处理过程,从客户端发起请求到服务器返回响应结束。每个Trace有一个唯一的Trace ID来标识。
  • Span:是Trace的基本单元,代表请求在单个服务节点上的处理过程。每个Span有自己的Span ID,并且包含在特定的Trace中。

数据采集与传输

SkyWalking Agent通过字节码增强技术,拦截服务的方法调用和数据库操作等,生成Span数据。Agent将Span数据打包后发送到OAP进行处理。

数据存储与查询

OAP将处理后的数据存储到配置的存储后端中(如ElasticSearch)。用户可以通过SkyWalking UI查询和分析存储的数据,了解系统的调用链路和性能指标。

Seata的工作原理

Seata通过引入全局事务的概念,将分布式事务划分为多个局部的分支事务。Seata通过TC、TM和RM三个关键组件来协调和管理分布式事务。

全局事务与分支事务

  • 全局事务:由TM开启,并分配一个全局唯一的事务ID(XID)。
  • 分支事务:参与全局事务的局部事务,由RM管理。每个分支事务在提交或回滚时,都会向TC报告状态。

两阶段提交协议

Seata采用两阶段提交协议来确保分布式事务的一致性。

  1. 第一阶段(准备阶段)
  • TM开启全局事务,并分配XID。
  • RM注册分支事务,并记录操作日志(Undo Log和Redo Log)。
  • RM向TC报告分支事务的准备状态。
  1. 第二阶段(提交/回滚阶段)
  • TC根据所有分支事务的准备状态,决定全局事务是提交还是回滚。
  • TC通知所有RM提交或回滚分支事务。
  • RM根据TC的指令,执行提交或回滚操作,并利用Undo Log或Redo Log进行补偿。

总结

通过在双十一期间引入SkyWalking进行调用链路追踪和Seata管理分布式事务,电商平台技术团队能够实时监控和分析系统的调用链路和性能指标,快速定位和解决性能瓶颈和故障点。同时,Seata确保了分布式事务的一致性,保障了数据的完整性和可靠性。这种组合方案为电商平台在双十一期间的高并发访问和交易处理提供了有力的技术保障。

未来,随着云原生和分布式架构的普及,分布式追踪和监控技术将进一步发展。SkyWalking和Seata等开源项目将不断完善和扩展其功能,为开发者提供更加全面和高效的解决方案。同时,结合机器学习和AI算法等智能化技术,分布式监控系统将能够自动识别性能异常和故障模式,实现主动式监控和自动化运维,进一步提升系统的稳定性和可靠性。

相关实践学习
基于OpenTelemetry构建全链路追踪与监控
本实验将带领您快速上手可观测链路OpenTelemetry版,包括部署并接入多语言应用、体验TraceId自动注入至日志以实现调用链与日志的关联查询、以及切换调用链透传协议以满足全链路打通的需求。
分布式链路追踪Skywalking
Skywalking是一个基于分布式跟踪的应用程序性能监控系统,用于从服务和云原生等基础设施中收集、分析、聚合以及可视化数据,提供了一种简便的方式来清晰地观测分布式系统,具有分布式追踪、性能指标分析、应用和服务依赖分析等功能。 分布式追踪系统发展很快,种类繁多,给我们带来很大的方便。但在数据采集过程中,有时需要侵入用户代码,并且不同系统的 API 并不兼容,这就导致了如果希望切换追踪系统,往往会带来较大改动。OpenTracing为了解决不同的分布式追踪系统 API 不兼容的问题,诞生了 OpenTracing 规范。OpenTracing 是一个轻量级的标准化层,它位于应用程序/类库和追踪或日志分析程序之间。Skywalking基于OpenTracing规范开发,具有性能好,支持多语言探针,无侵入性等优势,可以帮助我们准确快速的定位到线上故障和性能瓶颈。 在本套课程中,我们将全面的讲解Skywalking相关的知识。从APM系统、分布式调用链等基础概念的学习加深对Skywalking的理解,从0开始搭建一套完整的Skywalking环境,学会对各类应用进行监控,学习Skywalking常用插件。Skywalking原理章节中,将会对Skywalking使用的agent探针技术进行深度剖析,除此之外还会对OpenTracing规范作整体上的介绍。通过对本套课程的学习,不止能学会如何使用Skywalking,还将对其底层原理和分布式架构有更深的理解。本课程由黑马程序员提供。
相关文章
|
监控 网络协议 Java
分布式链路追踪- SkyWalking使用手册
分布式链路追踪- SkyWalking使用手册
1233 0
分布式链路追踪- SkyWalking使用手册
|
6天前
|
存储 监控 数据可视化
双十一线上服务调用链路追踪SkyWalking实战分析
【11月更文挑战第27天】随着电商行业的飞速发展,双十一购物节已成为全球最大的购物狂欢节之一。在双十一期间,电商平台需要处理海量的用户请求和订单,这对系统的稳定性和性能提出了极高的要求。为了确保系统在高并发环境下的稳定运行,对线上服务的调用链路进行追踪和分析显得尤为重要。本文将通过实战案例,详细介绍如何在双十一期间使用SkyWalking对线上服务进行调用链路追踪,并结合Seata实现分布式事务管理,从而保障系统的稳定性和性能。
21 5
|
4月前
|
监控 Java 应用服务中间件
分布式链路监控系统问题之Eagleeye的traceId设计的问题如何解决
分布式链路监控系统问题之Eagleeye的traceId设计的问题如何解决
104 1
|
4月前
|
监控 Java 测试技术
分布式链路监控系统问题之Skywalking和Eagleeye在数据收集方面的问题如何解决
分布式链路监控系统问题之Skywalking和Eagleeye在数据收集方面的问题如何解决
|
4月前
|
监控 Java API
分布式链路监控系统问题之Skywalking中的witness工作的问题如何解决
分布式链路监控系统问题之Skywalking中的witness工作的问题如何解决
|
7月前
|
Java 微服务
skywalking全链路追踪
skywalking全链路追踪
|
存储 前端开发 算法
微服务线上问题排查困难?不知道问题出在哪一环?那是你还不会分布式链路追踪
微服务线上问题排查困难?不知道问题出在哪一环?那是你还不会分布式链路追踪
132 1
|
存储 消息中间件 监控
架构设计第42讲:美团 - 可视化全链路日志追踪
架构设计第42讲:美团 - 可视化全链路日志追踪
423 0
|
监控 Java BI
链路追踪Skywalking应用实战 1
链路追踪Skywalking应用实战
287 0
|
JSON 运维 监控
链路追踪Skywalking应用实战 2
链路追踪Skywalking应用实战
254 0