如何用阿里云实行全链路数据追踪

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,内容安全 1000次 1年
对象存储 OSS,恶意文件检测 1000次 1年
简介: 阿里云采用了日志服务,帮助畅捷通构建了用户体验感知、业务安全合规、用户业务链路追踪、成本预算的使用场景,实现了对用户、业务、成本、安全等方面的全维度感知,使得运维效率提升了30%。

在日常生活中,遇到电脑卡、迟缓等问题,我们都会下意识地觉得“电脑坏了”,我们会介意每一秒的延迟带来的等待,等待的这一秒可能会让你输了这场比赛、损失一笔交易、错过一段爱情……。因此为了改善这一秒的延迟,我们会认真仔细地检查系统、硬件、网络等。也会为了这一秒的延迟,花重金来升级设备。在日常生活中,我们对于“慢”可谓是深恶痛疾,而企业又何尝不是呢?

随着互联网的以及基础设施的发展,越来越多的企业将业务搬到线上,业务数字化已经在各个行业得到广泛应用,推动各行业的业务创新,提升了用户体验和效率。在业务往数据化转型的浪潮下,企业业务就面临以下四个趋势:

  1. 体验是关键的竞争力之一:统计结果,发现1秒的延迟增加,平均会带来7%的用户流失。
  2. 创新迭代在加速::55%的应用,每周甚至是每天,都会发布更新。
  3. 基础实施与架构在革新:多数企业业务采用了新型架构,这些变化,让业务更敏捷迭代,并可支撑更加复杂的业务、提升运营效率。
  4. 运维数据的多样化:包括运维数据容量、可变性、种类都在增加,比如日志/指标/链路/审计/CMDB等。

图片 1.png

从以上四个趋势得出,如何提升用户体验,让业务快速且稳定地为用户服务,是企业在这个时代发展的关键。而“慢”,对于企业来说,就是一种故障。慢一秒可能会损失大量的用户、慢一秒可能会让服务器崩溃、慢一秒可能会被市场淘汰汰。

但更好的用户体验也意味着更高的投入,让IT设施成为企业发展中累赘是一件很不明智的事情。那企业该如何克服这类问题呢?

针对这类问题,“微服务”应运而生。传统的IT架构大多都是各种独立系统的堆砌,这些系统的问题总结来说就是扩展性差,可靠性不高,维护成本高。但使用微服务架构后,越来越多的系统被拆解成了多个微服务。企业可将大量通用功能下沉为服务,并对服务不断进行拆分,再根据不同的业务形态,快速组装出前端应用,通过服务组装和聚合的方式实现更快的开发速度,前端也能变得更轻。

但大量的微服务,使得整体运维难度也会提升,不同的微服务可能会带来不同类型的数据、大量的警告以及处理不完的故障。那么能否有简单的方式,来对大量的微服务进行管理呢?

畅捷通信息技术股份有限公司是用友旗下成员企业,致力于为小微企业提供社交化、个性化、服务化、小量化的生意管理支持。畅捷通充分利用SaaS业务与客户的高频互动的优势深挖客户的价值,从而多方面满足小微企业对云产品的需求。畅捷通提出以畅捷通T+为核心的“云+端”战略,以数智财税、数智商业为核心,以数据服务与生态服务为延展,通过Spring Cloud技术体系建立微服务应用,为用户提供定制化的服务。

图片 2png.png

但由于业务线的日益庞大、分布在各处微服务架构以及用户体量的不断攀升,畅捷通运维团队也遇到了一些瓶颈,如
-业务高增长,用户大体量,如何识别每一个用户的体验?是否能有数据支撑?

  • 业界生态都在提全链路追踪,如何实现高效利用?
  • 如何管理好分散在各个服务器中的微服务,并解决成本难题?
  • 安全要求常态化,安全合规的可观测性黑盒无从入手

畅捷通运维团队深挖日志数据使用场景,利用日志服务工具能力梅开二度,为畅捷通的业务发展提供了持续且强有力的支持,保障了业务高速发展及用户体验的良好运行。

基于上述问题,阿里云为畅捷通构建了基于日志服务的深度使用方案,协助畅捷通搭建了渤海平台。
图片 3.png

用户体验感知解决方案:
基于阿里云日志服务,收集全量的用户请求日志,以租户维度对于该层面日志进行了数据加工,提取出Apdex性能分数、请求成功率分数、错误请求分析、错误请求影响租户占比等自定义指标,帮助客户构建用户健康体系。

图片 4.png

图片 5.png

用户业务链路追踪解决方案:
基于阿里云日志服务,在用户使用侧增加了二维码上报功能,用户使用过程中遇到问题,会自动弹出二维码,用户只需将带有二维码的界面截图给问题处理人员即可,后续相关的同事只需要扫描二维码即可将用户当前环境等信息进行复现,结合建立的业务链路追踪分析模型,即可解决问题。

图片 6.png

系统管理可观测性搭建解决方案:
基于阿里云日志服务,结合各微服务和预算数据,实时可视化展分析结果,将相关的数据进行了分析提取,使得整体使用情况具备可观测性。
图片 7.png

业务安全合规解决方案:
基于阿里云日志服务,畅捷通对于好生意日志库进行了二次加工,对于商品增改操作进行实时和定时的批量检测,之后对于结果配置进行和安全模块对接,及时发现问题后,入库RDS,相应通知到人工进行后续操作,极大的降低了业务风险,提升了业务安全合规比率。
图片 8.png

阿里云采用了日志服务,帮助畅捷通构建了用户体验感知、业务安全合规、用户业务链路追踪、成本预算的使用场景,实现了对用户、业务、成本、安全等方面的全维度感知,使得运维效率提升了30%。

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
3月前
|
存储 数据采集 前端开发
ClkLog 实践中的挑战:如何设计和实施有效的埋点指标
前端数据埋点要怎么做才能获取到有用的数据并对运营产生积极的作用,对于首次实施埋点及数据分析的工程师来说确实是个难点。网上很多文章讲的都是方法论和理论知识,真正实践的内容比较少,我们从一个案例来描述一下埋点要如何做。
ClkLog 实践中的挑战:如何设计和实施有效的埋点指标
|
3月前
|
数据可视化 数据挖掘 数据处理
开源埋点分析系统:洞察用户行为的新视角
在数字化浪潮中,了解用户行为和优化用户体验成为企业竞争力的关键。对于希望深入了解客户和推动业务增长的公司来说,埋点分析系统是不可或缺的工具。今天,我们要介绍的不仅是一个 ClkLog 埋点分析系统,而是一种全新的、开源的洞察方案,它能够帮助您捕捉每一个关键数据点,确保您的决策基于最准确的用户行为分析。
开源埋点分析系统:洞察用户行为的新视角
|
4月前
|
数据采集 运维 监控
软件研发核心问题之用户行为采集容易出的问题如何解决
软件研发核心问题之用户行为采集容易出的问题如何解决
|
6月前
|
存储 机器人 区块链
量化交易策略机器人系统开发|成熟案例|详情方案
量化交易策略模型是指用数学模型和计算机程序对市场行情进行分析和预测
|
监控 算法 机器人
币安网格交易机器人策略开发部署源码规则解析
币安网格交易机器人策略开发部署源码规则解析
|
6月前
|
存储 数据采集 监控
智慧工地整体方案,实现现场各类工况数据采集、存储、分析与应用
“智慧工地整体方案”以智慧工地物联网云平台为核心,基于智慧工地物联网云平台与现场多个子系统的互联,实现现场各类工况数据采集、存储、分析与应用。通过接入智慧工地物联网云平台的多个子系统板块,根据现场管理实际需求灵活组合,实现一体化、模块化、智能化、网络化的施工现场过程全面感知、协同工作、智能分析、风险预控、知识共享、互联互通等业务,全面满足建筑施工企业精细化管理的业务需求,智能化地辅助建筑施工企业进行科学决策,促进施工企业监管水平的全面提高。
346 0
|
监控 BI 定位技术
直播程序源码开发建设:洞察全局,数据统计与分析功能
数据统计与分析功能不管是对直播程序源码平台的主播或运营者都会有极大的帮助,是了解观众需求、优化用户体验成为直播平台发展的关键功能,这也是开发搭建直播程序源码平台的必备功能之一。
直播程序源码开发建设:洞察全局,数据统计与分析功能
|
存储 缓存 前端开发
基于Otel的前端全链路追踪思考和实践
本文内容是笔者基于 GOTC 2023 全球开源技术峰会整理。前端为什么要接入链路追踪大家都应该经历过这样的事情:某一个页面或者某一个请求比较慢,前后端分别调查后数据对不上,或者很难说明差异的来源是由什么造成的,这就是单点监控带来的问题。然后是问题定位,前端作为系统的出入口,导致很多团队问题一般界线模棱两可的问题都会交给前端去定位,相信很容前端应该都经历过这样的痛苦,而作为前端也只能人肉的去分析这
5570 0
基于Otel的前端全链路追踪思考和实践
|
API Python
  SleeFi睡眠链游开发部署规则【分析】
最近出来的边睡边赚(Sleep to Earn),其实是类似gamefi概念的变体,Sleep to Earn让玩家用户透过睡觉作为玩游戏的方式,或完成游戏内任务的替代方式来赚钱。
|
存储 缓存 运维
如何实现全链路系统问题90%精准诊断?
DevKit系统诊断工具是鲲鹏性能分析工具的子工具之一,能够针对内存、网络、存储等常见故障和异常,提供精准定位和诊断能力,帮助用户识别出源代码中的问题点,提升程序的可靠性,故障定位准确率高达90%。
221 0
如何实现全链路系统问题90%精准诊断?