业务&用户体验可观测场景解读|学习笔记(一)

本文涉及的产品
可观测监控 Prometheus 版,每月50GB免费额度
可观测链路 OpenTelemetry 版,每月50GB免费额度
应用实时监控服务ARMS - 应用监控,每月50GB免费额度
简介: 介绍了业务&用户体验可观测场景解读

开发者学堂课程【业务&用户体验可观测场景解读业务&用户体验可观测场景解读】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地https://developer.aliyun.com/learning/course/942/detail/14750


业务&用户体验可观测场景解读

 

内容介绍:

一、用户体验监控的必要性

二、ARMS 在用户体验监控上产品能力介绍

三、ARMS—云拨测

四、ARMS—前端监控&APP 监控

五、客户案例分享

 

一、用户体验监控的必要性

1.用户体验监控的原因

(1)国外调研报告显示,70%用户反馈网页打开的速度影响他们在线上网站进行购物的意愿。

(2)亚马逊发现,网站加载速度每增加 100ms,销售额将减少 1%( Kohavi and Longbotham2007)。

(3)阿里巴巴速卖通—发现网站加载时间缩短 36%,订单增加 10.5%,新客转化增加 27%。

总结:用户体验将会直接影响到业务的表现,用户体验相对于应用监控或者设计监控,体验不佳直接影响业务表现。

 

2.用户体验监控价值

image.png

 

(1)量化—用户体验量化和可视化

①If You Can't Measure It,You Can’t Improve lt. 即如果你不能去量化它,那么你也不能去优化它。

②自身产品的用户体验指标、整体行业基准、竞品的体验指标。用户体验量化成具体的指标,同时会提供可视化的分析能力,帮助企业去了解到整体用户终端的用户体验水平和问题。不仅能够用自身的用户体验的指标,同时也能够通过一些用户体验监控的手段获得到整体行业的基准指标,甚至是一些竞品的体验指标。

(2)洞察—问题定位

有了量化的数据以后,可以通过用户体验监控去实现对数据的洞察能力,比如说对可用性和页面性能的问题的定位,对问题影响面的界定。具体的问题是由地域的问题还是运营商的问题或设备问题造成的。

①可用性&页面性能问题定位

②影响面分析,用户&地域&设备

(3)优化—降低 MTTR

最后具备洞察的结论后,再用 ARMS 用户体验监控工具,也会对一些体验问题提供优化建议,帮助针对性的修复问题。另外一个用户体验监控,由于它是在用户端的一种监控手段,它可以帮助更快的去发现问题,减少业务的影响,同时降低整体故障修复的时间。

①提前发现问题,减少业务影响,降低故障修复时间

②提供优化建议,帮助有针对性的修复体验问题

 

二、ARMS 在用户体验监控上产品能力介绍

1.ARMS 提供全方位的用户体验监控工具

ARMS 的用户体验监控提供了一些比较全方位的体验监控工具。从业界和用户体验来说,一般针对用户体验监控有两种手段,一种叫合成监控,即熟知的概念叫拨测,另外一种叫真实用户监控。针对于合成监控, ARMS 提供了云拨测这个产品,针对于真实用户监控, ARMS 提供的是前端监控和 APP 监控两款产品。

image.png

 

(1)云拨测。即会通过预先建设好这种不同地区、不同运营商、不同设备和不同类型的这种监测点,对目标网址进行主动式的模拟访问,获知到其可用性相关的问题、性能分析的能力,甚至是对 CDN 的质量和劫持也有一定的分析能力,同时,它还可以对竞品的体验指标进行分析。

(2)前端监控&APP 监控。在真实用户监控方面, ARMS 分为针对于外部的前端监控和 APP 监控。

①外部前端监控。可以支持针对于网站、H5 甚至是小程序,基于它们提供运营相关的一些分析,包括 PV 和 UC 的统计、页面性能相关的分析、 JS 错误的统计和诊断、 API 请求的性能分析和端到端的结合于硬件模式及年度的关联分析。

② APP 监控。其可以针对于 Ios 应用和 Android 的应用实现崩溃的分析、性能分析、远程日志纳取,以及不同设备、不同运营商、不同网络的多维分析能力。(3)合成监控和真实用户监控区别。

①从流量的角度,云拨测不是真实的流量,它是模拟用户的访问流量,前端监控和 APP 监控,它基于真实的流量来进行性能的分析。因此可知,云拨测不需要流量也能够实现对网站或 APP 进行用户体验的监控;前段监控和 APP 监控需要有真实的流量才能够实现用户体验监控。

②云拨测是主动监控,前端监控和 APP 监控是被动监控。云拨测会主动对网站或 APP 提供终端进行主动式的访问,在用户访问之前更快、更早的去发现体验或是性能相关的问题,能够在用户之前去解决和修复这些问题。前端监控和 APP 监控更多的是被动式的监控手段,其有了用户的访问和数据后才能知道相关的监控指标,从而实现对应的分析能力。

③从数据量的角度,云拨测访问的频率和次数都是事先能够设定好的、事先可控的,它的数据量相对较少;而前端监控和 APP 监控,因为它采集的是用户真实流量的数据,所以用户在网站或者 APP 上的一切交互事件都会产生对应的监控指标和监控日志。如果网站或应用的 APP 的日活比较高,它整体数据量是非常大的。总结,云拨测更多的会适用获取一些基准的体验指标,基准的体验指标是指在某个地区如果没有用户流量,可以通过云拨测对网站进行拨测,以此获取到此地区大概的整体总览性的体验指标,同时,它还可以对行业竞争对手的网站进行拨测,然后获取到行业基准的体验指标。而前端监控和 APP 监控,由于它是基于真实用户,所以其获取的都是网站或 APP 真实的体验指标,因此,它比较适合例如发发布了一个新的版本以后,能够验证一下整体的体验是否达到了预期的效果。另外,云拨测也比较适合于震荡和进行短期的需要一起关注的问题的监控。前端监控和 APP 监控,它比较适合于长期的去跟踪 APP 或是网站的性能,并识别出潜在的问题。云拨测其实能够帮助回答的是已知问题的答案,比如网站到底可不可用,但是他没办法去回答出潜在的问题,还不知道问题在哪,而这种场景比较适合于真实用户监控。总体来看,其实两者在用户体验监控的场景下,两者进行结合才能够为企业提供全方位的用户体验监控的能力。

 

三、云拨测

1.云拨测—简介

云拨测,Synthetics Test,通过部署在全球各地的监测点,尽量模拟真实用户从全球各个地区访问你的网站或 APP ,监测它们的可用性和性能。

(1)云拨测的四大优势

①全球海量监测节点:全球 IDC 城市 500+数据中心节点;全球 LastMile 500+ 城市覆盖。

②无需嵌码、非侵入式监控:无需嵌码、无需研发配合,3 分钟可完成监控配置。

③主动式监控手段:7x24 小时,分钟级监控,先于用户发现问题。

④支持多种监测模型:可用性分析、网页性能分析、劫持分析、CDN 质量监控等。

 

2.云拨测—可用性监控

image.png

 

可用性:衡量目标应用任务的成功访问率;可用性=有效监测次数/总监测次数*100%。

No.1 重要指标:可用性是对业务服务评估最重要的指标之一。想要获知任何业务系统或业务应用的用户体验之前,都必须先了解它是否可用。

对于企业监控,可用性监控是首先要解决的问题,有了可用性以后才能有访问性能、错误和异常相关的分析。对于云拨测,可以选取选取不同地区、不同运营商的监测点,然后对网站进行普通的访问,会把访问成功标志为一次有效的访问。然后通过有效的访问去处理监控次数,会得到具体的网站或者是可用率。对可用性也提供长期的总揽性的趋势分析,另外也提供下散的能力,针对于某一次拨测、某一次检测,若是可疑性问题,可以去了解到具体的这一次拨测访问的详情,以此帮助去定位到具体造成可疑性的问题。

 

3.云拨测—性能监测

(1)网页性能

①DNS 用时:域名解析时间,浏览器通过 DNS 解析服务器得到该域名服务器的 IP 地址。

②TCP 用时:本地与服务端建立 TCP 连接用时,也称 TCP 三次握手时间。

③响应用时:从发出请求到接收到服务器端响应之间的耗时。

④下载用时:从接收到响应第一个数据包开始传输数据到传输全部完成的耗时。

⑤SSL 握手用时:本地与服务端针对 SSL 加密进行身份认证的时间,也称 SSL 握手时间。

⑥BLOCK 用时:由于浏览器并发连接数限制,或 JS 执行时需要时间等待,而造成的请求阻塞时间。

(2)网络性能

①时延:一个报文或分组从网络的一端传送到另一端所需要的时间。

②DNS 查询用时:将域名解析成 IP 地址需要的时间。

(3)文件传输

①平均传输速度:数据资源的传输速率;平均传输速度=实际下载/上传字节数/传输用时。

②首包用时:衡量网络连接和服务处理的耗时; 下载:客户端发起下载请求,至接收到服务器响应的第一包之间所消耗的时间。

 

 4.云拨测—劫持取证

image.png

 

(1)DNS 劫持

DNS 服务器数据被篡改,当请求本站域名,但访问到非本站 IP 地址。

(2)流量劫持

通过 302 跳转的方法将盗取用户的点击和流量。

(3)网页元素劫持

通过非法手段将非本站请求的 URL 地址加入到被访页面中。

云拨测可以针对常见的劫持类型包括 DNS 劫持、流量劫持、网页元素劫持进行劫持分析。

 

5.云拨测—DNS&CDN 质量监控

image.png

 

(1)域名解析策略评估

对 DNS 解析策略以及各个主机节点的性能状况做实时性观测和了解。做到问题及时获悉,策略随时调整。

(2)CDN 选型

CDN 服务选型中,一切应以真实有效的数据为最终决策的关键佐证。

(3)CDN 调优

根据用户的地域覆盖,主观设定拨测节点,可以获得最标准的监测数据,达到最直观的诊断目的。

云拨测可以针对于 DNS 和 CDN 质量进行监控包括可以对 DNS 解析策略以及各个主机节点的性能状况做实时性观测和了解,可以根据检测结果对监测策略进行调整,另外,可以帮助在 CDN 选型时上,对 CDN 服务商的服务质量的评估,能够辅助选型的角色。还有一种,在采购 CDN 服务之后,可以通过云拨测持续对 CDN 质量进行监控,获取到 CDN 解析的监测到的数据来对 CDN 调度的策略进行调优。

 

6.云拨测—竞品分析

image.png

 

(1)实时对比竞争对手

依靠主动式测试的黑盒特性,测试无需对方配合,几乎所有的企业使用者都会在监测自身业务的同时,也监测行业竞争对手。

(2)客观对比

以绝对公平的标准对两个或多个业务应用发起访问,并通过既定指标做全方位客观对比。

(3)行业地位

可实时获悉自身在全行业中应用服务质量的排名,并可及时发现自身不足,迅速优化调整。知己知彼,在行业竞争中立于不败之地。

由于黑盒监控的能力进行竞品分析的场景,可以针对于整个行业里的竞争对手的网站,对他们发起主动式的拨测,可以指导我们去设定自身的网站需要优化的目标,能够让我们再竞争中处于相对比较有利的位置。

相关实践学习
通过云拨测对指定服务器进行Ping/DNS监测
本实验将通过云拨测对指定服务器进行Ping/DNS监测,评估网站服务质量和用户体验。
相关文章
|
3月前
|
数据采集 数据可视化 前端开发
深入了解埋点分析:Clklog助你优化用户体验
所谓埋点,就是通过在应用程序或网站中插入代码,针对用户行为或事件进行捕获,以收集用户的各种行为数据,比如用户点击了某个按钮、页面访问时间、功能使用频率等。 通过分析这些数据,数据产品经理或数据分析师能够深入理解用户行为,优化用户体验,并根据埋点数据改进产品功能。
深入了解埋点分析:Clklog助你优化用户体验
|
2月前
|
移动开发 监控 网络协议
每个端侧产品都需要的用户体验监控
ARMS RUM 是阿里云应用实时监控服务(ARMS)下的用户体验监控(RUM)产品,覆盖 Web/H5、各类平台小程序、Android、iOS、Flutter、ReactNative、Windows、macOS 等平台框架。接入 SDK 后会主动采集端侧页面性能、资源加载、API 调用、异常崩溃、卡顿、用户操作、系统信息等数据,还支持事件、日志、异常等数据按需自定义上报以满足业务数据分析需求,提供全面的性能分析、异常分析、产品分析、会话分析能力,帮助快速跟踪定位问题原因,提升产品用户使用体验。
198 19
|
3月前
|
存储 数据采集 前端开发
ClkLog 实践中的挑战:如何设计和实施有效的埋点指标
前端数据埋点要怎么做才能获取到有用的数据并对运营产生积极的作用,对于首次实施埋点及数据分析的工程师来说确实是个难点。网上很多文章讲的都是方法论和理论知识,真正实践的内容比较少,我们从一个案例来描述一下埋点要如何做。
ClkLog 实践中的挑战:如何设计和实施有效的埋点指标
|
3月前
|
数据可视化 数据挖掘 数据处理
开源埋点分析系统:洞察用户行为的新视角
在数字化浪潮中,了解用户行为和优化用户体验成为企业竞争力的关键。对于希望深入了解客户和推动业务增长的公司来说,埋点分析系统是不可或缺的工具。今天,我们要介绍的不仅是一个 ClkLog 埋点分析系统,而是一种全新的、开源的洞察方案,它能够帮助您捕捉每一个关键数据点,确保您的决策基于最准确的用户行为分析。
开源埋点分析系统:洞察用户行为的新视角
|
6月前
|
数据采集 Arthas 数据可视化
解密 ARMS 持续剖析:如何用一个全新视角洞察应用的性能瓶颈?
解密 ARMS 持续剖析:如何用一个全新视角洞察应用的性能瓶颈?
947 15
解密 ARMS 持续剖析:如何用一个全新视角洞察应用的性能瓶颈?
如何在业务需求中提升技术
想要提升技术能力,需要靠不断地努力,和日常的积累。但是,很多同学都会抱怨:每天都在做业务需求,没时间提升技术。的确,大部分人都会遇到这样的问题。
325 0
如何在业务需求中提升技术
|
存储 缓存 边缘计算
架构师的视角进行全链路系统性能的优化
一、前端优化 前端的优化主要有三个环节:减少请求次数、页面静态化、边缘计算 减少请求次数:减少前端脚本与后端服务的请求次数,有三种方案 (1)增加缓存控制:前端开发经常设置HTML的缓存控制头部(Cache-Control头),这样浏览器在请求同一个文件的时候,只访问本地保存的资源副本,从而加速文件的访问速度。
120 0
|
存储 缓存 运维
如何实现全链路系统问题90%精准诊断?
DevKit系统诊断工具是鲲鹏性能分析工具的子工具之一,能够针对内存、网络、存储等常见故障和异常,提供精准定位和诊断能力,帮助用户识别出源代码中的问题点,提升程序的可靠性,故障定位准确率高达90%。
222 0
如何实现全链路系统问题90%精准诊断?
|
编解码 运维 监控
业务&用户体验可观测场景解读|学习笔记(二)
快速学习业务&用户体验可观测场景解读
业务&用户体验可观测场景解读|学习笔记(二)
|
存储 运维 监控
业务全链路追踪最佳实践|学习笔记
快速学习业务全链路追踪最佳实践
业务全链路追踪最佳实践|学习笔记