业务&用户体验可观测场景解读|学习笔记(一)

简介: 介绍了业务&用户体验可观测场景解读

开发者学堂课程【业务&用户体验可观测场景解读业务&用户体验可观测场景解读】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地https://developer.aliyun.com/learning/course/942/detail/14750


业务&用户体验可观测场景解读

 

内容介绍:

一、用户体验监控的必要性

二、ARMS 在用户体验监控上产品能力介绍

三、ARMS—云拨测

四、ARMS—前端监控&APP 监控

五、客户案例分享

 

一、用户体验监控的必要性

1.用户体验监控的原因

(1)国外调研报告显示,70%用户反馈网页打开的速度影响他们在线上网站进行购物的意愿。

(2)亚马逊发现,网站加载速度每增加 100ms,销售额将减少 1%( Kohavi and Longbotham2007)。

(3)阿里巴巴速卖通—发现网站加载时间缩短 36%,订单增加 10.5%,新客转化增加 27%。

总结:用户体验将会直接影响到业务的表现,用户体验相对于应用监控或者设计监控,体验不佳直接影响业务表现。

 

2.用户体验监控价值

image.png

 

(1)量化—用户体验量化和可视化

①If You Can't Measure It,You Can’t Improve lt. 即如果你不能去量化它,那么你也不能去优化它。

②自身产品的用户体验指标、整体行业基准、竞品的体验指标。用户体验量化成具体的指标,同时会提供可视化的分析能力,帮助企业去了解到整体用户终端的用户体验水平和问题。不仅能够用自身的用户体验的指标,同时也能够通过一些用户体验监控的手段获得到整体行业的基准指标,甚至是一些竞品的体验指标。

(2)洞察—问题定位

有了量化的数据以后,可以通过用户体验监控去实现对数据的洞察能力,比如说对可用性和页面性能的问题的定位,对问题影响面的界定。具体的问题是由地域的问题还是运营商的问题或设备问题造成的。

①可用性&页面性能问题定位

②影响面分析,用户&地域&设备

(3)优化—降低 MTTR

最后具备洞察的结论后,再用 ARMS 用户体验监控工具,也会对一些体验问题提供优化建议,帮助针对性的修复问题。另外一个用户体验监控,由于它是在用户端的一种监控手段,它可以帮助更快的去发现问题,减少业务的影响,同时降低整体故障修复的时间。

①提前发现问题,减少业务影响,降低故障修复时间

②提供优化建议,帮助有针对性的修复体验问题

 

二、ARMS 在用户体验监控上产品能力介绍

1.ARMS 提供全方位的用户体验监控工具

ARMS 的用户体验监控提供了一些比较全方位的体验监控工具。从业界和用户体验来说,一般针对用户体验监控有两种手段,一种叫合成监控,即熟知的概念叫拨测,另外一种叫真实用户监控。针对于合成监控, ARMS 提供了云拨测这个产品,针对于真实用户监控, ARMS 提供的是前端监控和 APP 监控两款产品。

image.png

 

(1)云拨测。即会通过预先建设好这种不同地区、不同运营商、不同设备和不同类型的这种监测点,对目标网址进行主动式的模拟访问,获知到其可用性相关的问题、性能分析的能力,甚至是对 CDN 的质量和劫持也有一定的分析能力,同时,它还可以对竞品的体验指标进行分析。

(2)前端监控&APP 监控。在真实用户监控方面, ARMS 分为针对于外部的前端监控和 APP 监控。

①外部前端监控。可以支持针对于网站、H5 甚至是小程序,基于它们提供运营相关的一些分析,包括 PV 和 UC 的统计、页面性能相关的分析、 JS 错误的统计和诊断、 API 请求的性能分析和端到端的结合于硬件模式及年度的关联分析。

② APP 监控。其可以针对于 Ios 应用和 Android 的应用实现崩溃的分析、性能分析、远程日志纳取,以及不同设备、不同运营商、不同网络的多维分析能力。(3)合成监控和真实用户监控区别。

①从流量的角度,云拨测不是真实的流量,它是模拟用户的访问流量,前端监控和 APP 监控,它基于真实的流量来进行性能的分析。因此可知,云拨测不需要流量也能够实现对网站或 APP 进行用户体验的监控;前段监控和 APP 监控需要有真实的流量才能够实现用户体验监控。

②云拨测是主动监控,前端监控和 APP 监控是被动监控。云拨测会主动对网站或 APP 提供终端进行主动式的访问,在用户访问之前更快、更早的去发现体验或是性能相关的问题,能够在用户之前去解决和修复这些问题。前端监控和 APP 监控更多的是被动式的监控手段,其有了用户的访问和数据后才能知道相关的监控指标,从而实现对应的分析能力。

③从数据量的角度,云拨测访问的频率和次数都是事先能够设定好的、事先可控的,它的数据量相对较少;而前端监控和 APP 监控,因为它采集的是用户真实流量的数据,所以用户在网站或者 APP 上的一切交互事件都会产生对应的监控指标和监控日志。如果网站或应用的 APP 的日活比较高,它整体数据量是非常大的。总结,云拨测更多的会适用获取一些基准的体验指标,基准的体验指标是指在某个地区如果没有用户流量,可以通过云拨测对网站进行拨测,以此获取到此地区大概的整体总览性的体验指标,同时,它还可以对行业竞争对手的网站进行拨测,然后获取到行业基准的体验指标。而前端监控和 APP 监控,由于它是基于真实用户,所以其获取的都是网站或 APP 真实的体验指标,因此,它比较适合例如发发布了一个新的版本以后,能够验证一下整体的体验是否达到了预期的效果。另外,云拨测也比较适合于震荡和进行短期的需要一起关注的问题的监控。前端监控和 APP 监控,它比较适合于长期的去跟踪 APP 或是网站的性能,并识别出潜在的问题。云拨测其实能够帮助回答的是已知问题的答案,比如网站到底可不可用,但是他没办法去回答出潜在的问题,还不知道问题在哪,而这种场景比较适合于真实用户监控。总体来看,其实两者在用户体验监控的场景下,两者进行结合才能够为企业提供全方位的用户体验监控的能力。

 

三、云拨测

1.云拨测—简介

云拨测,Synthetics Test,通过部署在全球各地的监测点,尽量模拟真实用户从全球各个地区访问你的网站或 APP ,监测它们的可用性和性能。

(1)云拨测的四大优势

①全球海量监测节点:全球 IDC 城市 500+数据中心节点;全球 LastMile 500+ 城市覆盖。

②无需嵌码、非侵入式监控:无需嵌码、无需研发配合,3 分钟可完成监控配置。

③主动式监控手段:7x24 小时,分钟级监控,先于用户发现问题。

④支持多种监测模型:可用性分析、网页性能分析、劫持分析、CDN 质量监控等。

 

2.云拨测—可用性监控

image.png

 

可用性:衡量目标应用任务的成功访问率;可用性=有效监测次数/总监测次数*100%。

No.1 重要指标:可用性是对业务服务评估最重要的指标之一。想要获知任何业务系统或业务应用的用户体验之前,都必须先了解它是否可用。

对于企业监控,可用性监控是首先要解决的问题,有了可用性以后才能有访问性能、错误和异常相关的分析。对于云拨测,可以选取选取不同地区、不同运营商的监测点,然后对网站进行普通的访问,会把访问成功标志为一次有效的访问。然后通过有效的访问去处理监控次数,会得到具体的网站或者是可用率。对可用性也提供长期的总揽性的趋势分析,另外也提供下散的能力,针对于某一次拨测、某一次检测,若是可疑性问题,可以去了解到具体的这一次拨测访问的详情,以此帮助去定位到具体造成可疑性的问题。

 

3.云拨测—性能监测

(1)网页性能

①DNS 用时:域名解析时间,浏览器通过 DNS 解析服务器得到该域名服务器的 IP 地址。

②TCP 用时:本地与服务端建立 TCP 连接用时,也称 TCP 三次握手时间。

③响应用时:从发出请求到接收到服务器端响应之间的耗时。

④下载用时:从接收到响应第一个数据包开始传输数据到传输全部完成的耗时。

⑤SSL 握手用时:本地与服务端针对 SSL 加密进行身份认证的时间,也称 SSL 握手时间。

⑥BLOCK 用时:由于浏览器并发连接数限制,或 JS 执行时需要时间等待,而造成的请求阻塞时间。

(2)网络性能

①时延:一个报文或分组从网络的一端传送到另一端所需要的时间。

②DNS 查询用时:将域名解析成 IP 地址需要的时间。

(3)文件传输

①平均传输速度:数据资源的传输速率;平均传输速度=实际下载/上传字节数/传输用时。

②首包用时:衡量网络连接和服务处理的耗时; 下载:客户端发起下载请求,至接收到服务器响应的第一包之间所消耗的时间。

 

 4.云拨测—劫持取证

image.png

 

(1)DNS 劫持

DNS 服务器数据被篡改,当请求本站域名,但访问到非本站 IP 地址。

(2)流量劫持

通过 302 跳转的方法将盗取用户的点击和流量。

(3)网页元素劫持

通过非法手段将非本站请求的 URL 地址加入到被访页面中。

云拨测可以针对常见的劫持类型包括 DNS 劫持、流量劫持、网页元素劫持进行劫持分析。

 

5.云拨测—DNS&CDN 质量监控

image.png

 

(1)域名解析策略评估

对 DNS 解析策略以及各个主机节点的性能状况做实时性观测和了解。做到问题及时获悉,策略随时调整。

(2)CDN 选型

CDN 服务选型中,一切应以真实有效的数据为最终决策的关键佐证。

(3)CDN 调优

根据用户的地域覆盖,主观设定拨测节点,可以获得最标准的监测数据,达到最直观的诊断目的。

云拨测可以针对于 DNS 和 CDN 质量进行监控包括可以对 DNS 解析策略以及各个主机节点的性能状况做实时性观测和了解,可以根据检测结果对监测策略进行调整,另外,可以帮助在 CDN 选型时上,对 CDN 服务商的服务质量的评估,能够辅助选型的角色。还有一种,在采购 CDN 服务之后,可以通过云拨测持续对 CDN 质量进行监控,获取到 CDN 解析的监测到的数据来对 CDN 调度的策略进行调优。

 

6.云拨测—竞品分析

image.png

 

(1)实时对比竞争对手

依靠主动式测试的黑盒特性,测试无需对方配合,几乎所有的企业使用者都会在监测自身业务的同时,也监测行业竞争对手。

(2)客观对比

以绝对公平的标准对两个或多个业务应用发起访问,并通过既定指标做全方位客观对比。

(3)行业地位

可实时获悉自身在全行业中应用服务质量的排名,并可及时发现自身不足,迅速优化调整。知己知彼,在行业竞争中立于不败之地。

由于黑盒监控的能力进行竞品分析的场景,可以针对于整个行业里的竞争对手的网站,对他们发起主动式的拨测,可以指导我们去设定自身的网站需要优化的目标,能够让我们再竞争中处于相对比较有利的位置。

相关实践学习
通过轻量消息队列(原MNS)主题HTTP订阅+ARMS实现自定义数据多渠道告警
本场景将自定义告警信息同时分发至多个通知渠道的需求,例如短信、电子邮件及钉钉群组等。通过采用轻量消息队列(原 MNS)的主题模型的HTTP订阅方式,并结合应用实时监控服务提供的自定义集成能力,使得您能够以简便的配置方式实现上述多渠道同步通知的功能。
相关文章
|
SQL 存储 监控
深入可观测底层:OpenTelemetry 链路传递核心原理
本文会系统讲解链路传递一些基本概念,同时结合案例讲解链路传递的过程。
3400 1
深入可观测底层:OpenTelemetry 链路传递核心原理
|
存储 安全 算法
3.【Elasticsearch】Elasticsearch从入门到放弃-权重及打分
【Elasticsearch】Elasticsearch从入门到放弃-权重及打分
3.【Elasticsearch】Elasticsearch从入门到放弃-权重及打分
|
算法 UED 异构计算
性能优化在嵌入式系统中的应用
性能优化在嵌入式系统中的应用
283 3
|
传感器 算法 机器人
基于 IMU 的位姿解算
解算 IMU 采样数据的过程与惯导解算技术原理有关,而提高定位精度的方法主要依赖于IMU自身精度的提高和算法改进。
2090 0
|
流计算
Flink执行原理
Flink执行原理
274 0
|
关系型数据库 MySQL 数据库
精通MySQL:数据库管理、性能优化与最佳实践
h3> 一、引言 MySQL是一个功能强大的开源关系型数据库管理系统,广泛应用于各种Web应用、企业级应用和数据分析等领域
1512 0
|
Cloud Native 测试技术 Nacos
云效AppStack+阿里云MSE实现应用服务全链路灰度
在应用开发测试验证通过后、进行生产发布前,为了降低新版本发布带来的风险,期望能够先部署到灰度环境,用小部分业务流量进行全链路灰度验证,验证通过后再全量发布生产。本文主要介绍如何通过阿里云MSE 微服务引擎和云效应用交付平台AppStack 实现灰度发布。
121923 3
|
运维 Prometheus 监控
《阿里云可观测最佳实践》——阿里云可观测产品介绍
《阿里云可观测最佳实践》——阿里云可观测产品介绍
716 0
|
存储 运维 监控
企业如何从 0 到 1 构建整套全链路追踪体系
今天,我来跟大家分享 ARMS 在全链路追踪领域的最佳实践,分享主要分为四部分。首先,是对分布式链路追踪的整体简介。其次,是对 ARMS 在分布式链路追踪领域的核心能力进行介绍。然后,介绍如何从 0 到 1 构建整套全链路追踪体系。最后,介绍一些最佳实践案例。
企业如何从 0 到 1 构建整套全链路追踪体系
|
存储 Prometheus 监控
统一观测丨使用 Prometheus 监控 Nginx Ingress 网关最佳实践
统一观测丨使用 Prometheus 监控 Nginx Ingress 网关最佳实践
统一观测丨使用 Prometheus 监控 Nginx Ingress 网关最佳实践