《阿里云可观测最佳实践》——8.伟东云教育

本文涉及的产品
可观测监控 Prometheus 版,每月50GB免费额度
应用实时监控服务-可观测链路OpenTelemetry版,每月50GB免费额度
应用实时监控服务-应用监控,每月50GB免费额度
简介: 《阿里云可观测最佳实践》——8.伟东云教育

8 伟东云教育

  借助云拨测优化网站性能,伟东云教育提升全球用户体验


1 关于伟东云教育


作为全球知名职业培训平台服务商,伟东云教育以教育应用为核心,提供面向职业教育、K12教育、高等教育的资源、产品与服务,打造“数字化人才发展平台”。为全球25个国家及国内25个省级行政区的政府、院校、企业、机构提供相关人才培养服务,深耕家政、应急、交通运输、退役军人就业创业培训、人工智能等多个领域。弥合区域数字鸿沟,助力教育信息化建设,为推动全球教育事业均衡发展贡献力量。

image.png

作为教育行业独角兽,面对全国乃至全球不同地区ToB客户及众多Toc终端用户,如何保障终端体验与平台可用性成为关键。在服务过程中,伟东云服务团队遭遇以下问题。

Big Data &

2 业务场景 & 可观测需求介绍


在为某地建设教育信息化平台过程中,时常出现当地用户访问异常现象。为解决这一问题,伟东云服务团队针对网站性能及网络链路的各环节进行逐一排查。确认平台可用性没问题后,伟东云服务团队将关注点聚焦于网络环境。


虽最终与运营商解决上述问题,造成异常的根因是受到当地网络环境的限制,从而造成用户访问异常。但伟东云服务团队在远程测试时检查正常,导致无法更快速定位问题位置,使得故障恢复时长被拉长。面对这样的问题,如何确保全国乃至全球不同地区用户的可用性,全面掌握当地真实网络环境以及网站性能各个指标,尽可能压缩故障恢复时长,成为伟东云教育服务团队的重要痛点。


在服务西南某地某客户的过程中,伟东云服务团队收到某地区用户上报,在浏览平台网站时会跳转到非法赌博平台,存在造成用户资产损失风险。在进行远程测试及通过VPN代理进行相关测试时,伟东云服务团队也无法复现相关问题。


随着故障排查的深入,在针对上报异常的用户进行调研访谈时,伟东云服务团队发现上报异常的用户都使用了了当地某个小型网络运营商的宽带。经测试,发现确实是由于该运营商造成了劫持。


3 解决方案


虽然已有各种监控手段,但如何更加全面的进行监控去查漏补全。如何保证日常服务的稳定性与安全性,成为伟东云服务团队的重要议题。在了解上述问题之后,阿里云与伟东云服务团队进行沟通,一致认为具备全球海量监测节点以及非侵入式的「云拨测」解决问题的最佳产品。


l 重点城市城市可用性主动监控

通过配置网络监控任务,选择主要几个重点城市IDC监测点,对目标网站的重点页面进行网络连通性监控,同时配置较快的监测频率,一旦出现可用性问题,告警会及时通知出来。IDC监测点相对应LastMile监测点来说更稳定,可以减少误报的概率。


l 页面访问性能分析

网页打开速度也是伟东云教育需要重点关注点问题,对于他们的客户来说网页速度直接影响他们的客户在线教育的质量。针对网页打开速度,伟东云选择了全部主要省份城市的LastMile 监测点,并配置了浏览任务对网站首页和重点页面进行性能分析,重点会关注网络连接延时、页面请求元素的总数及CDN解析对质量,定位问题根因后会推动相关供应商或内部研发团队进行优化。


4 业务价值


借助云拨测,伟东云教育服务团队进一步完善监控体系。利用最低成本全面掌握全国乃至全球不同地区终端用户的实际访问体验情况。缩短故障恢复时长20%以上,大幅提高故障响应效率以及用户满意度。

相关文章
|
2月前
|
弹性计算 运维 监控
阿里云云服务诊断工具:合作伙伴架构师的深度洞察与优化建议
作为阿里云的合作伙伴架构师,我深入体验了其云服务诊断工具,该工具通过实时监控与历史趋势分析,自动化检查并提供详细的诊断报告,极大提升了运维效率和系统稳定性,特别在处理ECS实例资源不可用等问题时表现突出。此外,它支持预防性维护,帮助识别潜在问题,减少业务中断。尽管如此,仍建议增强诊断效能、扩大云产品覆盖范围、提供自定义诊断选项、加强教育与培训资源、集成第三方工具,以进一步提升用户体验。
710 243
|
2月前
|
存储 人工智能 运维
AI + 可观测最佳实践:让业务从“看见”到“洞察”
本文介绍了AI Ops的概念及其在提升系统运维效率、洞察力和可观测性方面的作用。主要内容分为三个部分:一是监控、观测与洞察的区别及挑战,强调了数据整合和语义对齐的重要性;二是AI与计算如何重塑可观测性,通过UModel数字图谱和多模态存储分析架构实现数据联通;三是最佳实践与未来展望,展示了阿里云AI Stack可观测解决方案的应用案例,并总结了可观测性的四个发展阶段,最终愿景是借助AI力量让每个人成为多领域的专家。
|
6月前
|
人工智能 运维 网络安全
行业云问题之全栈可观测性技术帮助企业提升运营运维效率如何解决
行业云问题之全栈可观测性技术帮助企业提升运营运维效率如何解决
31 0
|
存储 数据采集 监控
阿里云故障洞察提效 50%,全栈可观测建设有哪些技术要点
本文分享了阿里云可观测平台服务作为全球分布的超大业务系统,同时也作为服务全球企业用户的可观测平台提供方,在故障洞察提效中遇到的业务挑战,以及 6 个关键技术点和 2 个应用案例。
21592 65
阿里云故障洞察提效 50%,全栈可观测建设有哪些技术要点
|
消息中间件 运维 监控
《阿里云可观测最佳实践》——4.羽如贸易(下)
《阿里云可观测最佳实践》——4.羽如贸易(下)
159 0
《阿里云可观测最佳实践》——4.羽如贸易(下)
|
SQL 运维 资源调度
开源大数据可观测性方案实践 - 助力集群运维智能化、便捷化
在本篇文章中,我们将介绍大数据集群领域所需的可观测性,实践大数据集群可观测所需要的条件和面临的挑战,以及阿里云EMR 产品如何通过 EMR Doctor 实现大数据可观测并向用户提供相关能力。
17388 4
开源大数据可观测性方案实践 - 助力集群运维智能化、便捷化
|
运维 监控 Cloud Native
《阿里云可观测最佳实践》——4.羽如贸易(上)
《阿里云可观测最佳实践》——4.羽如贸易(上)
172 0
|
SQL 监控 数据可视化
《阿里云可观测最佳实践》——3.掌游科技(上)
《阿里云可观测最佳实践》——3.掌游科技(上)
185 0
|
存储 SQL 监控
《阿里云可观测最佳实践》——3.掌游科技(下)
《阿里云可观测最佳实践》——3.掌游科技(下)
145 0
|
编解码 人工智能 运维
《2023云原生实战案例集》——04 互联网——核桃编程 基于ARMS构建可观测体系,全方位提升用户体验
《2023云原生实战案例集》——04 互联网——核桃编程 基于ARMS构建可观测体系,全方位提升用户体验