5分钟完成业务实时监控系统搭建,是一种什么样的体验?

简介: 道旅需要构建一个全面的指标监控系统,既包括系统的业务指标:如各类业务类型的请求数变化,不同供应商信息的变化,客户请求的明细大盘,各酒店请求量的排名变化,不同城市的订单转换率分析报表等;也包括系统的运行指标:如服务器请求响应时间, 带宽使用情况等。评估了市场上的监控产品之后,道旅选择了阿里云应用实时监控服务 ARMS。

深圳市道旅旅游科技股份有限公司(简称:道旅)是一家总部位于中国的全球酒店资源批发商。自 2012 年成立以来,道旅凭借其全球优质的直签产品和丰富的第三方产品,以及顶尖的技术实力,赢得了包括 OTA、差旅管理公司、航空公司、旅行社等超过 23,000 家客户的信赖和支持。在资源端,道旅不仅有超过 30,000+ 具有竞争力的直签酒店资源,并且拥有来自于 600+ 全球供应商的 70 万家酒店,资源覆盖了全球超过 200 个国家或地区。

道旅从未停下脚步,始终专注于为同业提供可靠的服务和有竞争力的资源,并加速在直签资源的布局,让同业伙伴的旅游生意更好做!道旅一路走过,收获喜人:

  • 2018年单日交易额突破1000万,获得深创投,国隆资本联合投资。
  • 2019年单日交易额突破1800万,荣膺2019深圳500强企业。
  • 2020年获得广东省旅行社百强第二名。

新的需求

道旅需要构建一个全面的指标监控系统,既包括系统的业务指标:如各类业务类型的请求数变化,不同供应商信息的变化,客户请求的明细大盘,各酒店请求量的排名变化,不同城市的订单转换率分析报表等;也包括系统的运行指标:如服务器请求响应时间, 带宽使用情况;

在选型上主要考虑点有:

  1. 指标监控系统的挑战主要有请求量大,集群和监控类别多。
  2. 指标监控系统需要实时性,配置简单,可以让业务部门去做定义报表。
  3. 指标监控系统构建简单,尽可能减少管理的组件数,可用性要求高,性能要求高的特点。

评估了市场上的监控产品之后,道旅选择了阿里云应用实时监控服务 ARMS。它是一个云原生一体化可观测性平台,可以提供全栈式的性能监控和端到端的全链路追踪诊断能力。

从前端、应用至底层机器,ARMS 实时监控应用服务的每一次运行、每一个慢 SQL、每一个异常。ARMS 提供了完整的数据大盘监控,展示请求量、响应时间、FullGC 次数、慢 SQL 和异常次数、应用间调用次数与耗时等重要的关键指标,时刻了解应用程序的运行状况,确保提供最优的使用体验。

image.png

相比开源使用 pinpoint 和 skywalking,阿里云 ARMS 提供了移动端、前端、后端服务主机资源监控一体化,全视角洞悉系统性能问题,企业无需自己构建,几分钟就能有一个完整的运维监控平台。对于首次构建业务监控系统的企业来说,ARMS 是首选。

道旅使用 ARMS 自定义监控支持的监控任务类型和创建流程,通过配置接入数据源、清洗日志和创建数据集三个关键步骤,快速自定义监控任务。借用 ARMS 完成流式计算服务的工作,整个方案配置简单,读写性能好,不需要维护存储,能快速生成监控数据。

image.png

通过道旅监控接口系统 Dida 获取 ARMS 产生的监控数据,并提供给 Grafana,可以方便地生成各种报表。

image.png

新的改变

道旅通过使用 ARMS,在业务监控、运维搭建、成本优化等方面效果显著。

实时业务大盘:通过 ARMS 提供的可视化数据清洗任务,创建出来的业务大盘实时性好,可以一目了然地知道业务的变化,指导公司的经营与决策。

运维搭建简单:使用 ARMS 不需要搭建流式计算系统,也不需要提供昂贵的存储,通过简单的配置就可以生成目标监控数据集,非常方便。

更优化的成本:使用 ARMS 的方式构建业务指标系统,在实时性满足的情况下,对于道旅来说,比其他方式的大数据方案更具有竞争力。

正如道旅 CTO James 在应用 ARMS 之后感叹:“凭借 ARMS,道旅 IT 人员能够在5分钟内搭建和启动基于大数据平台的业务实时监控系统,在充分发挥数据监控时效性的同时,大幅提升了 IT 人员效率!”

产品答疑:

Q:非阿里云用户是否可用?

A:可用,无论客户是公有云/专有云/ 混合云/自建IDC,无论什么云厂商,只要在公网可访问就能通过 ARMS来监控。

Q:接入ARMS是否需要修改代码?

A:不需要改动代码,加载探针即可实现监控。

Q:ARMS支持哪些监控?

A:ARMS支持Java、PHP应用监控以及用户体验监控(Web端和移动端),各种组件及业务监控(Prometheus托管)。

加入行业实战交流群

阿里云专门成立了“互联网架构升级实战课”钉钉群,每周邀请一位阿里云专家在群内进行行业最佳实践直播,每天分享行业前沿干货,欢迎钉钉扫码加入。

image.png


点击链接进ARMS官网体验: https://www.aliyun.com/product/arms?spm=a2c6h.12873639.0.0.512057a2idyJcH
相关实践学习
通过轻量消息队列(原MNS)主题HTTP订阅+ARMS实现自定义数据多渠道告警
本场景将自定义告警信息同时分发至多个通知渠道的需求,例如短信、电子邮件及钉钉群组等。通过采用轻量消息队列(原 MNS)的主题模型的HTTP订阅方式,并结合应用实时监控服务提供的自定义集成能力,使得您能够以简便的配置方式实现上述多渠道同步通知的功能。
相关文章
|
存储 数据采集 机器学习/深度学习
谷歌大数据的三驾马车
当涉及到大规模数据处理时,谷歌公司一直是领先的技术创新者,已经在大数据技术方面有着非常强的实力。下面我将详细介绍谷歌的三项重要技术:Google Bigtable,Google MapReduce和Google File System (GFS)。
3042 1
谷歌大数据的三驾马车
|
1月前
|
存储 人工智能 监控
CoPaw是什么?与OpenClaw有什么区别?
2026年个人智能体爆发,阿里云CoPaw与开源OpenClaw成焦点。前者主打“协同工作台”,支持一键部署、长期记忆与开箱即用技能,面向职场人;后者是极客向AI实验平台,强调本地优先与高度定制。二者代表便捷性与自由度的路线之争。
3353 10
|
缓存 小程序 索引
uni-app开发微信小程序时vant组件van-tabs的使用陷阱及解决方案
uni-app开发微信小程序时vant组件van-tabs的使用陷阱及解决方案
1122 1
|
弹性计算 Java Unix
阿里云服务器怎么用?使用阿里云服务器建网站详细图文教程
使用阿里云服务器建网站是很多用户上云的必经之路,其中必然会涉及到购买云服务器、注册域名、搭建网站这三个步骤,下面是这三个步骤的完整图文教程,适合新手学习。
阿里云服务器怎么用?使用阿里云服务器建网站详细图文教程
|
消息中间件 数据可视化 API
RabbitMQ 集群高可用原理及实战部署介绍(三)
在项目中想要 RabbitMQ 变得更加健壮,就要使得其变成高可用,今天我们一起来聊聊关于 RabbitMQ 集群原理和部署流程
RabbitMQ 集群高可用原理及实战部署介绍(三)
|
机器学习/深度学习 算法 数据挖掘
机器学习:感知机+代码实现(原始+对偶形式)
机器学习:感知机+代码实现(原始+对偶形式)
780 0
机器学习:感知机+代码实现(原始+对偶形式)
|
机器学习/深度学习 人工智能 算法
强化学习DQN之俄罗斯方块
强化学习DQN之俄罗斯方块
600 0
|
存储 缓存 NoSQL
解决Shiro jwt并发刷新token问题
解决Shiro jwt并发刷新token问题
824 0

热门文章

最新文章