开发者社区> 问答> 正文

消息服务的云监控的【主题模型】是什么?


MNS主题模型已经接入云监控,用户可以通过云监控针对主题级别(在云监控中,一个主题为一个实例)对如下指标实现统计,以及监控,并且可以设置相应的报警。指标包括:

  • 指定时间内的消息推送次数
  • 指定时间内的消息推送成功次数
  • 指定时间内的消息推送成功率


使用场景


通过对这些指标的监控,可以在下述(不限于)场景使用:

  1. 如果用户业务稳定,比如每天都会有固定的消息推送量,那可以通过监控(设置报警)消息推送的总次数(也可以关注推送成功的次数)。如果低于某个值,可能就说明用户的业务出现异常,这种情况下可以有报警来提醒用户关注下自己的业务。

  2. 用户提供的 Endpoint(比如 HttpServer)可能会出现异常,比如 HttpServer 可能会 Crash,网络可能会出现异常等等。这种情况下会出现推送错误,此时可以通过监控(设置报警)推送成功率,当低于某个阈值时,就能够提醒用户关注接收消息的 Endpoint 是否出现了异常。


使用方法



1. 找一个需要监控的主题为例


1.1 如下图所示:进入[url=https://help.aliyun.com/document_detail/! https://mns.console.aliyun.com/]MNS控制台[/url],点击左侧“发布订阅”的标签,再选择一个需要监控的主题(比如图中的“华北2”区域的 topic-show-cloud-monitor ),可以点击订阅详情,查看其所有的订阅关系。

1.2 如下图所示:该主题下有两个订阅,分别为 valid-sub-show-cloud-monitor (有效的订阅,订阅时设置的接收消息的 Endpoint 是存在的 Queue,会100% 推送成功的)和 invalid-sub-show-cloud-monitor (无效的订阅,订阅时设置的接收消息的 Endpoint 是不存在的 Queue,所以都会推送失败),这两个订阅这样设置,是为了更好的展示云监控的数据。


2. 找到被监控主题对应的云监控实例


2.1 如下图所示,在控制台左侧的产品与服务中选择“云监控”,或者在最上方“产品与服务”中选择“云监控”,也可以直接点击[url=https://help.aliyun.com/document_detail/! https://cms.console.aliyun.com/]云监控控制台[/url]进入。然后选择中间一栏的“消息服务”,进入消息服务MNS的标签页。再在右侧选择对应的区域(本示例为“华北2”),再选择“Topic列表”标签,最好在Topic列表中选择第一步中想要监控的主题。


3. 查看监控数据


3.1 如下图所示,监控图表中有两张图:“推送次数”和“推送成功率”,分别对应消息服务的两个监控指标。可以选择时间范围,进行查看(图中选择了示例的16:00-16:40,该时段有消息推送)。小图中可以点击右上角的“警铃”设置报警规则,也可以点击最右方的图表查看大图。
  • 推送次数,即:在统计时间周期内,推送次数的总和,目前每分钟都有数据采集。
  • 推送成功率,即:在统计时间周期内,推送的成功率(推送成功次数/推送总次数)


3.2 如下图所示,点击查看推送次数的大图,其中有两条线,分别对应不同的 Subscription,此处黑色的表示 valid-sub-show-cloud-monitor,从图中可以看到,在16:36分,一共推送了24285次。

3.3 如下图所示,仍然是推送次数的大图,其中的蓝线表示 invalid-sub-show-cloud-monitor,从图中可以看到,在16:36分一共推送了190次。这190次应该都是在错误重试。重试会一定的时间间隔,所以次数比较少。

3.4 如下图所示,点击查看推送成功率的大图,图中也是两条线,也是分别对应两个不同的 Subscription。此处黑色的线表示 valid-sub-show-cloud-monitor,从图中可以看出,在16:36分,推送的成功率为100%,即所有的推送都是成功的。

3.5 如下图所示,仍然是推送成功率的大图,其中的蓝线表示 invalid-sub-show-cloud-monitor,从图中可以看到,在16:36分,推送的成功率为0%,即所有的推送都失败了。


4. 设置报警


4.1 如下图所示,点击右方“新建报警规则”,或者点击监控图表中的“警铃”图标,都可以弹出设置报警规则的弹窗。可以批量进行创建报警规则。可以点击“添加报警规则”来创建多条报警规则。图中设置了三条报警规则:
  • 报警规则一表示:每5分钟读取一次1分钟内的推送次数,如果小于1000次的情况出现1次,就会触发报警。
  • 报警规则二表示:每5分钟读取一次1分钟内的推送成功次数,如果小于800次的情况连续出现3次,就会触发报警。
  • 报警规则三表示:没5分钟读取一次1分钟内的推送成功率,如果低于80%的情况连续出现2次,就会触发报警。


4.2 报警设置完成后,点击下一步设置通知对象(云监控中的联系人),可以通过短信通知用户等等。操作方法跟云监控其他设置报警的方法一致。

展开
收起
轩墨 2017-10-24 11:41:21 2298 0
0 条回答
写回答
取消 提交回答
问答排行榜
最热
最新

相关电子书

更多
《阿里云云拨测发布》PDF 立即下载
低代码开发师(初级)实战教程 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载