5.22成都workshop:4. 游戏日志采集与分析
小吴负责公司的DevOps 以及 数据团队:在服务器和用户数上升后,开发花了非常多的时间在服务器查日志问题上。在支持移动入口、网页、推广渠道后,日志的来源也变得越来越多,加剧了他的困扰。除此之外,运营团队、BI团队、运维团队等对日志提出各自需求。
可用性监控-先于客户知道您的应用挂了
任何服务都避免不了出现以下问题,你的用户访问不了你的服务或者站点,用户偶尔碰到5xx,服务响应延迟比较慢,某台应用进程挂掉,导致访问时好时坏。问题在于,你是否要等你的用户来告诉你,你的程序是问题了。
云监控最佳实践之-容器所有实例的热力图
### 背景:
从罗辑同学那里收到信息, 他们正在做一个容器服务上所有实例的各种指标的热力图。希望能够整体展示所有容器实例的负载情况。
这个需求不是个例,恰好,云监控的dashboard和容器服务监控两者结合可以满足这个需求场景。
### 具体步骤如下:
#### 使用云账号登录云监控控制台:
https://cms.console.aliyun.com/#/home/e
【新功能发布】云监控主动报警1.0发布
为了避免由于未自主设置云监控报警,造成云产品关键监控指标异常无法及时知晓,导致影响服务正常运转的情况。云监控上线了主动报警功能。
旨在不进行您无需进行任何操作,主要云产品关键指标出现严重问题时,发送报警告知问题。如果您需要更细粒度的报警管理,请在云监控进行相关报警配置。