我是一位开发工程师,我平时工作涉及云资源的运维和管理。
我理解了健康状态和诊断的功能,当您的业务系统出现问题时,可第一时间查看账号下云资源(每个实例)「健康状态」是否正常。若正常则可快速排除阿里云云服务的异常,转而及时排查其它方面原因。您可通过「诊断」实时排查网站无法访问、ECS无法访问、错误配置、安全风险、高负载、宕机、超限、欠费等问题,并根据修复建议及时解决问题,快速恢复业务。
正如下图所示,图中显示无异常。
查看当前最新的健康状态:
登录控制台,在控制台首页-概览页面可快速查看当前是否存在健康状态异常的云资源。
查看历史的健康状态:
在控制台首页-运维管理页面,可查看健康状态概览,支持查看最新状态、今天状态以及15日以内的历史状态。
点击「查看详情」,可跳转至健康状态详情页面,查看各资源每小时的健康状态。点击资源ID可跳转至该资源控制台。
诊断的定义
诊断指对一个或多个云资源某种工作状态(配置/功能/性能/连接/安全等)的检测分析,并对异常进行详细描述并提供修复建议。
诊断的意义
通过诊断工具,用户无需掌握过多的云产品知识,根据问题现象选择对应的诊断场景即可实时发起诊断,只需1-2分钟就能完成诊断。若诊断排查到异常,诊断报告会给出详细的异常描述以及修复建议,用户根据修复建议即可解决问题,快速恢复业务。
相比逐个摸排整个系统、分析大量的日志、等待客服,用户通过诊断工具可更快定位问题和解决问题,缩短问题解决周期。同时诊断工具降低了用户的使用门槛,提升了用户体验。
多种方式发起诊断:
登录控制台,在控制台首页侧边栏可快速发起诊断(侧边栏收起时,可点击右下角展开)。
登录控制台,在控制台首页-运维监控-创建诊断可快速发起诊断。
第一步 选择诊断场景:
进入创建诊断任务页面后,首先根据问题现象选择诊断场景。支持分类筛选和关键词搜索。
注:部分诊断场景暂不支持子账号和STS账号,请以页面提示为准。部分诊断场景需要二次授权确认,请以页面提示为准。
了解已支持的全部诊断场景,请参见诊断支持场景及说明。
第二步 配置诊断参数:
根据页面提示配置诊断参数,不同诊断场景所需参数不同,请以实际页面为准。
第三步 查看诊断报告:
开始诊断后,1-2分钟即可完成诊断。诊断完成可查看全部诊断项及诊断结果,若存在异常,可查看异常详情和修复建议。根据修复建议指引完成问题修复。
诊断简单并且快速,当用户的业务系统出现问题时,通过健康状态快速判断问题排查方向,通过诊断快速排查和修复云资源使用问题,快速恢复业务。
云服务诊断展示用户保有资源的健康状态,且细分至每一个实例的每一个小时(部分资源精确到秒)。同时用户可一目了然掌握名下云资源近15天的健康状态。用户视角的健康状态可有效提升问题排查效率。