通过ECS诊断服务自助解决实例启动的问题(一)

简介: 购买实例然后启动实例是客户对新购ECS资源操作的第一步,对已经停机的实例进行启动也是客户对已有ECS资源操作的第一步。而对于阿里云系统来说,放眼全局,启动实例也是一个非常高频的、核心的操作。所以对于无论是客户还是阿里云系统都是关键的这一步,偶尔也会发生一些意外,导致实例启动失败,这里面的原因是非常复杂的。想要排查清楚实例为什么启动失败对于无论是有专业知识的客户还是非专业人员,都不是那么的容易,因为实例启动往往背后几乎牵扯了所有的实例组件,每个组件又各有各的复杂。一种专业、快速又高效的实例启动失败排查方法对于任何人都是重要的。

简介

购买实例然后启动实例是客户对新购ECS资源操作的第一步,对已经停机的实例进行启动也是客户对已有ECS资源操作的第一步。而对于阿里云系统来说,放眼全局,启动实例也是一个非常高频的、核心的操作。所以对于无论是客户还是阿里云系统都是关键的这一步,偶尔也会发生一些意外,导致实例启动失败,这里面的原因是非常复杂的。想要排查清楚实例为什么启动失败对于无论是有专业知识的客户还是非专业人员,都不是那么的容易,因为实例启动往往背后几乎牵扯了所有的实例组件,每个组件又各有各的复杂。一种专业、快速又高效的实例启动失败排查方法对于任何人都是重要的。通过“实例启动异常”的诊断,客户可以在系统诊断能力范围内尽快的搞清楚出问题的原因、问题的解决方案等信息,无疑是一大利好。


介绍

启动实例,是客户对新购ECS实例、已有停机ECS实例进行使用不可绕过的第一步,也是阿里云系统的一个高频、关键的操作。其使用方式决定了这一步是非常关键的,但这步偶尔也会发生失败,这里的失败原因是很复杂的,因为一个实例的启动,往往涉及实例操作系统、云系统的各个组件,这每个组件和系统都会有很多原因导致实例无法启动,在这样的背景下,无论是具有专业知识的客户还是不太熟悉云计算的新手面对启动失败的问题都很容易变得一筹莫展。

阿里云ECS团队推出了“实例启动异常”的诊断功能,通过这个功能,在诊断系统已有的能力范围内,可以快速诊断出实例无法启动的原因以及得到对应的解决办法。力争让问题变得容易定位且可更快速的解决。


使用方式

如下图所示,进入阿里云ECS控制台,在功能列表中选择“自助问题排查”,然后选择实例问题排查 > 实例无法连接或启动异常 > 实例启动异常诊断项,然后选择一个需要诊断的非运行中状态的实例,选择一个诊断时间段,对该ECS实例进行诊断排查。诊断主要诊断实例操作系统和云系统来进行,诊断时间段主要用来选择诊断特定时间范围内云系统的问题,而操作系统问题则是诊断当前时刻的操作系统,与选择的时间段无关。诊断的实例操作系统版本需满足诊断系统支持的版本范围。

需要注意的是,因为实例排查会对实例的操作系统进行诊断,需要对操作系统挂载修复盘(PE盘),在诊断或修复实例之后,需要用户手动将修复盘卸载掉,诊断报告的结果中会提供一键卸载的方法,否则实例会一直以修复模式启动,无法进入用户的操作系统里。

诊断报告

经过几分钟的等待后,即可看到实例的诊断结果报告。

如下图所示,报告主要分为4部分:

第一部分是修复盘说明、临时挂载的修复盘对应的root用户以及密码信息。用户可以通过该信息登录挂载了修复盘的ECS实例。还有VNC远程连接入口,ECS实例挂载修复盘的状态下,用户只能通过该入口登录ECS实例进行问题修复,Workbench、第三方远程连接工具等方式均无法直接登录该实例。卸载修复盘入口,用户在诊断完成判断不需要进行进一步修复或已经修复完成后,需要手动卸载修复盘。

第二、三部分是报告的核心内容展示部分,主要是对于诊断出的问题的描述、问题详情解读以及给出解决办法。点击解决方法链接,按照文档说明操作即可修复问题,如果还有问题也可以继续发起人工工单寻求技术支持。以图中例子来看,该实例操作系统的fstab文件配置了一个不存在的设备,导致操作系统在启动中无法识别,进而导致启动失败。点击第三部分中的参考链接,即可看到修复方法,按照步骤进行修复后即可去尝试再次启动实例。

第四部分是整体诊断的指标概览。诊断会对云系统问题和实例操作系统问题进行诊断,对于出现问题的诊断项,报告会进行标红。


在发起实例诊断的页面,也可以查看账号下过往的诊断报告历史。


诊断项介绍

目前诊断服务支持以下的诊断项:

  • 云系统
  • 库存资源不足
  • 系统问题
  • 快照镜像问题
  • 私网IP资源问题
  • 磁盘问题
  • 虚拟化问题
  • 实例操作系统
  • 磁盘使用率和Innode检查
  • fstab中的设备检查
  • fstab中的设备挂载状态检查
  • fstab文件的格式检查


后续还有更多的诊断项会陆续发布:

  • grub.cfg丢失;
  • 根目录软链丢失;
  • 分区无文件系统等等

如果您有比较急迫的其他诊断需求,也可以联系我们

工作原理

用户发起实例启动诊断后,诊断服务会分别检查云系统的各个诊断项以及实例操作系统的各个诊断项,其中实例操作系统诊断项运行之前,必须先挂载修复盘,用修复盘启动操作系统。在云系统和操作系统的各个诊断项完成后,返回整体的报告、问题详情以及问题修复建议。


已开放地域

目前实例启动异常诊断的能力已经通过ECS控制台在阿里云全球所有地域向所有用户开放。


相关实践学习
2分钟自动化部署人生模拟器
本场景将带你借助云效流水线Flow实现人生模拟器小游戏的自动化部署
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
12天前
|
弹性计算 关系型数据库 MySQL
阿里云服务器搭建网站教程:经济型e实例2核2G快速搭建网站图文教程参考
目前在阿里云的活动中,轻量应用服务器2核2G3M带宽只要68元1年,2核4G4M带宽只要298元1年。云服务器ECS经济型e实例2核2G 3M固定带宽,价格只要99元/1年,新老用户都可购买,企业用户购买2核4G5M带宽199元一年,为用户提供长期权益。这些都是个人和普通企业用户搭建网站使用较多的云服务器,本文为大家展示使用经济型e实例2核2G3M带宽快速搭建网站的相关教程,以供参考。
105 18
|
4天前
|
存储 安全 数据安全/隐私保护
阿里云服务器五代、六代、七代、八代实例简介及性能提升介绍
随着技术的不断进步,到2025年,阿里云服务器实例也经历了多代升级,从五代实例到最新的八代实例,每一代都在性能、稳定性、能效比等方面取得了显著提升。有的用户由于是初次接触阿里云服务器,所以不是很清楚阿里云服务器五代、六代、七代、八代实例有哪些,它们各自在云服务器性能上有哪些提升。本文将详细介绍阿里云服务器五代、六代、七代、八代实例的特点及性能提升,帮助用户更好地了解并选择适合自己的云服务器实例。
|
3天前
|
存储 弹性计算 应用服务中间件
阿里云轻量应用服务器出新品通用型实例了,全球26个地域可选
近日,阿里云再度发力,推出了首款全新升级的轻量应用服务器——通用型实例。这款服务器实例不仅标配了200Mbps峰值公网带宽,更在计算、存储、网络等基础资源上进行了全面优化,旨在为中小企业和开发者提供更加轻量、易用、普惠的云计算服务,满足其对于通用计算小算力的迫切需求。目前,这款新品已在全球26个地域正式上线,为全球用户提供了更加便捷、高效的上云选择。
|
5天前
|
开发者 ice
实时云渲染中的NAT转发服务支持个人电脑秒变云渲染服务器
实时云渲染技术广泛应用于XR领域,助力数千客户完成云端部署。平行云推出的转发服务解决了家庭网络动态IP问题,使个人电脑成为实时云渲染服务器,按实际使用分钟数计费,无用户访问不收费。通过配置LarkXR的代理转发Server和ICE Server,开发者可轻松实现互联网访问内网XR应用,极大提升了开发、测试和演示的便利性。
|
6天前
|
存储 弹性计算 安全
阿里云服务器经济型e实例4核16G和8核32G特惠云服务器测评参考
阿里云有两款特惠云服务器——4核16G10M带宽和4核32G10M带宽,系统盘都是100G ESSD Entry,价格分别仅需70元1个月和160元1个月。那么,这两款云服务器到底性能如何?适用于哪些场景?是否值得购买?本文将全方位深入测评这两款特惠云服务器,并为您提供详细的购买建议。
|
11天前
|
存储 人工智能 网络协议
浅聊阿里云倚天云服务器:c8y、g8y、r8y实例性能详解与活动价格参考
选择一款高性能、高性价比的云服务器对于企业而言至关重要,阿里云推出的倚天云服务器——c8y、g8y、r8y三款实例,它们基于ARM架构,采用阿里自研的倚天710处理器,并基于新一代CIPU架构,通过芯片快速路径加速手段,实现了计算、存储、网络性能的大幅提升。2025年,计算型c8y云服务器活动价格860.65元一年起,通用型g8y云服务器活动价格1187.40元一年起,内存型r8y云服务器活动价格1454.32元一年起。本文将为大家详细解析这三款实例的性能特点、应用场景以及最新的活动价格情况,帮助大家更好地了解阿里云倚天云服务器。
|
25天前
|
存储 缓存 资源调度
阿里云服务器经济型、通用算力型、计算型、通用型、内存型实例区别与选择指南
在我们通过阿里云的活动选购云服务器的时候会发现,相同配置的云服务器往往有多个不同的实例可选,而且价格差别也比较大,这会是因为不同实例规格的由于采用的处理器不同,底层架构也有所不同(例如X86 计算架构与Arm 计算架构),因此不同实例的云服务器其性能与适用场景是有所不同。本文将详细解析阿里云的经济型、通用算力型、计算型、通用型和内存型实例的性能特点及适用场景,帮助用户根据自己的业务需求做出明智的选择。
|
10天前
|
弹性计算 数据挖掘 应用服务中间件
阿里云轻量应用服务器68元与云服务器99元和199元区别及选择参考
目前阿里云有三款特惠云服务器,第一款轻量云服务器2核2G68元一年,第二款经济型云服务器2核2G3M带宽99元1年,第三款通用算力型2核4G5M带宽199元一年。有的新手用户并不是很清楚他们之间的区别,因此不知道如何选择。本文来介绍一下它们之间的区别以及选择参考。
236 87
|
20天前
|
机器学习/深度学习 人工智能 PyTorch
阿里云GPU云服务器怎么样?产品优势、应用场景介绍与最新活动价格参考
阿里云GPU云服务器怎么样?阿里云GPU结合了GPU计算力与CPU计算力,主要应用于于深度学习、科学计算、图形可视化、视频处理多种应用场景,本文为您详细介绍阿里云GPU云服务器产品优势、应用场景以及最新活动价格。
阿里云GPU云服务器怎么样?产品优势、应用场景介绍与最新活动价格参考
|
19天前
|
存储 运维 安全
阿里云弹性裸金属服务器是什么?产品规格及适用场景介绍
阿里云服务器ECS包括众多产品,其中弹性裸金属服务器(ECS Bare Metal Server)是一种可弹性伸缩的高性能计算服务,计算性能与传统物理机无差别,具有安全物理隔离的特点。分钟级的交付周期将提供给您实时的业务响应能力,助力您的核心业务飞速成长。本文为大家详细介绍弹性裸金属服务器的特点、优势以及与云服务器的对比等内容。

热门文章

最新文章