开发者学堂课程【高级应用技能进阶:部署失败问题排查】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/345/detail/4033
部署失败问题排查
内容介绍:
一、概述
二、排查方式
一、概述
本节课主要讲解部署失败问题排查的相关知识,一个应用大部分情况下的问题都发生在部署应用时,大部分情况云开发平台会提供一些操作建议,如果没有提供操作建议,可以归结为以下几个问题。
一是描述和真实的服务实力不一致造成的占用资源更新时失败;
二是代码本身的问题,代码语法出现错误,或者是访问网络出现问题无法启动应用,这个可以归结为代码和环境的问题;
三有可能是阿里云平台自身不是很成熟,存在一些 bug 。下面在控制台里结合实际讲解遇到这三大类问题时如何进行处理。
二、排查方式
1.定义错误
回到已经开发的平台控制台,打开一个应用,打开 cloudID ,人为的注入一个 bug 后提交代码,属于语法错误。
进行部署的时候不了解该 bug 的存在,运行后会报出错误,操作卷显示需要确保已经提交了代码并 push 成功,这一步没有问题,已经提交代码并 push 了;
在 ID 终端里尝试打包,调试应用以排查代码编译失败的原因,进入终端后,可以利用 MVN 判断能否导包成功,此时会显示详细错误,这与本地排查的编义错误是一个道理。
如果不是定义错误,代码本身可能存有问题,可以通过能否启动应用来判断该应用是否存在问题。
应用启动是失败是因为没有配置环境参数,这是因为代码本身具有问题。
排查的第一步就是通过 cloud ID 终端里启动;第二步需要到 flow 里查看分析问题,可以了解到详细错误,点击查看日志了解详细错误,准确揭示了其为代码本身编译的错误。
2.ros资源站和真实的实例不一致造成的问题
打开ros控制台,找到该业务对应的区域,可以查看某个事件的具体失败原因及错误信息,
这个应用之所以失败是因为绑定域名失败,属于第二大类问题,即资源战与真实实力的差距造成的编译错误,可以到 ros 里分析具体原因。
3.sae 等应用在启动的时失败
可以在 sae 库分析,从 sae 库中了解到该应用是自动启动的,如果出现错误可以在日制管理里的实时日志查看应用的输出信息,了解启动失败的详细信息。如果是函数计算的问题可以在运维监控查看该函数的计算行出,了解函数计算的相关错误信息。
CS 应用同理,需要到 CS 控制台查看相关的错误,在集群里即可查看到具体的错误原因,这可能题涉及到更深层次的问题。