启动失败原因一:
报错内容为 Can't run without a checkpoint. Find and place a .ckpt or .safetensors file into any of those locations. The program will exit. 或如下图所示时,此问题导致原因是由于部署完服务后未上传模型,导致的启动失败,可以参考如何用 Serverless 一键部署 Stable Diffusion中操作步骤将模型先上传再进行使用。
启动失败原因二:
如果您将模型上传后打开Stable Diffusion服务中没有上传的模型或同原因一启动超时,请检查上传的模型后缀是否正确,模型后缀要求为 .ckpt 结尾。在 KodBox 中下载完的模型地址后缀为 txt,您需要手动修改为 ckpt。
启动失败原因三:
如果您已正确上传模型后仍然启动失败报如下错误,请检查当前账号是否有欠费,如有欠费需充值恢复正常后使用。
欠费原因可能由于使用Stable Diffusion服务中有用NAS服务但您并没有领取NAS试用额度,您可以在免费试用领取NAS试用额度。
费用账单详情可以参考【为什么扣费】回答查看
{"ErrorCode":"InvalidArgument","ErrorMessage":"Mount NFS:xxxxx-jlb79.cn-hangzhou.nas.aliyuncs.com:/fc-stable-diffusion-plus command failed with output = mount.nfs: Connection reset by peer\n, please make sure that the nas mount point address is correct and is accessible from the service VPC"}
启动失败原因四:
错误如下图所示,如遇此问题需要登录实例,输入 cd /mnt/auto/sd 进入/mnt/auto/sd目录后输入 ls -a ,可以看到文件列表中有一个 .kodbox-1.35.031 的隐藏目录,输入 rm -rf .kodbox-1.35.031 将其删除后重新安装应用,重新安装完成后启动kodbox后台重新设置账号密码后即可恢复正常使用。
启动失败原因五:
启动报错信息:Stable diffusion model failed to load, exiting
检查点1:请检查模型是否正常上传,注意模型名称、模型大小、至少需上传一个基础模型,具体可参见下方截图。
检查点2:请在上传模型后关闭kodbox页面,再启动SD应用;如果不关闭kodbox页面,可能会导致SD无法正常启动。
此回答来自钉群阿里函数计算官网客户。
检查上传的模型问题
问题现象:应用启动时,出现下面的报错信息。
Can't run without a checkpoint. Find and place a .ckpt or .safetensors file into any of those locations. The program will exit.
Function instance health check failed on port 7860 in 120 seconds.
问题原因:
未上传模型:部署完Stable Diffusion服务后,没有上传模型,导致应用启动失败。
当应用启动时,出现以下报错信息,请先排查模型是否没有上传。
image.png
模型后缀错误:上传的模型后缀不是以.ckpt结尾,导致应用启动失败。
解决方案:
上传模型:为了避免下载模型占用大量的时间,您可以直接上传对应的模型。具体操作,请参见一键部署Stable Diffusion。
修改模型后缀:进入KodBox页面,确认是否已成功上传模型,并检查模型后缀是否为.ckpt。从huggingface源站下载的模型后缀为.txt,需手动修改为.ckpt。
在函数计算中,部署Stable Diffusion启动失败的原因可能有多种。一种常见的错误信息是"Function instance health check failed on port 7860 in 120 seconds.",这通常意味着没有找到检查点文件。
另外,如果报错信息为"Can't run without a checkpoint. Find and place a .ckpt or .safetensors file into any of the following directories:",也表明没有上传模型或者上传的模型后缀不是以 .ckpt 结尾,导致应用启动失败。
此外,配置错误也是可能的原因之一。请确保您在部署函数时正确配置了函数计算所需的参数,包括函数名称、运行环境、内存大小、超时时间等。同时,也要确保为函数计算服务指定了正确的角色和授权策略。
总的来说,对于这些问题,可以通过以下解决方案进行处理:首先,上传对应的模型,并检查模型后缀是否为 .ckpt;其次,检查并修正函数计算的配置参数;最后,确认为函数计算服务指定了正确的角色和授权策略。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。