开发者社区 > 云原生 > Serverless > 正文

函数计算中,部署Stable Diffusion启动失败原因?

函数计算中,部署Stable Diffusion启动失败原因

展开
收起
多麻辣哦 2024-01-03 12:41:08 652 0
3 条回答
写回答
取消 提交回答
  • 启动失败原因一:
    报错内容为 Can't run without a checkpoint. Find and place a .ckpt or .safetensors file into any of those locations. The program will exit. 或如下图所示时,此问题导致原因是由于部署完服务后未上传模型,导致的启动失败,可以参考如何用 Serverless 一键部署 Stable Diffusion中操作步骤将模型先上传再进行使用。 image.png
    启动失败原因二:
    如果您将模型上传后打开Stable Diffusion服务中没有上传的模型或同原因一启动超时,请检查上传的模型后缀是否正确,模型后缀要求为 .ckpt 结尾。在 KodBox 中下载完的模型地址后缀为 txt,您需要手动修改为 ckpt。
     
    启动失败原因三:
    如果您已正确上传模型后仍然启动失败报如下错误,请检查当前账号是否有欠费,如有欠费需充值恢复正常后使用。
    欠费原因可能由于使用Stable Diffusion服务中有用NAS服务但您并没有领取NAS试用额度,您可以在免费试用领取NAS试用额度。

    费用账单详情可以参考【为什么扣费】回答查看
    {"ErrorCode":"InvalidArgument","ErrorMessage":"Mount NFS:xxxxx-jlb79.cn-hangzhou.nas.aliyuncs.com:/fc-stable-diffusion-plus command failed with output = mount.nfs: Connection reset by peer\n, please make sure that the nas mount point address is correct and is accessible from the service VPC"}

    启动失败原因四:
    错误如下图所示,如遇此问题需要登录实例,输入 cd /mnt/auto/sd 进入/mnt/auto/sd目录后输入 ls -a ,可以看到文件列表中有一个 .kodbox-1.35.031 的隐藏目录,输入 rm -rf .kodbox-1.35.031 将其删除后重新安装应用,重新安装完成后启动kodbox后台重新设置账号密码后即可恢复正常使用。
    image.png

    启动失败原因五:

    启动报错信息:Stable diffusion model failed to load, exiting
    image.png
    检查点1:请检查模型是否正常上传,注意模型名称、模型大小、至少需上传一个基础模型,具体可参见下方截图。
    检查点2:请在上传模型后关闭kodbox页面,再启动SD应用;如果不关闭kodbox页面,可能会导致SD无法正常启动。

    此回答来自钉群阿里函数计算官网客户。

    2024-01-03 17:34:31
    赞同 展开评论 打赏
  • 应用启动失败怎么办?https://help.aliyun.com/zh/fc/use-cases/faq-about-deploying-a-stable-diffusion-application?spm=a2c4g.11186623.0.i218#li-6qy-cz1-v2h

    检查上传的模型问题
    问题现象:应用启动时,出现下面的报错信息。

    Can't run without a checkpoint. Find and place a .ckpt or .safetensors file into any of those locations. The program will exit.

    Function instance health check failed on port 7860 in 120 seconds.

    问题原因:

    未上传模型:部署完Stable Diffusion服务后,没有上传模型,导致应用启动失败。

    当应用启动时,出现以下报错信息,请先排查模型是否没有上传。

    image.png
    模型后缀错误:上传的模型后缀不是以.ckpt结尾,导致应用启动失败。

    解决方案:

    上传模型:为了避免下载模型占用大量的时间,您可以直接上传对应的模型。具体操作,请参见一键部署Stable Diffusion。

    修改模型后缀:进入KodBox页面,确认是否已成功上传模型,并检查模型后缀是否为.ckpt。从huggingface源站下载的模型后缀为.txt,需手动修改为.ckpt。

    2024-01-03 17:08:02
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在函数计算中,部署Stable Diffusion启动失败的原因可能有多种。一种常见的错误信息是"Function instance health check failed on port 7860 in 120 seconds.",这通常意味着没有找到检查点文件。

    另外,如果报错信息为"Can't run without a checkpoint. Find and place a .ckpt or .safetensors file into any of the following directories:",也表明没有上传模型或者上传的模型后缀不是以 .ckpt 结尾,导致应用启动失败。

    此外,配置错误也是可能的原因之一。请确保您在部署函数时正确配置了函数计算所需的参数,包括函数名称、运行环境、内存大小、超时时间等。同时,也要确保为函数计算服务指定了正确的角色和授权策略。

    总的来说,对于这些问题,可以通过以下解决方案进行处理:首先,上传对应的模型,并检查模型后缀是否为 .ckpt;其次,检查并修正函数计算的配置参数;最后,确认为函数计算服务指定了正确的角色和授权策略。

    2024-01-03 15:14:18
    赞同 展开评论 打赏

快速交付实现商业价值。

相关产品

  • 函数计算
  • 相关电子书

    更多
    Hologres Serverless之路:揭秘弹性计算组 立即下载
    Serverless开发平台: 让研发效能再提升 立即下载
    Serverless 引领云上研发新范式 立即下载