开发者社区> 问答> 正文

神龙AI ecs.gn7-c12g1.3xlarge(sd) 我执行SD一直报错 ?

神龙AI ecs.gn7-c12g1.3xlarge(sd) 我执行SD一直报错 RuntimeError: Torch is not able to use GPU; add --skip-torch-cuda-test to COMMANDLINE_Aa5887ceb16003cb67e47b059cf72580d.png
RGS variable to disable this check

展开
收起
真的很搞笑 2023-07-30 15:03:17 139 0
3 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    以下是一些常见的SD报错及其解决方法:

    SD报错“服务创建失败”
    这种情况通常是由于您的配置或网络环境不符合SD的要求导致的。您可以检查您的配置是否满足SD的最低要求,例如是否安装了正确的版本的驱动程序和SDK,是否开启了必要的端口和服务等等。您还可以尝试更换云服务器或者调整网络环境,以解决此问题。

    SD报错“无法连接到服务器”
    这种情况通常是由于网络连接问题导致的。您可以尝试检查您的网络连接是否正常,例如是否有防火墙或代理服务器阻止了SD的访问,或者是否配置了正确的DNS服务器等等。您还可以尝试重新启动SD服务或者重新启动云服务器,以解决此问题。

    SD报错“无法找到指定的文件”或“文件损坏”
    这种情况通常是由于SD文件丢失或损坏导致的。您可以尝试重新下载SD文件并重新安装,或者尝试使用备份文件进行恢复。如果问题依然存在,您可以尝试联系神龙AI的技术支持团队,以获取更专业的帮助和支持。

    2023-07-31 22:44:02
    赞同 展开评论 打赏
  • 报错信息提示 "RuntimeError: Torch is not able to use GPU",这意味着 Torch(PyTorch)无法使用 GPU。根据错误提示,建议您在命令行中添加参数 "--skip-torch-cuda-test",以忽略 Torch 的 CUDA 测试。

    您可以尝试修改命令行执行的方式,将命令行的参数修改为:

    COMMANDLINE_ARGUMENTS --skip-torch-cuda-test
    

    如果问题仍然存在,可能有以下原因导致:

    1. 您的环境缺少适当的 GPU 驱动程序或 CUDA 工具包。请确保您已正确安装并配置了与您的 GPU 兼容的驱动程序和 CUDA 工具包。

    2. 确认您的代码和 PyTorch 版本是否与您的 GPU 相兼容。某些版本的 PyTorch 可能不适用于特定的 GPU 架构。

    3. 检查您的 ECS 实例是否配备了适当的 GPU。确认您的实例类型 gn7-c12g1.3xlarge 支持 GPU,并且您的 GPU 驱动程序已正确安装。

    如果您仍然遇到问题,我建议您参考神龙AI平台的文档、社区论坛或联系技术支持团队,以获取更专业和针对性的帮助。

    2023-07-30 21:04:16
    赞同 展开评论 打赏
  • torch应该依赖cuda11.7+,可以用https://us.download.nvidia.com/tesla/525.85.12/NVIDIA-Linux-x86_64-525.85.12.run ,然后更新下驱动,此回答整理自钉群“AIGC方案-阿里云支持群”

    2023-07-30 15:48:49
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
如何运维千台以上游戏云服务器 立即下载
网站/服务器取证 实践与挑战 立即下载
ECS计算与存储分离架构实践 立即下载