开发者社区 > 弹性计算 > 云服务器ECS > 正文

云环境奇东Stable Diffusion服务失败

已解决

按照部署Stable Diffusion玩转AI绘画 的实验手册,安装stable diffusion服务

执行到命令:
python launch.py --listen --skip-torch-cuda-test

显示报错

RuntimeError: The NVIDIA driver on your system is too old (found version 11040). Please update your GPU driver by downloading and installing a new version from the URL: http://www.nvidia.com/Download/index.aspx Alternatively, go to: https://pytorch.org to install a PyTorch version that has been compiled with your version of the CUDA driver.

这里应该是ECS实例中的gpu driver版本不够导致的,但是没有很方便的方式去更新实例上的gpu驱动。需要实验室提供驱动下载,或者升级实验室ecs中的nvidia驱动、cuda的版本

展开
收起
iq75 2023-11-09 17:21:48 300 0
5 条回答
写回答
取消 提交回答
  • 推荐回答

    这个错误消息表示您的NVIDIA驱动程序版本过旧(找到版本11040)。您需要通过从URL:http://www.nvidia.com/Download/index.aspx 下载并安装新版本来更新GPU驱动程序。或者,转到:https://pytorch.org 安装与CUDA驱动程序版本匹配的PyTorch版本。
    为了更新驱动程序,您可以尝试以下步骤:

    1. 访问NVIDIA官方网站(http://www.nvidia.com),在“支持”页面中查找适合您硬件的最新驱动程序。
    2. 下载并安装最新的驱动程序。
    3. 安装完成后,请重新启动计算机以完成更新。
    2023-11-09 21:33:54
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    您在尝试运行 Stable Diffusion 服务时遇到了一个错误,提示 NVIDIA 驱动版本过低。在 Amazon Web Services (AWS) 上的 Elastic Compute Service (ECS) 实例中,无法直接更新 NVIDIA 驱动版本,因为这些实例的驱动程序是预装的,并且由 AWS 管理。因此,建议您采取以下措施:

    1. 调整 ECS 实例类型:您可以选择使用更高版本的 ECS 实例,其中包含较新的 NVIDIA 驱动程序。您可以在 AWS 管理控制台中选择适当的实例类型。

    2. 使用其他计算服务:另一种解决方案是使用 AWS EC2 实例,因为 EC2 允许您选择合适的实例类型并自行安装所需的 NVIDIA 驱动程序和 CUDA 版本。这样可以确保稳定性和兼容性。

    3. 向实验室请求帮助:如果您无法自行调整或选择实例类型,建议向实验室管理员提出请求,以获取更高的 NVIDIA 驱动版本。他们可能会提供其他解决方案,例如为您分配具有更高 NVIDIA 驱动版本的 ECS 实例。

    2023-11-10 13:31:24
    赞同 展开评论 打赏
  • 这个问题是由于你的GPU驱动版本过低导致的。你可以尝试以下几种方法来解决这个问题:

    1. 更新GPU驱动:根据错误信息中的链接,前往NVIDIA官方网站下载并安装最新的GPU驱动。注意选择适合你GPU型号的驱动版本。

    2. 更新CUDA:PyTorch在编译时会使用特定的CUDA版本。如果你当前的CUDA版本过低,可能会导致问题。你可以前往PyTorch官方网站查看支持的CUDA版本,然后下载并安装最新的CUDA版本。

    3. 使用其他版本的PyTorch:如果你当前的CUDA版本无法更新,可以尝试使用其他版本的PyTorch。有些版本的PyTorch可能已经编译好了适合你的CUDA版本的版本。你可以在PyTorch官方网站的"Releases"页面找到这些版本。

    2023-11-10 09:03:09
    赞同 展开评论 打赏
  • 原因是torch版本和cuda不一致。

    1、查看python版本
    python --version

    2、确定torch版本
    这个是官网的,供参考:https://pytorch.org/get-started/previous-versions/

    Cuda 11.4官网上没有,11.3也可用,所以下载的11.3,对应的torch版本选1.12.1,

    推荐用国内镜像:https://mirror.sjtu.edu.cn/pytorch-wheels/cu113/?mirror_intel_list,本机器选的

    torch-1.12.1+cu113-cp310-cp310-linux_x86_64.whl,其中 cu113,支持cuda11.3; cp310,支持python3.10;

    3、下载
    推荐国内镜像,速度快,交大的:

    https://mirror.sjtu.edu.cn/pytorch-wheels/cu113/?mirror_intel_list
    
    wget  https://mirror.sjtu.edu.cn/pytorch-wheels/cu113/torch-1.12.1+cu113-cp310-cp310-linux_x86_64.whl
    6252820/article/details/134055851
    

    4、安装

    pip install  torch-1.12.1+cu113-cp310-cp310-linux_x86_64.whl
    
    2023-11-10 08:13:34
    赞同 2 展开评论 打赏
  • 根据报错信息,您的系统上的NVIDIA驱动版本过旧(找到的版本为11040)。请通过以下链接下载并安装新版本的GPU驱动程序:http://www.nvidia.com/Download/index.aspx。

    另外,您可以尝试访问https://pytorch.org以获取与您的CUDA驱动程序版本兼容的PyTorch版本。

    2023-11-09 21:29:49
    赞同 1 展开评论 打赏

云服务器ECS是一种安全可靠、弹性可伸缩的IaaS级云计算服务。在这里你可以获取最新的ECS产品资讯、最前沿的技术交流以及优惠活动等信息,加速自己的技术成长。

相关电子书

更多
阿里云MaxCompute百问百答 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载