ModelScope运行容器docker run -it registry.cn-beijing.aliyuncs.com/modelscope-repo/modelscope:ubuntu20.04-cuda11.8.0-py38-torch2.0.1-tf2.13.0-1.9.3 /bin/bash,没问题,我想挂载GPU 加了参数--gpus all 就报错了?
说的都是错的 这个Unknown报错是因为库的名字的问题,正解再这里https://zhuanlan.zhihu.com/p/641458849拉到后面看so文件的操作就行了
尝试一下方法:
这个问题很可能是由于您在运行 Docker 容器时缺少必要的 NVIDIA 显卡驱动程序而导致的。因为 --gpus 参数是用来指定要使用的显卡数量,并且需要正确的驱动程序才能正常工作。
为了解决这个问题,您可以尝试以下操作:
从你提供的错误信息来看,问题可能是由于Docker没有正确的权限访问GPU设备。以下是一些可能的解决方案:
检查GPU驱动:确保你的GPU驱动是最新的,并且已经正确安装。你可以使用nvidia-smi命令来检查。
检查CUDA和cuDNN:确保你的CUDA和cuDNN版本与你的PyTorch和TensorFlow版本兼容。你可以查阅PyTorch和TensorFlow的官方文档,了解具体的兼容性信息。
检查Docker权限:确保Docker有权限访问GPU设备。你可以使用以下命令来检查:
nvidia-smi -L
如果Docker没有被添加到nvidia-smi的组中,你需要手动添加。你可以参考NVIDIA的官方文档,了解如何操作。
nvidia-smi -q
如果Docker没有正确分配GPU资源,你需要在Dockerfile中重新配置。
您参考一下这条命令,以前跑成功的。
docker run --gpus all -p 8000:8000 -it -d --name ms registry.cn-hangzhou.aliyuncs.com/modelscope-repo/modelscope:ubuntu20.04-cuda11.8.0-py38-torch2.0.1-tf2.13.0-1.9.3 /bin/bash,此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”