开发者社区 > ModelScope模型即服务 > 计算机视觉 > 正文

ModelScope中,这里是使用多张gpu进行训练,如果想要cpu要怎么进训练?

ModelScope中,这里是使用多张gpu进行训练,如果想要cpu要怎么进训练,我把gpu_ids去掉也跑不同63e20de0d00fc8e7c43afb3a9a19e3e9.png报错信息这会复现不了,AttributeError: module 'torch._C' has no attribute '_cuda_setDevice最终报的是这个问题,因为我是cpu进行训练安装的cpu的torch

展开
收起
多麻辣哦 2023-11-01 16:39:07 145 0
3 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    如果你想使用单张或多张 CPU 进行训练,你可以在运行 ModelScope 训练脚本时指定 CPU 标志。
    对于单张 CPU 训练,你可以使用 device 参数来指定 cpu。以下是示例命令:

    python train.py --device cpu
    

    对于多张 CPU 训练,你可以使用 num_workers 参数来指定并行的数量。以下是示例命令:

    python train.py --num_workers 8
    
    2023-11-02 14:15:12
    赞同 展开评论 打赏
  • 如果你想在CPU上进行训练,你需要将模型的所有操作都转换为CPU操作。这包括所有的矩阵运算、神经网络的前向和反向传播等。

    具体来说,你需要将所有的torch.cuda.*函数替换为torch.*函数,将所有的.cuda()方法调用替换为.cpu()方法调用。

    例如,如果你有一个在GPU上定义的变量x = torch.randn(10, 10).cuda(),你需要将其转换为在CPU上定义的变量x = torch.randn(10, 10)

    同样,如果你有一个在GPU上定义的模型model = Model().cuda(),你需要将其转换为在CPU上定义的模型model = Model()

    请注意,由于CPU的计算能力远小于GPU,因此在CPU上进行训练可能需要更长的时间。此外,某些模型可能无法在CPU上有效地运行,因为这些模型依赖于GPU的并行计算能力。

    2023-11-02 10:39:50
    赞同 展开评论 打赏
  • 要不torch您也重装一下试试。刚开始准备环境稍微麻烦一些。环境变量设置了吧设置了要重启———此回答整理自钉群:魔搭ModelScope开发者联盟群 ①

    2023-11-01 20:40:15
    赞同 展开评论 打赏

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

相关电子书

更多
阿里巴巴高性能GPU架构与应用 立即下载
GPU在超大规模深度学习中的发展和应用 立即下载
RDS SQL Server CPU高使用率性能优化 立即下载