开发者社区 > ModelScope模型即服务 > 自然语言处理 > 正文

在modelscope-funasr我用这个命令运行起了两个进程,但是还是都加载在卡4上,怎么回事?

在modelscope-funasr我用这个命令运行起了两个进程,但是还是都加载在卡4上,怎么回事?CUDA_VISIBLE_DEVICES=4,5 torchrun --nproc_per_node 2 finetune.py

展开
收起
三分钟热度的鱼 2024-03-27 17:09:23 51 0
2 条回答
写回答
取消 提交回答
  • 当您使用CUDA_VISIBLE_DEVICES=4,5 torchrun --nproc_per_node 2 finetune.py命令在ModelScope-FunASR中运行两个进程时,如果两个进程仍然都加载在同一个GPU(卡4)上,可能是由于以下原因:

    1. 环境变量设置问题:确保您正确设置了CUDA_VISIBLE_DEVICES环境变量。该变量用于指定可见的GPU设备,格式应为CUDA_VISIBLE_DEVICES=设备编号1,设备编号2。在您的情况下,应该设置为CUDA_VISIBLE_DEVICES=4,5

    2. 代码中的GPU分配:检查您的代码(如finetune.py)中是否存在其他GPU分配相关的设置。有些代码可能会忽略环境变量的设置,而使用特定的逻辑来分配GPU。

    3. PyTorch版本问题:某些版本的PyTorch可能存在与环境变量相关的问题。确保您使用的PyTorch版本与环境变量的设置兼容。

    4. 系统配置问题:检查您的系统配置,确保没有其他软件或服务占用了GPU资源。这可能导致GPU无法正常分配给指定的进程。

    综上所述,为了解决这个问题,您可以从上述几个方面进行排查和调整。如果问题仍然存在,建议查阅相关文档、论坛或寻求技术支持以获取更详细的帮助。

    2024-03-28 22:11:53
    赞同 展开评论 打赏
  • 参考训练文档https://github.com/alibaba-damo-academy/FunASR/blob/main/docs/tutorial/README_zh.md
    此回答整理自钉群“modelscope-funasr社区交流”

    2024-03-27 18:59:45
    赞同 展开评论 打赏

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

相关电子书

更多
视觉AI能力的开放现状及ModelScope实战 立即下载
ModelScope助力语音AI模型创新与应用 立即下载
服务上云加速大家居产业C2M进程 立即下载

相关实验场景

更多