开发者社区 > ModelScope模型即服务 > 正文

ModelScope的Vllm为什么报这个错?

File "/usr/local/lib/python3.10/site-packages/vllm/engine/ray_utils.py", line 112, in initialize_cluster
raise ValueError(
ValueError: The number of required GPUs exceeds the total number of available GPUs in the cluster.
ModelScope的Vllm为什么报这个错?

展开
收起
陈幕白 2024-02-26 21:35:14 603 0
2 条回答
写回答
取消 提交回答
  • 错误信息指出:“所需GPU的数量超过了集群中可用GPU的总数。”这意味着在尝试初始化分布式训练集群时,设置要求使用的GPU数量多于当前集群中实际能够分配给任务的GPU数目。要解决这个问题,你需要减少所需的GPU数量或者增加集群中可供训练任务使用的GPU资源。如果是在本地运行,检查本地系统的GPU配置;如果是云端环境,则需要调整资源配置或购买更多的GPU实例。

    2024-02-27 14:15:47
    赞同 展开评论 打赏
  • 卡的数量您检查一下。此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

    2024-02-26 22:06:19
    赞同 展开评论 打赏

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

相关电子书

更多
视觉AI能力的开放现状及ModelScope实战 立即下载
ModelScope助力语音AI模型创新与应用 立即下载
低代码开发师(初级)实战教程 立即下载