File "/usr/local/lib/python3.10/site-packages/vllm/engine/ray_utils.py", line 112, in initialize_cluster
raise ValueError(
ValueError: The number of required GPUs exceeds the total number of available GPUs in the cluster.
ModelScope的Vllm为什么报这个错?
错误信息指出:“所需GPU的数量超过了集群中可用GPU的总数。”这意味着在尝试初始化分布式训练集群时,设置要求使用的GPU数量多于当前集群中实际能够分配给任务的GPU数目。要解决这个问题,你需要减少所需的GPU数量或者增加集群中可供训练任务使用的GPU资源。如果是在本地运行,检查本地系统的GPU配置;如果是云端环境,则需要调整资源配置或购买更多的GPU实例。
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352