开发者社区 > ModelScope模型即服务 > 正文

启动实例报错问题

错误信息:
Notebook 出现异常: 0/330 nodes are available: 101 Insufficient alibabacloud.com/gpu-card-ratio, 101 Insufficient cpu, 101 Insufficient memory, 101 Insufficient nvidia.com/gpu, 11 node(s) were unschedulable, 218 node(s) didn't match Pod's node affinity/selector.

请问有谁知道是怎么回事吗?

展开
收起
游客beicavibjjqic 2024-03-17 16:11:44 45 0
1 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    这个错误信息表明在运行Notebook时出现了异常。具体来说,有330个节点中的0个可用,原因是以下原因之一:

    1. 没有足够的GPU卡比例(alibabacloud.com/gpu-card-ratio)
    2. 没有足够的CPU资源
    3. 没有足够的内存资源
    4. 没有足够的NVIDIA GPU资源
    5. 11个节点无法调度
    6. 218个节点与Pod的节点亲和性/选择器不匹配

    要解决这个问题,你可以考虑以下几点:

    1. 确保你的集群中有足够的GPU、CPU和内存资源来满足Notebook的需求。
    2. 检查节点的亲和性设置,确保它们与Pod的要求相匹配。
    3. 如果你使用的是云服务提供商,如阿里云,确保你的账户具有足够的配额来运行所需的资源。
    4. 检查集群的配置和资源限制,确保它们与你的需求相符。
    2024-03-18 14:09:53
    赞同 展开评论 打赏

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载