文档备案控制台

开发者社区 ModelScope模型即服务正文

调整了ModelScope参数，使用7张卡，每张24G，但是还是报错，怎么解决?

python -m vllm.entrypoints.openai.api_server --served-model-name Qwen2-57B-A14B-Instruct --model /modelscope_cache/hub/qwen/Qwen2-57B-A14B-Instruct --tensor-parallel-size 7 --max-model-len 10 --dtype half --gpu-memory-utilization 0.9 --speculative-max-model-len 10 调整了ModelScope参数，使用7张卡，每张24G，但是还是报错，怎么解决? ：torch.cuda.DeferredCudaCallError: CUDA call failed lazily at initialization with error: device >= 0 && device < num_gpus INTERNAL ASSERT FAILED at "/torch/pytorch/aten/src/ATen/cuda/CUDAContext.cpp":50, please report a bug to PyTorch. device=, num_gpus=

展开

收起

小小爱吃香菜 2024-07-24 08:25:13 349 版权

1 条回答

写回答

取消提交回答

为了利利

试下qwen/Qwen2-72B-Instruct这个模型。可以先测单卡再测多卡。此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-07-24 16:32:15

赞同展开评论

相关问答

obsidian插件Smart Composer添加modelscope的API后，执行报错

361

0

0

modelscope这个报错呢怎么回事？在参数里加上encoding=utf-8，又会出现这个报错

279

1

0

在安装modelscope[nlp]的时候遇到报错怎么解决？

299

1

0

modelscope-funasr20ms的情况下vad参数是如何设置的？

297

0

0

modelscope-funasr设置这个单位长度是什么参数？

521

1

0

在modelscope-funasr中推理的输出结果准确率要比直接推理的低，是参数有问题吗？

338

1

0

在modelscope-funasr中模型推理有报错，这个要怎么改？

241

0

0

按照Q5操作了，然后运行本地模型报错，请问ModelScope是少了什么步骤吗？

233

1

0

自定义数据集路径有问题是ModelScope的启动参数不对吗？

188

1

0

ModelScope启动成功了，网页也能访问，但就是每次启动报错，怎么解决？

253

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

相关文章

阿里云日志服务SLS Python SDK实战——日志采集、查询与分析

全局变量不“全局”？Python多进程这口黑锅背得冤

阿里云Qwen3.7-Max接入百炼大模型服务流程：API 调用、Token Plan订阅两种接入方式流程参考

RPA OCR 文字识别实战：本地离线识别、发票 / 合同多模态信息提取

构建高可用大模型应用架构：大模型服务进程保活 + 全自动故障自愈实践.163

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

com/action/joingroup?code=v1是什么意思

ModelScope镜像地址是什么？

ModelScope下载速度慢怎么解决？

modelscope-funasr的onnxruntime c++只能使用onnx结尾的模型吗？

cuda 是11.3，ModelScope的mmcv怎么安装？

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

ModelScope这个免费额度可以在哪里查询啊？

我是一个小白，本机部署adaseq，vscode找不到modelscope的module

IndexTTS 部署报错：No module named 'tn'

展开全部

中企投资印度新能源“有戏”吗？

高效部署通义万相Wan2.1：ComfyUI文生/图生视频实战，工作流直取！

2026 最新Stable Diffusion 本地部署教程下载安装使用详细图解（含官网安装包）

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

docker安装部署FunASR

HTTPS 原理

DeepSeek-V4开源：百万上下文，Agent能力比肩顶级闭源模型

Seedance vs Sora vs Kling：AI 视频生成模型深度对比

展开全部

还有其他疑问?