文档备案控制台

开发者社区 ModelScope模型即服务正文

ModelScope中，有10张v100的卡，其中前两张被占用，但是报错，请问咋解决？

"ModelScope中，有10张v100的卡，其中前两张被占用，我只能用后面8张卡。我写了代码# 设置 CUDA_VISIBLE_DEVICES 环境变量
os.environ['CUDA_VISIBLE_DEVICES'] = '2,3,4,5,6,7,8,9'

启动 vLLM API 服务器

server_process = subprocess.Popen([
'python', '-m', 'vllm.entrypoints.openai.api_server',
'--model', './qwen/Qwen2-72B-Instruct',
'--dtype=half',
'--tensor-parallel-size=8'
]) 但是报错，请问咋解决？ torch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 232.00 MiB. GPU 0 has a total capacty of 31.74 GiB of which 215.12 MiB is free. Including non-PyTorch memory, this process has 30.24 GiB memory in use. Process 269595 has 436.00 MiB memory in use. Process 269513 has 436.00 MiB memory in use. Process 269211 has 436.00 MiB memory in use. Of the allocated memory 29.78 GiB is allocated by PyTorch, and 13.43 MiB is reserved by PyTorch but unallocated. If reserved but unallocated memory is large try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF "

展开

收起

小小爱吃香菜 2024-07-17 08:18:02 199 版权

1 条回答

写回答

取消提交回答

为了利利

参考以下链接
https://github.com/modelscope/swift/blob/main/docs/source/LLM/VLLM%E6%8E%A8%E7%90%86%E5%8A%A0%E9%80%9F%E4%B8%8E%E9%83%A8%E7%BD%B2.md
此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-07-17 12:48:27

赞同 7 展开评论

相关问答

llamaindex整合modelscope本地模型，启动报错

544

1

0

modelscope这个报错呢怎么回事？在参数里加上encoding=utf-8，又会出现这个报错

169

1

0

modelscope-funasr执行sencevoice后报错怎么解决？

203

0

0

modelscope-funasr这个报错是什么问题？

137

1

0

modelscope里做了个简单的例子，出现报错怎么处理呀？

194

1

0

在modelscope-funasr中finetune.sh脚本，中间报错如何解决？

141

0

0

在modelscope-funasr中模型换成Whisper 会报错，不能用这个模型吗？

173

0

0

ModelScope 使用mossformer的训练代码出现如下报错，该如何解决啊？

188

1

0

ModelScope最新的CPU-docker镜像启动报错，咋解决呢？

202

1

0

在modelscope-funasr我已经安装了模块，还是报错模块没有安装是什么原因？

240

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

相关文章

大模型应用：LlamaIndex 与 LangChain 深度集成构建本地化RAG系统.25

JEB Pro v5.37 发布 - 逆向工程平台

Prompt 缓存的四种策略：从精确匹配到语义检索

不用懂代码？DeepSeek 个人网站搭建，新手0基础一看就会！

2026年阿里云OpenClaw(Clawdbot)部署简单步骤教程

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

运行qwen-image显示Reconnecting

如何下载modelscope模型？

ModelScope下载速度慢怎么解决？

在ModelScope中，下载模型时的ssl问题怎么解决？!

com/action/joingroup?code=v1是什么意思

dataset的版本问题导致与modelscope不兼容

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

问一下ModelScope AI能驱动数字人吗？

展开全部

OpenClaw（原 Clawdbot）钉钉对接保姆级教程手把手教你打造自己的 AI 助手

保姆级 OpenClaw （原 Clawdbot）飞书对接教程手把手教你搭建 AI 助手

HTTPS 原理

阿里云通义千问向全社会开放！

免费的模型API平台盘点

Qwen3-Coder-Next开源！推动小型混合模型在智能体编程上的边界

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

Seedance vs Sora vs Kling：AI 视频生成模型深度对比

目前最火的 AI 助手 Clawdbot 又又又改名了并且发布新版本

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

展开全部

还有其他疑问?