文档备案控制台

开发者社区 ModelScope模型即服务正文

部署ModelScope默认直接填满第一个GPU，导致内存溢出，这个有解决办法吗？

qwen/Qwen-72B-Chat部署ModelScope默认直接填满第一个GPU，导致内存溢出，这个有解决办法吗？

展开

收起

小小爱吃香菜 2024-04-24 08:20:41 193 版权

1 条回答

写回答

取消提交回答

为了利利

vllm 部署的话，有个参数可以设置，--tensor_parallel_size 此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-04-24 12:19:27

赞同展开评论

相关问答

千问Qwen3 32B大模型部署需要什么配置的GPU服务器？

3080

1

0

购买阿里云服务器部署mysql数据库,建议什么配置CPU/内存比？

488

2

0

千问Qwen3 14B大模型部署最低配置GPU服务器要求？

2585

1

0

DeepSeek 70B参数部署需要多少显存的GPU服务器，如何估算？

792

1

0

Qwen3 32B,14B,8B大模型部署分别需要多少显存，GPU服务器如何选？

6755

1

0

Funasr GPU2.0.0部署推理，RTF达不到0.0008，连0.0076都达不到。

451

0

0

在GPU服务器上使用魔搭部署deepseek70b大模型时，有一个文件出现校验之类的错误？

407

0

0

在云上部署ChatGLM2-6B大模型（GPU版）这个实验，最后无法访问网址

752

2

0

modelscope-funasr服务端部署的话，推荐什么样的GPU？

386

0

0

在modelscope-funasr如果使用GPU的话这个编译需要改什么？

767

0

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

相关文章

GLM 5.2自托管完整实操指南：硬件选型、vLLM/SGLang部署与成本测算全解

从核时到词元：AI算力计量单位的

2026年最新阿里云轻量应用服务器、ECS云服务器、GPU云服务器配置价格表

开发者必读：直播APP开发中的视频美颜SDK优化技巧

构建高可用大模型应用架构：大模型服务进程保活 + 全自动故障自愈实践.163

相关解决方案

更多

一键训练模型及部署GPU共享推理服务

快速部署DeepSeek-OCR

一键部署幻兽帕鲁游戏服务器

OpenAI 重磅开源，快速部署GPT-OSS模型

极速构建持续集成与部署流程

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

com/action/joingroup?code=v1是什么意思

ModelScope镜像地址是什么？

ModelScope下载速度慢怎么解决？

modelscope-funasr的onnxruntime c++只能使用onnx结尾的模型吗？

cuda 是11.3，ModelScope的mmcv怎么安装？

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

ModelScope这个免费额度可以在哪里查询啊？

我是一个小白，本机部署adaseq，vscode找不到modelscope的module

IndexTTS 部署报错：No module named 'tn'

展开全部

中企投资印度新能源“有戏”吗？

高效部署通义万相Wan2.1：ComfyUI文生/图生视频实战，工作流直取！

2026 最新Stable Diffusion 本地部署教程下载安装使用详细图解（含官网安装包）

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

docker安装部署FunASR

HTTPS 原理

Seedance vs Sora vs Kling：AI 视频生成模型深度对比

DeepSeek-V4开源：百万上下文，Agent能力比肩顶级闭源模型

展开全部

还有其他疑问?