文档备案控制台

开发者社区 ModelScope模型即服务正文

报错的都是oom，显存爆了，不用加哪些modelscope参数？

"CUDA_VISIBLE_DEVICES=2,3,4,5 swift export \
--model_type baichuan2-7b-chat \
--model_id_or_path /workspace/model/llm/baichuan2/Baichuan2-7B-Chat \
--quant_bits 4 \
--dataset ms-bench-mini \
--quant_method awq \
--tensor_parallel_size 4 \
--gpu_memory_utilization 0.6 \
--max_model_len 1024 \
--use_flash_attn True 报错的都是oom，显存爆了，不用加哪些modelscope参数？"

展开

收起

小小爱吃香菜 2024-05-25 20:39:28 681 版权

2 条回答

写回答

取消提交回答

为了利利

"参考以下图片
推理时爆显存可以设置-tensor_parallel_size 4 \
--gpu_memory_utilization 0.6 \
--max_model_len 1024 \参数。此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”"

2024-05-29 08:41:52

赞同展开评论
算精通

北京阿里云ACE会长

减小批量大小（Batch Size）：

如果命令中可以指定批量大小，尝试减小它。较小的批量大小会减少每次迭代的显存需求。
调整--quant_n_samples和--quant_seqlen：

对于AWQ量化，减小--quant_n_samples（默认值通常是256）和--quant_seqlen（默认值通常是2048）可以减少量化过程中的显存占用。

2024-05-26 08:00:52

赞同 2 展开评论

相关问答

通过modelscope环境搭建LLama Factory使用 WebUI微调训练，访问页面报错

881

1

0

modelscope-funasr报错是什么原因？

263

1

0

ModelScope 报显存不够如下图怎么解决？

453

1

0

modelscope-funasr的paraformer推理的显存是有什么决定的，为啥会不太稳定？

432

1

0

modelscope-funasr够支持直接在automodel类使用附加vad模型的参数吗？

362

0

0

在modelscope-funasr当音频文件超过一个小时后，显存溢出怎么解决？

388

1

0

modelscope-funasr设置这个单位长度是什么参数？

521

1

0

在modelscope上git上这个语句报错，我是CPU版本，怎么回事？

260

1

0

ModelScope中生成比如几千个不同声音的tts，都的自己训练模型，可以调节参数去控制吗？

211

1

0

ModelScope有没有对各种大模型使用各种微调方法所需要显存的统计？

278

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

相关文章

2026年阿里云GPU云服务器配置价格表及性能测评

保姆级实操：阿里云GPU云服务器部署DeepSeek-V4-Pro全流程

阿里云热门云服务器解析：轻量应用服务器、云服务器ECS、GPU云服务器介绍

2026年阿里云轻量/ECS/GPU云服务器最新配置价格表

Swift循环引用与可选类型内存泄漏避坑实战案例

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

ModelScope镜像地址是什么？

ModelScope下载速度慢怎么解决？

com/action/joingroup?code=v1是什么意思

cuda 是11.3，ModelScope的mmcv怎么安装？

modelscope-funasr的onnxruntime c++只能使用onnx结尾的模型吗？

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

ModelScope这个免费额度可以在哪里查询啊？

【DCT-Net人像卡通化】生成图像颜色诡异暗青色

IndexTTS 部署报错：No module named 'tn'

展开全部

中企投资印度新能源“有戏”吗？

高效部署通义万相Wan2.1：ComfyUI文生/图生视频实战，工作流直取！

2026 最新Stable Diffusion 本地部署教程下载安装使用详细图解（含官网安装包）

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

DeepSeek-V4开源：百万上下文，Agent能力比肩顶级闭源模型

docker安装部署FunASR

Claude Code 四大定制机制完全指南：CLAUDE.md、Hooks、Skills、Subagents 怎么选怎么用

Seedance vs Sora vs Kling：AI 视频生成模型深度对比

展开全部

还有其他疑问?