备案控制台

开发者社区 > ModelScope模型即服务 > 正文

ModelScope在使用vllm双卡启动模型时报错，这是什么原因呢？

"使用swift单卡微调了qwen1.5-14b-chat模型，然后量化为gptq-int4版本，ModelScope在使用vllm双卡启动模型时报错:
ValueError: The input size is not aligned with the quantized weight shape. This can be caused by too large tensor parallel size.

这是什么原因呢？"

展开

收起

小小爱吃香菜 2024-07-17 08:19:04 167 0

1 条回答

写回答

取消提交回答

为了利利

参考以下链接
https://github.com/vllm-project/vllm/issues/2699
此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-07-17 13:02:52

赞同 3 展开评论打赏

相关问答

想请问下ModelScope里Vllm部署了qwen1.5-32B之后，它无限输出日志怎么解决？

104

0

0

modelscope里用vllm调用千问1.5-7b流式输出，没输出完就结束了，有限制输出多少字吗?

60

1

0

.ModelScope从modelhub直接下载的模型需要通过vllm部署的时候需要在什么地方设置？

124

1

0

ModelScope训练之后不能merge-lora，也不能用vllm推理了吗？

48

1

0

ModelScope为什么能测出来vllm的速度？

36

1

0

ModelScope中，计算卡的显存是16g， vllm显所用显存也会均匀分布在各个卡上吗？

67

1

0

图中ModelScope是不是就以vllm模式部署成功了？

23

1

0

ModelScope中，尝试模型介绍页面推荐的vllm启动命令，又出现报错，怎么解决？

69

1

0

ModelScope中，为什么用vllm推理比pt多了三倍的显存？

91

1

0

ModelScope的vllm 0.5.2 还是不支持 Qwen2-7B吗？

80

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

ModelScope默认的下载位置是在哪里？

小白求助，跟着大模型微调教程做不太明白

ModelScope有部署qwen2-72b的么，正常推理需要多大的显存？

modelscope-funasr的FunClip怎么安装的？

服务器上onnxruntime-gpu 调用结束，如何释放显存

com/action/joingroup?code=v1是什么意思

无法导入 modelscope，已经pip install了

我希望通过damo-YOLO训练1500*1500的图片

展开全部

阿里云通义千问向全社会开放！

multi-agent：多角色Agent协同合作，高效完成复杂任务

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

ModelScope一键部署模型：新手村实操FAQ篇

自然语言处理Transformer模型最详细讲解（图解版）

从RMSE和MSE到更多选择：探索机器学习模型性能指标

ChatGPT中文版杀疯了,已登录AI模型市场

vanna+qwen实现私有模型的SQL转换

TripoSR开源！从单个图像快速生成 3D 对象！（附魔搭社区推理实战教程）

展开全部

相关课程

更多

个性化语音合成模型微调

252

1

去学习

ModelScope社区Library技术架构介绍

227

1

去学习

相关电子书

更多

视觉AI能力的开放现状及ModelScope实战 立即下载

ModelScope助力语音AI模型创新与应用 立即下载

低代码开发师（初级）实战教程 立即下载