ModelScope运行:python -m vllm.entrypoints.openai.api_server --served-model-name Qwen2-57B-A14B-Instruct-GPTQ-Int4 --model /data/coding/model/hub/qwen/Qwen2-57B-A14B-Instruct-GPTQ-Int4
https://modelscope.cn/models/qwen/Qwen2-57B-A14B-Instruct-GPTQ-Int4/summary
报错:[rank0]: AttributeError: 'MergedColumnParallelLinear' object has no attribute 'weight'. Did you mean: 'qweight'?
cuda 12.2
vllm 0.4.3
vllm-flash-attn 2.5.8.post2
这个报错怎么解决?
您用awq量化的模型试试 https://modelscope.cn/models/qwen/Qwen2-7B-Instruct-AWQ/summary ,此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352