文档备案控制台

开发者社区 ModelScope模型即服务正文

怎么设置可以实现合并￥量化后的ModelScope模型的group_size=64呢？

Qwen1.5-14b-chat模型微调完之后，想要合并和量化为gptq-int4模型，怎么设置可以实现合并￥量化后的ModelScope模型的group_size=64呢？

展开

收起

小小爱吃香菜 2024-07-17 08:24:47 204 版权

2 条回答

写回答

取消提交回答

为了利利

swift/llm/export.py。此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-07-23 15:42:03

赞同展开评论
听风de歌

Qwen1.5-14b-chat模型微调后合并并量化为GPTQ-INT4模型，设置group_size=64，这通常涉及到模型的优化和部署配置。具体步骤通常包括模型的序列化、优化器状态的处理以及量化参数的设置。以下是一个大致的流程：

微调完成后，您需要保存模型的权重和配置，例如使用torch.save()函数保存模型状态。
使用特定的工具或库，如modelscope或paddledistil（针对PaddlePaddle框架），来进行模型的合并。
在量化过程中，设置group_size=64，这通常是在量化配置文件中指定的，比如在TensorRT的配置文件中，或者在量化库的API参数中。可参官方文档

2024-07-17 14:46:53

赞同 6 展开评论

相关问答

modelscope-funasr怎么设置使得模型可以用CUDA0以外的其他gpu？

34039

1

0

modelscope-funasr有没有配置项可以设置cpu大小？

565

13

0

modelscope-funasr这个量化模型在哪里下载？

232

0

0

modelscope-funasr这样的错误是哪里参数没设置对吗？

126

0

0

modelscope-funasr实时识别的录音片段设置好多ms效果更好呢？

212

1

0

图中 ModelScope这样设置的怎么解决？

145

0

0

modelscope设置数据集为什么就直接报错了呢？

204

1

0

ModelScope怎么设置controlnet的Control Weight？

109

1

0

modelscope-funasr怎么设置使用指定的显卡计算吗？

242

1

0

在ModelScope模型微调后立马进行模型合并，有这样的功能么？

184

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

运行qwen-image显示Reconnecting

如何下载modelscope模型？

ModelScope下载速度慢怎么解决？

com/action/joingroup?code=v1是什么意思

在ModelScope中，下载模型时的ssl问题怎么解决？!

dataset的版本问题导致与modelscope不兼容

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

问一下ModelScope AI能驱动数字人吗？

展开全部

OpenClaw（原 Clawdbot）钉钉对接保姆级教程手把手教你打造自己的 AI 助手

保姆级 OpenClaw （原 Clawdbot）飞书对接教程手把手教你搭建 AI 助手

HTTPS 原理

阿里云通义千问向全社会开放！

免费的模型API平台盘点

Qwen3-Coder-Next开源！推动小型混合模型在智能体编程上的边界

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

Seedance vs Sora vs Kling：AI 视频生成模型深度对比

目前最火的 AI 助手 Clawdbot 又又又改名了并且发布新版本

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

展开全部

还有其他疑问?