备案控制台

开发者社区 > ModelScope模型即服务 > 正文

ModelScope模型文件中会包含qwen1.5-7b-chat 本身的么？

使用qwen1.5-7b-chat 训练，采用lora 训练的ModelScope模型文件中会包含qwen1.5-7b-chat 本身的么？

展开

收起

小小爱吃香菜 2024-03-26 21:18:31 77 0

2 条回答

写回答

取消提交回答

请看我回答~

阿里云大降价~

ModelScope模型文件中会包含qwen1.5-7b-chat本身的信息，同时使用LoRa训练的ModelScope模型文件中也会包含qwen1.5-7b-chat的信息。

ModelScope提供的模型文件是基于特定的预训练模型构建的，对于qwen1.5-7b-chat而言，它是基于Qwen-7B模型系列的一个特定版本，这个版本通过额外的对齐机制微调以更好地符合人类意图。因此，当你下载或使用qwen1.5-7b-chat的模型文件时，实际上是在使用一个包含了原始Qwen-7B模型预训练信息和后续微调信息的集成模型。

在采用LoRa进行微调的情况下，你得到的模型将会包含两个主要部分：原始的qwen1.5-7b-chat模型和一个负责微调新任务的LoRa层。LoRa（Low-Rank Adaptation）是一种高效的模型微调技术，它通过添加少量的、低秩的参数来适应特定任务，而不是微调整个模型。这意味着在模型文件中，原始的qwen1.5-7b-chat模型的参数保持不变，而LoRa层则包含了由微调过程引入的新信息。

总的来说，无论是直接使用qwen1.5-7b-chat模型还是基于LoRa进行进一步的微调，最终的模型文件都会保留qwen1.5-7b-chat模型的基本信息，同时附加上为了特定任务而引入的额外信息。这种结合预训练和微调的方法使得模型能够更好地适应各种应用场景。

2024-03-27 08:50:05

赞同 1 展开评论打赏
为了利利

不会，可以训练后merge lora。此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-03-26 22:00:00

赞同展开评论打赏

相关问答

modelscope-funasr 可以输入音频吗而不是文件？

42

1

0

在modelscope-funasr该怎么更新token.json与seg_dic等文件呢？

33

0

0

modelscope-funasr的长文件会分多次返回结果吗？

30

0

0

ModelScope的llama3.1模型训练XML格式的OpenDrive文件效果不理想，怎么办？

21

0

0

modelscope模型文件都下载成功了，部署报错，是不是说只能在GPU下运行，CPU不行吗？

90

1

0

modelscope的文件读取过程中出现了错误，可能文件的编码格式不是 UTF-8，怎么解决？

26

0

0

modelscope-funasr离线版和实时版有什么区别呀？我看都支持文件和实时语音呀？

52

1

0

ModelScope中，按照红框中的文件夹方式组织，也是一定需要CSV文件吗？

33

1

0

terminal 太难了，有其他ModelScope路径找到目录吗，拖拽替换文件？

25

1

0

ModelScope中，想把阿里云服务器里的dsw实例里的checkpoint文件导出应该怎么操作？

42

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

热门讨论

热门文章

通义千问2.5-7B-Instruct已经下载到本地为什么使还需要联网？而且最近下载模型也提示400

modelscope下载的模型如何转ollama

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

ModelScope中，模型下载默认路径在哪个路径？

CUDA error: CUDA-capable device(s) is busy

modelscope-funasr的FunClip怎么安装的？

ModelScope有部署qwen2-72b的么，正常推理需要多大的显存？

com/action/joingroup?code=v1是什么意思

无法导入 modelscope，已经pip install了

“锦书 - 创新艺术字”模型，运行报错。Error Connection errored out.

展开全部

阿里云通义千问向全社会开放！

multi-agent：多角色Agent协同合作，高效完成复杂任务

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

自然语言处理Transformer模型最详细讲解（图解版）

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

通义千问72B、1.8B、Audio模型开源！魔搭社区最佳实践来啦！

ConsisID：北大联合鹏城实验室等机构推出的文本到视频生成模型

vanna+qwen实现私有模型的SQL转换

ModelScope一键部署模型：新手村实操FAQ篇

【机器学习】集成学习——Stacking模型融合（理论+图解）

展开全部

相关课程

更多

个性化语音合成模型微调

255

1

去学习

ModelScope社区Library技术架构介绍

227

1

去学习

相关电子书

更多

视觉AI能力的开放现状及ModelScope实战 立即下载

ModelScope助力语音AI模型创新与应用 立即下载

低代码开发师（初级）实战教程 立即下载