文档备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

多卡训练得到的GPT3-2.7B模型，推理pipeline加载模型时报错size mismatch

使用官网镜像registry.cn-hangzhou.aliyuncs.com/modelscope-repo/modelscope:ubuntu20.04-cuda11.3.0-py37-torch1.11.0-tf1.15.5-1.3.0 4卡V100 finetune GPT3-2.7B得到output模型文件后，用

报错模型size mismatch，刚好差了4倍

展开

收起

GPT-3预训练生成模型-中文-2.7B

游客5rty4zy6dfpts 2023-03-07 19:53:19 1275 版权

3 条回答

写回答

取消提交回答

1847693217120503

尝试一下我修复的bug的版本

https://github.com/zhangzhenyu13/modelscope-debugged

2023-03-16 17:35:02

赞同 1 展开评论
1296995534731106

您好，给您带来的不便深表歉意，在1.3.0版本中存在GPT3存储checkpoint的一个bug，建议更新至1.3.2版本进行训练和推理

2023-03-08 21:26:21

赞同展开评论
turbo_zhang

咱俩一样，加我微信15821444815，讨论一下

2023-03-08 09:59:54

赞同展开评论

相关问答

自然语言处理

如何实例化一个聊天模型，并指定使用GPT-4？

181

1

0

训练一个GPT-3模型大概需要多少计算量和算力？

2228

3

0

在GPT等大模型的加持下，新必应带来了哪些变革？

137

2

0

ARTIST模型如何通过GPT生成图像序列？

126

1

0

GPT-4的多模态模型有什么特点？

142

1

0

预训练和推理在GPT中分别指什么？

171

1

0

阿里云百炼模型广场是有GPT模型吗？

263

1

0

如何评价 OpenAI 最新发布支持实时语音对话的模型GPT-4o？

3156

119

0

ModelScope配置里面有gpt-3.5-turbo 这个模型好像调用不了？

488

3

0

Modelscope在EAS部署了一个模型库的模型，是自己训练的GPT3，为什么现在报了这个错误？

266

3

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

[大模型实战 03预备] 云端炼丹房 1：Google Colab 上手指南

[大模型实战 03] 拆解 Transformers：从原理图解到 HuggingFace Transformers 实战

[大模型实战 05] 大模型实战的杀手锏：模型微调

[大模型实战 06] 我的模型我做主：在 Kaggle 上用 Unsloth 极速微调 Qwen3

热门讨论

热门文章

modelscope-funasr 热词如何设置？

通义灵码2.7.2版本智能体功能是不是用不了了，为何每次涉及到操作文件的问题都卡在那里不动了

如何下载llama模型到本地？

运行模型时报错 'megatron_util.mpu' has no attribute 'get_

###baichuan-7B 进行中文分词效果

modelscope-funasr支持粤语么？

modelscope-funasr如何释放显存呢？

如何修改通义千问的system prompt，以修改自定义名字

modelscope-funasr输出的结果里可以区分说话人吗？

在modelscope-funasr想自己训练一种low resource 的方言，有训练的方案吗？

展开全部

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

[大模型实战 06] 我的模型我做主：在 Kaggle 上用 Unsloth 极速微调 Qwen3

Cline：29.7K Star！一文详解VSCode最强开源AI编程搭子：一键生成代码+自动跑终端+操控浏览器...

OpenScholar：华盛顿大学联合艾伦研究所开源的学术搜索工具

Qlib：华尔街颤抖！微软开源金融AI量化投资神器，助力智能投研

[大模型实战 05] 大模型实战的杀手锏：模型微调

[大模型实战 03] 拆解 Transformers：从原理图解到 HuggingFace Transformers 实战

LLM 大模型学习必知必会系列(一)：大模型基础知识篇

告别Hugging Face模型下载难题：掌握高效下载策略，畅享无缝开发体验

[大模型实战 03预备] 云端炼丹房 1：Google Colab 上手指南

展开全部

还有其他疑问?