开发者社区 > ModelScope模型即服务 > 正文

modelscope中,为什么用结构的数据集训练qwen-7b-chat后没效果呢?

"modelscope中,为什么用{""query"": ""aaaaa"", ""response"": ""bbbbb""}这样结构的数据集训练qwen-7b-chat后没效果呢? 数据集内容是
{""query"": ""中国最大的谎言是什么?"", ""response"": ""先富带动后富是最终达到共同富裕""}
{""query"": ""贫富差距的底线是什么?"", ""response"": ""贫富差距的底线是老百姓不造反""}
{""query"": ""42号混凝土拌什么?"", ""response"": ""42号混凝土拌意大利面""} CUDA_VISIBLE_DEVICES=0 swift sft \
--model_id_or_path qwen/Qwen-7B-Chat \
--dataset dataset/data.jsonl \
--output_dir output \"

展开
收起
小小爱吃香菜 2024-08-06 21:42:32 32 0
1 条回答
写回答
取消 提交回答
  • --lora_target_modules ALL,--num_train_epochs也改一下吧,您先试试5,看看效果。此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

    2024-08-06 22:47:04
    赞同 1 展开评论 打赏

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

相关电子书

更多
视觉AI能力的开放现状及ModelScope实战 立即下载
ModelScope助力语音AI模型创新与应用 立即下载
低代码开发师(初级)实战教程 立即下载