开发者社区> 问答> 正文

csanmt的finetune相关配置问题

模型默认的configuration文件里面学习率给的是1,这是不是太大了?

这个模型一般loss训练到多少才算可以?

model_scope[版本1.1.0]提供的tensorboard的hook,在configuration文件里面配置并不生效,没有生成tfevent文件

csanmt在训练的时候也没有生成pth文件,和model_scope文档中关于【模型保存的配置】描述不符https://modelscope.cn/docs/%E6%A8%A1%E5%9E%8B%E7%9A%84%E8%AE%AD%E7%BB%83Train

展开
收起
p4pdqdl5ikygk 2022-12-08 23:30:35 356 0
1 条回答
写回答
取消 提交回答
  • 学习率

    默认情况下,模型的学习率设置为 1 可能确实有点大,特别是对于较小的数据集或复杂的模型。学习率过大会导致模型在训练过程中不稳定或发散。

    对于大多数计算机视觉任务,建议的学习率范围通常在 0.001 到 0.1 之间。你可以从较小的学习率开始,例如 0.01,然后根据训练过程中的表现逐步增加。

    损失函数

    模型训练到什么程度才算“可以”取决于具体的任务和数据集。然而,对于一般的图像分类任务,你可以将以下损失值作为参考:

    交叉熵损失:小于 0.1 通常被认为是好的。
    均方误差 (MSE):小于 0.01 通常被认为是好的。

    2024-02-27 18:25:37
    赞同 展开评论 打赏
来源圈子
更多
收录在圈子:
+ 订阅
技术图谱:由专家组参与技术图谱的绘制与编写,知识与实践的结合让开发者们掌握学习路线与逻辑,快速提升技能 电子书:电子书由阿里内外专家打造,供开发者们下载学习,更与课程相结合,使用户更易理解掌握课程内容 训练营:学习训练营 深入浅出,专家授课,带领开发者们快速上云 精品课程:汇集知识碎片,解决技术难题,体系化学习场景,深入浅出,易于理解 技能自测:提供免费测试,摸底自查 体验实验室:学完即练,云资源免费使用
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载