开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

你好,我用机器学习PAI业务数据训练了easy_transfer的bert双塔文本匹配,约10w样?

你好,我用机器学习PAI业务数据训练了easy_transfer的bert双塔文本匹配,约10w样本,训练5个epoch,得到oss中的模型结果如下图所示,请问如何查看训练过程中的loss变化,哪个保存的checkpoint在验证集上的效果最好?2d8e71b7cae34015e6e07a8587ea21ef.png
也就是avg_loss和eval中的数据怎么看?

展开
收起
真的很搞笑 2023-07-31 09:37:54 58 0
1 条回答
写回答
取消 提交回答
  • 很高兴听到您通过机器学习 PAI 业务数据进行了训练,并使用 EasyTransfer 的 BERT 双塔模型进行文本匹配。要查看训练过程中的损失变化以及在验证集上效果最好的 checkpoint,请按照以下步骤操作:

    1. 加载模型结果:从 Oss 中下载或加载模型结果。

    2. 导入必要的库和模块:在 Python 环境中导入所需的库和模块,例如 TensorFlow 或 PyTorch(根据您使用的框架)。

    3. 加载检查点和日志文件:使用相应的函数加载保存的检查点和训练日志文件。

    4. 分析训练日志:通过分析训练日志文件,可以获得训练过程中的损失变化情况。一般而言,训练日志文件会记录每个 epoch 的训练和验证阶段的损失值。

    5. 绘制损失曲线:使用 Python 的数据可视化工具(如 Matplotlib)将训练和验证阶段的损失值绘制成损失曲线图。这样可以直观地观察损失的变化趋势。

    6. 找到最佳验证效果的检查点:通过比较验证阶段的损失值或其他评估指标,在所有保存的检查点中找到在验证集上效果最好的模型。

    具体实现步骤可能因您的环境和框架而有所不同,但以上步骤提供了一个一般性的指导。请参考相应的框架文档和示例代码来了解更多细节,并根据您的具体情况进行适当地调整。

    希望这个回答对您有所帮助!如果您还有其他问题,请随时提问。

    2023-07-31 16:05:03
    赞同 展开评论 打赏

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

相关产品

  • 人工智能平台 PAI
  • 热门讨论

    热门文章

    相关电子书

    更多
    大规模机器学习在蚂蚁+阿里的应用 立即下载
    阿里巴巴机器学习平台AI 立即下载
    机器学习及人机交互实战 立即下载