备案控制台

开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

你好，我用机器学习PAI业务数据训练了easy_transfer的bert双塔文本匹配，约10w样？

你好，我用机器学习PAI业务数据训练了easy_transfer的bert双塔文本匹配，约10w样本，训练5个epoch，得到oss中的模型结果如下图所示，请问如何查看训练过程中的loss变化，哪个保存的checkpoint在验证集上的效果最好？
也就是avg_loss和eval中的数据怎么看？

展开

收起

真的很搞笑 2023-07-31 09:37:54 58 0

1 条回答

写回答

取消提交回答

Star时光
很高兴听到您通过机器学习 PAI 业务数据进行了训练，并使用 EasyTransfer 的 BERT 双塔模型进行文本匹配。要查看训练过程中的损失变化以及在验证集上效果最好的 checkpoint，请按照以下步骤操作：
1. 加载模型结果：从 Oss 中下载或加载模型结果。
2. 导入必要的库和模块：在 Python 环境中导入所需的库和模块，例如 TensorFlow 或 PyTorch（根据您使用的框架）。
3. 加载检查点和日志文件：使用相应的函数加载保存的检查点和训练日志文件。
4. 分析训练日志：通过分析训练日志文件，可以获得训练过程中的损失变化情况。一般而言，训练日志文件会记录每个 epoch 的训练和验证阶段的损失值。
5. 绘制损失曲线：使用 Python 的数据可视化工具（如 Matplotlib）将训练和验证阶段的损失值绘制成损失曲线图。这样可以直观地观察损失的变化趋势。
6. 找到最佳验证效果的检查点：通过比较验证阶段的损失值或其他评估指标，在所有保存的检查点中找到在验证集上效果最好的模型。
具体实现步骤可能因您的环境和框架而有所不同，但以上步骤提供了一个一般性的指导。请参考相应的框架文档和示例代码来了解更多细节，并根据您的具体情况进行适当地调整。

希望这个回答对您有所帮助！如果您还有其他问题，请随时提问。
2023-07-31 16:05:03

赞同展开评论打赏

问答分类：

机器学习/深度学习对象存储人工智能平台 PAI 对象存储

问答标签：

人工智能平台 PAI训练人工智能平台 PAI数据人工智能平台 PAI文本机器学习人工智能平台 PAI 人工智能平台 PAI pai

问答地址：

开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 问答

相关产品：

人工智能平台 PAI

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

人工智能平台PAI

在机器学习PAI我们每天写前一天的数据到pt里，然后全量数据同步前30天，是怎么同步的？

32

1

0

机器学习PAI训练数据的原始 hive表存在emr集群，pai如何才能组装好训练数据进行模型训练呢？

28

0

0

使用流水并行训练Bert Large模型时，如何解决batch size小导致的收敛问题？

27

1

0

流水并行如何帮助加速Bert Large模型的训练？

30

1

0

智能标注PAI-itag，标注完导出的数据可以下载到本地吗？

46

1

0

机器学习PAI把writeflush注释掉之后，发现100条数据只写入了3条，怎么回事？

37

1

0

机器学习PAI如何在input_layer后对输入数据进行batch normalization？

33

1

0

机器学习PAI没办法通过构造http请求来取数据？我们的工程项目是C#开发的，这样就基本用不了了

31

1

0

在NLP自学习平台中，需要对一万条裁判文书数据进行文本关系抽取的模型训练，如何收费？

30

1

0

机器学习PAI有没有python版本的，从odps读取数据？

59

1

0

大数据与机器学习

人工智能平台PAI

人工智能平台 PAI（Platform for AI，原机器学习平台PAI）是面向开发者和企业的机器学习/深度学习工程平台，提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务，内置140+种优化算法，具备丰富的行业场景插件，为用户提供低门槛、高性能的云原生AI工程化能力。

我要提问

相关产品

人工智能平台 PAI

文档详情产品详情

热门讨论

热门文章

P人出游，你是否需要一个懂你更懂规划的AI导游呢？来搭建专属文旅问答机器人吧

如何高效的往交互建模（dsw）上传较大的文件，有从阿里云盘中直接下载或类似的方法吗？

Stable Diffusion怎么部署，要多少费用？

PAI做了线性回归的模型，预测结果后，回归模型评估的节点，结果R2的值是负的，我理解R2的取值范围?

灵积平台上，用通义千问的开源大模型接口响应非常慢

在api调用夸克搜索时，遇到权限不足问题

modelscope 里面的模型用pipeline 做推理太慢怎样提高推理速度

机器学习PAI我训练的AUC 0.7左右，这个效果是不是很差了？

为什么 PAI DSW中一直无法使用GPU加速tensorflow，如何使用GPU加速.

dsw实例无法启动，卡在准备环境很久，然后显示以失败，求救

展开全部

【玩转数据系列九】机器学习为您解密雾霾形成原因

【玩转数据系列六】文本分析算法实现新闻自动分类

【玩转数据系列一】人口普查统计案例

阿里巴巴机器学习系列课程

机器学习PAI全新功效——实时新闻热点Online Learning实践

云端深度学习框架TensorFlow读取数据IO的高效方式

【玩转数据系列十一】机器学习PAI眼中的《人民的名义》

阿里云机器学习平台PAI，助力降低机器学习的成本和技术门槛

【数据科学老司机在线教学第二期】阿里云大数据生态协同过滤推荐系统实战

推荐系统之业务架构总览

展开全部

相关课程

更多

PAI平台学习路线：机器学习入门到应用

2532

52

去学习

场景实践 - 机器学习PAI实现精细化营销

213

7

去学习

场景实践 - 基于阿里云PAI机器学习平台使用时间序列分解模型预测商品销量

173

8

去学习

场景实践 - 基于机器学习进行收入预测分析

104

6

去学习

机器学习概览及常见算法

32411

13

去学习

机器学习入门-概念原理及常用算法

13543

8

去学习

相关电子书

更多

大规模机器学习在蚂蚁+阿里的应用 立即下载

阿里巴巴机器学习平台AI 立即下载

机器学习及人机交互实战 立即下载

相关实验场景

更多