我昨天在使用机器学习PAI时,调用transform方法进行预测之后进行打印,发现某些参与预测的字段在预测前跟预测后不一样,请问是什么原因会导致这种情况呢?(训练跟预测的时候参数顺序一致)
如果在使用机器学习PAI的transform方法进行预测时,发现某些字段在预测前后不一致,可能有以下原因导致:
特征处理:在训练模型时,你可能对输入数据进行了一些特征处理,例如缺失值填充、标准化或编码。如果在预测时没有正确应用相同的特征处理步骤,那么字段的取值就会出现差异。
数据格式转换:在训练和预测过程中,数据传递的方式和格式可能不同。如果在传递数据时有所变化,如从文件读取到内存或从列表传递到API接口,数据的格式、顺序或类型可能会发生变化,进而导致字段不一致。
版本不一致:模型训练和预测过程中使用的库、框架或工具版本可能不一致,这可能导致一些隐含的差异。确保在训练和预测环境中使用相同的库和版本可以减少这种情况的发生。
数据漂移:如果在训练和预测之间存在时间差或数据源变化等情况,那么输入数据的分布可能会发生变化,这可能导致字段值的差异。
这个pipeline model有两步,第一步是标准化,标准化没有设置OUTPUT_COLS,会直接用标准化的结果替换。可以在StandardScaler里设置,此回答来自钉群“Alink开源--用户群”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。