机器学习PAI想咨询一下,easyrec做RawFeature这种连续值特征输入时,是否支持不做embedding层,直接将特征原值作为输入呢?
在阿里云的机器学习PAI(Platform for AI Innovation)中,EasyRec模型对于连续值特征(即RawFeature)的处理方式是将其转换为数值向量,而不是直接使用原始值。这是因为深度学习模型通常需要输入数值向量,而不是原始的数值。
然而,如果你确实希望保留原始值,你可以尝试使用一些其他的机器学习模型,比如逻辑回归或者线性回归,这些模型可以直接接受原始值作为输入。
另外,如果你希望在模型中保留原始值,你也可以考虑使用一些特定的预处理方法,比如归一化或者标准化,这些方法可以帮助你在保持原始值的同时,将其转换为模型可以接受的格式。
支持,不配置embedding_dim就好了.easyrec做RawFeature这种连续值特征输入时,是否支持不做embedding层,直接将特征原值作为输入,根据已知的参考内容信息,可以将连续值特征直接作为输入,不需要做embedding层。因此,easyrec支持不做embedding层,直接将特征原值作为输入。,此回答整理自钉群“【EasyRec】推荐算法交流群”
如果你想要避免使用Embedding层,你可以考虑将连续值特征转换为类别特征,然后再将其作为输入。这可以通过 pandas.get_dummies() 函数或者 sklearn.preprocessing.OrdinalEncoder 类实现。但是请注意,这种方法可能会导致特征维度的增加,从而增加模型的复杂性。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。