求教一个机器学习PAI问题,这个emb共享是在共享combiner后的emb吗?如果我有个要共享的特征,分别在 单独的id特征,kv特征,seq特征。共享id特征 就一个emb,没有要combiner的操作。kv特征 combiner:meanseq特征里面,序列的处理方式,不在特征上做combiner。该怎么办呢?另外,如果要共享的特征,本身是个多值特征,以上情况,又是怎么共享的呢?
在机器学习PAI中,要实现特征的embedding共享,通常需要确保这些特征具有相同的embedding_name
。对于你提到的三种特征类型:单独的ID特征、KV特征和序列特征(seq特征),下面是一些建议:
embedding_name
。这样,它就可以独立于其他特征进行嵌入学习。embedding_name
与要共享的类别特征的embedding_name
相同。这样,它们就可以共享同一个embedding矩阵。embedding_name
。此外,关于多值特征的共享问题,多值特征通常指的是那些具有多个可能值的特征,例如一个ID特征可能有多个不同的ID值。在这种情况下,如果你想共享这样的特征,你需要确保所有想要共享的特征使用相同的embedding_name
。这样,无论特征的具体值是什么,它们都会使用同一个embedding矩阵。
综上所述,为了在机器学习PAI中实现特征的embedding共享,你需要确保想要共享的特征具有相同的embedding_name
。对于不同类型的特征(ID、KV、序列),你可能需要根据特征的处理方式(是否需要combiner)来决定如何配置它们的embedding_name
。对于多值特征,同样的原则适用,即共享的特征应该具有相同的embedding_name
。
一般同一类的combiner都类似的吧,要么sum,要么mean,sequence的一般不会combine,idfeature设啥都不影响,共享combine之前的embedding, seq不需要combine, id也不需要combine ,此回答整理自钉群“【EasyRec】推荐算法交流群”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。