开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

请问下机器学习PAI文档里DIN和BST组件化实现,特征里list和key是怎么做的映射?

"请问下机器学习PAI文档里DIN和BST组件化实现,sequence特征里list和key是怎么做的映射?b81eef64f66eccbe0c8d7cf28cf8200a.png
"

展开
收起
真的很搞笑 2023-10-22 18:41:50 85 0
3 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在DIN和BST机器学习PAI组件中,特征里的list和key是通过以下步骤进行映射的:

    1. 使用Python API将特征转换为PAI可以处理的格式。例如,你可以使用以下代码将特征转换为PAI可以处理的格式:
    # 将特征转换为PAI可以处理的格式
    features = list_of_lists_of_numbers + list_of_strings + list_of_dicts
    
    1. 使用PAI的特征工程功能将特征转换为PAI可以处理的格式。例如,你可以使用以下代码将特征转换为PAI可以处理的格式:
    # 使用PAI的特征工程功能将特征转换为PAI可以处理的格式
    featurizer = FeatureExtractor(features)
    features = featurizer.transform(features)
    
    1. 使用PAI的特征映射功能将特征转换为PAI可以处理的格式。例如,你可以使用以下代码将特征转换为PAI可以处理的格式:
    # 使用PAI的特征映射功能将特征转换为PAI可以处理的格式
    mapper = FeatureMapper(features)
    features = mapper.transform(features)
    
    1. 使用PAI的特征转换功能将特征转换为PAI可以处理的格式。例如,你可以使用以下代码将特征转换为PAI可以处理的格式:
    # 使用PAI的特征转换功能将特征转换为PAI可以处理的格式
    transformer = FeatureTransformer(features)
    features = transformer.transform(features)
    

    请注意,你需要确保你的PAI版本能够正确地工作在一起,并且能够正常地处理特征里的list和key映射。

    2023-10-23 14:08:44
    赞同 展开评论 打赏
  • "list是所有sequence 特征的embeding 拼接起来的,key是所有非sequence 特征的embedding 拼接起来
    这个例子里, concat([cate_id,brand], axis=-1) 是key; concat([tag_brand_list, tag_category_list], axis=-1) 是sequence
    ,此回答整理自钉群“【EasyRec】推荐算法交流群”"

    2023-10-23 08:05:42
    赞同 展开评论 打赏
  • 公众号:网络技术联盟站,InfoQ签约作者,阿里云社区签约作者,华为云 云享专家,BOSS直聘 创作王者,腾讯课堂创作领航员,博客+论坛:https://www.wljslmz.cn,工程师导航:https://www.wljslmz.com

    对于阿里云机器学习PAI的DIN和BST组件化实现,特征里list和key的映射方式,文档中并没有明确说明。但根据一般的特征工程实践,我们可以推测可能的做法如下:

    • 对于List类型的特征,您可能需要将列表中的每个元素单独作为特征进行处理。例如,如果一个特征是颜色列表,那么您可能需要为红色、蓝色和绿色分别创建三个新特征。
    • 对于Key类型的特征,您可能需要使用One-Hot Encoding或其他编码方法将键转换为多个二进制特征。例如,如果一个特征是城市名(如"北京","上海"等),那么您可能需要为每个城市创建一个新特征,并使用二进制编码表示该城市是否存在。
    2023-10-22 19:05:20
    赞同 展开评论 打赏

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

相关产品

  • 人工智能平台 PAI
  • 热门讨论

    热门文章

    相关电子书

    更多
    大规模机器学习在蚂蚁+阿里的应用 立即下载
    基于Spark的面向十亿级别特征的 大规模机器学习 立即下载
    基于Spark的大规模机器学习在微博的应用 立即下载