开发者社区 > 云计算 > 正文

13-科学家脱口秀-瑞溪《AI之主搜魔法师》

发布者:Dev-Talk 2021-01-26 16:52:26 373
视频介绍

根据电商搜索特点,为了能持续保持内容的多样性,搜索结果的每一页都要进行混排。混排可分解为两个层次的决策:先进行内容源选择,再对选出的内容和商品进行排列。在与清华大学的合作中,我们首创了使用层次强化学习模型进行混排的技术。直接将两个层次的决策建模到一个过程中,并考虑当前决策对后续决策的影响,让模型自己学习并得到整体最优的决策。我们的层次强化学习方法不仅实现了更高的内容坑位点击率,同时具有很好的可扩展性,在满足业务规则的基础上具备进一步优化的空间。