带你读《2022技术人的百宝黑皮书》——生成式重排在内容推荐中的应用实践(3)

简介: 带你读《2022技术人的百宝黑皮书》——生成式重排在内容推荐中的应用实践(3)

带你读《2022技术人的百宝黑皮书》——生成式重排在内容推荐中的应用实践(2) https://developer.aliyun.com/article/1246844?groupCode=taobaotech



DPP


基于DPP的多样性算法通过计算核矩阵 image.png的行列式找到候选内容集合中相关性和多样性最大的子集。相比于MMR每次只考虑当前内容与前序已选内容中最相似的内容的相似度,DPP会综合考虑所有已选内容的相互影响。


image.png


image.png 为候选内容集合,image.png 为已选中内容集合,image.png 为内容i的相关性分,image.png 为内容i和内容j的相似度分, image.png 为平衡相关性与多样性的因子, image.png越大生成的列表多样性越高。我们使用多组不同超参数image.png 生成了具有不同多样性程度的候选列表。


基于DPP的多样性重排打散是我们在线上全量部署的方法,通过复用线上已有的重排打散方法可以确保在序列评估模型不差的情况下取得和线上base相近的效果。


beam search


MMR和DPP均为greedy search策略,每一步选当前状态下目标效用函数最大的内容加入候选列表中,直到候选列表长度满足要求。贪心策略的每一步都采取的是局部最优策略,并不能保证产生是全局最优解。例如第一坑位选择效率分最高的内容并不一定能保证整个列表的收益最大化。


exhaustive search策略相比greedy search能够确保产生全局最优的策略,假设从m个候选内容中挑选n个组成最终的候选列表,那么一共有 image.png种组合方式。假设从50个内容选择10个内容返回,那么则约有 image.png种组合,庞大的计算量对于线上的推荐系统来说是不可接受的。


beam search则是exhaustive search和greedy search之间的一种折中解法,能够以较低的计算代价产生接近全局最优的策略。设定超参数k为beam size,那么在序列生成的每一步我们都会有k个序列,在已选中的k个序列的基础上再加入新的内容,得到m个候选序列,根据序列价值从高到底选择这m个序列中的k个作为下一步的已选中序列,不断迭代直到列表中所有位置都被填充完毕,此时序列价值最高的k个将作为最终的结果。




带你读《2022技术人的百宝黑皮书》——生成式重排在内容推荐中的应用实践(4) https://developer.aliyun.com/article/1246841?groupCode=taobaotech

相关文章
|
算法 搜索推荐 安全
淘宝信息流融合混排服务升级
淘宝信息流融合混排服务升级
1238 1
|
人工智能 自然语言处理 搜索推荐
LLM在电商推荐系统的探索与实践
LLM在电商推荐系统的探索与实践
4404 1
|
机器学习/深度学习 存储 算法
强化学习实战:基于 PyTorch 的环境搭建与算法实现
【8月更文第29天】强化学习是机器学习的一个重要分支,它让智能体通过与环境交互来学习策略,以最大化长期奖励。本文将介绍如何使用PyTorch实现两种经典的强化学习算法——Deep Q-Network (DQN) 和 Actor-Critic Algorithm with Asynchronous Advantage (A3C)。我们将从环境搭建开始,逐步实现算法的核心部分,并给出完整的代码示例。
1855 1
|
机器学习/深度学习 算法 搜索推荐
带你读《2022技术人的百宝黑皮书》——生成式重排在内容推荐中的应用实践(2)
带你读《2022技术人的百宝黑皮书》——生成式重排在内容推荐中的应用实践(2)
339 0
带你读《2022技术人的百宝黑皮书》——生成式重排在内容推荐中的应用实践(2)
|
C# 开发者 Windows
WPF/C#:ProgressBar的基本使用
WPF/C#:ProgressBar的基本使用
429 0
|
开发工具 git
uniapp项目实践拓展章:代码统一风格
uniapp项目实践拓展章:代码统一风格
296 0
|
机器学习/深度学习 资源调度 算法
推荐系统[四]:精排-详解排序算法LTR (Learning to Rank)_ poitwise, pairwise, listwise相关评价指标,超详细知识指南。
推荐系统[四]:精排-详解排序算法LTR (Learning to Rank)_ poitwise, pairwise, listwise相关评价指标,超详细知识指南。
推荐系统[四]:精排-详解排序算法LTR (Learning to Rank)_ poitwise, pairwise, listwise相关评价指标,超详细知识指南。
BXA
|
机器学习/深度学习 数据采集 人工智能
Python自然语言处理:NLTK入门指南
自然语言处理(Natural Language Processing,NLP)是指计算机处理人类语言的领域。它是一门多学科交叉的学科,将计算机科学、人工智能、语言学等诸多学科的理论和方法融合在一起,将人类语言转化为计算机所能理解的形式,实现对人类语言的自动处理、理解和生成。NLP可以应用到很多方面,比如语音识别、机器翻译、情感分析、智能客服等
BXA
1643 1
|
机器学习/深度学习 资源调度 算法
【RLchina第四讲】Model-Based Reinforcement Learning(上)
【RLchina第四讲】Model-Based Reinforcement Learning(上)
1575 0
|
机器学习/深度学习 人工智能 算法
Generator-Evaluator重排模型在淘宝流式场景的实践
Generator-Evaluator重排模型在淘宝流式场景的实践
2147 0

热门文章

最新文章