带你读《2022技术人的百宝黑皮书》——生成式重排在内容推荐中的应用实践(6)

简介: 带你读《2022技术人的百宝黑皮书》——生成式重排在内容推荐中的应用实践(6)

带你读《2022技术人的百宝黑皮书》——生成式重排在内容推荐中的应用实践(5) https://developer.aliyun.com/article/1246840?groupCode=taobaotech



实验结果分析


序列生成方法对比


使用列表整体PV和IPV衡量不同的序列生成方法的效果,raw方法为按照原始rank score排序得到的列表。


image.png


IPV指标可以通过提升浏览深度和点击率来优化,代表了推荐列表的整体收益。在一些情形下,虽然PCTR提高了,但整体的IPV指标确是下降的,这一般是由于浏览深度下降的幅度超过了点击率提升的幅度。信息流推荐场景中,提高分发内容的多样性通常可以间接地提升浏览深度。


image.png


引入多样性后,列表的浏览深度均有提高。基于DPP方法生成的列表在PV和IPV指标上相比其他几种具有最好的效果表现,这也说明DPP确实是一种不错的多样性重排方法。MMR虽然在PV指标上显著高于其他,但整体IPV具有较大的下降,主要是整体的PCTR降低导致,通过调整生成MMR序列的超参数降低多样性程度可以缓解。beam search方法具有与DPP相近的PV和IPV收益,并且具有接近一半的分发占比,说明了相比于greedy search具有更广泛的解搜索能力,未来可以对beam search的价值评估策略做进一步优化提升效果。


注意到按原始rank score排序的列表仍然具有18.65%的分发比例,这说明在序列评估模型的视角下并不是所有时候都需要引入多样性,生成式重排具有一定的自适应平衡相关性和多样性的能力。



带你读《2022技术人的百宝黑皮书》——生成式重排在内容推荐中的应用实践(7) https://developer.aliyun.com/article/1246838?groupCode=taobaotech


相关文章
|
7月前
|
机器学习/深度学习 人工智能 资源调度
大语言模型的核心算法——简要解析
大语言模型的核心算法基于Transformer架构,以自注意力机制为核心,通过Q、K、V矩阵动态捕捉序列内部关系。多头注意力增强模型表达能力,位置编码(如RoPE)解决顺序信息问题。Flash Attention优化计算效率,GQA平衡性能与资源消耗。训练上,DPO替代RLHF提升效率,MoE架构实现参数扩展,Constitutional AI实现自监督对齐。整体技术推动模型在长序列、低资源下的性能突破。
904 8
|
机器学习/深度学习 存储 人工智能
英伟达 H100 vs. 苹果M2,大模型训练,哪款性价比更高?
训练和微调大型语言模型对于硬件资源的要求非常高。目前,主流的大模型训练硬件通常采用英特尔的CPU和英伟达的GPU。然而,最近苹果的M2 Ultra芯片和AMD的显卡进展给我们带来了一些新的希望。
2342 0
|
机器学习/深度学习 自然语言处理 搜索推荐
承上启下:基于全域漏斗分析的主搜深度统一粗排
两阶段排序(粗排-精排)一开始是因系统性能问题提出的排序框架,因此长期以来粗排的定位一直是精排的退化版本,业内的粗排的优化方向也是持续逼近精排。我们提出以全域成交的hitrate为目标的全新指标,重新审视了召回、粗排和精排的关系,指出了全新的优化方向
94459 3
|
机器学习/深度学习 监控 搜索推荐
深度粗排模型的GMV优化实践:基于全空间-子空间联合建模的蒸馏校准模型
随着业务的不断发展,粗排模型在整个系统链路中变得越来越重要,能够显著提升线上效果。本文是对粗排模型优化的阶段性总结。
2256 0
深度粗排模型的GMV优化实践:基于全空间-子空间联合建模的蒸馏校准模型
|
机器学习/深度学习 算法 搜索推荐
带你读《2022技术人的百宝黑皮书》——生成式重排在内容推荐中的应用实践(2)
带你读《2022技术人的百宝黑皮书》——生成式重排在内容推荐中的应用实践(2)
339 0
带你读《2022技术人的百宝黑皮书》——生成式重排在内容推荐中的应用实践(2)
|
搜索推荐 测试技术
淘宝粗排问题之在粗排模型中引入交叉特征如何解决
淘宝粗排问题之在粗排模型中引入交叉特征如何解决
|
消息中间件 设计模式 SQL
如何成为架构师?
总结这些年在支付宝做架构的经验,把自己摸索成长的内容写下来,从对架构师的认知到业务能力和架构能力多方面总结了案例经验,希望可以帮助到大家。
14771 28
|
算法 搜索推荐
带你读《2022技术人的百宝黑皮书》——生成式重排在内容推荐中的应用实践(3)
带你读《2022技术人的百宝黑皮书》——生成式重排在内容推荐中的应用实践(3)
379 0
|
机器学习/深度学习 人工智能 算法
Generator-Evaluator重排模型在淘宝流式场景的实践
Generator-Evaluator重排模型在淘宝流式场景的实践
2147 0
|
机器学习/深度学习
带你读《2022技术人的百宝黑皮书》——生成式重排在内容推荐中的应用实践(7)
带你读《2022技术人的百宝黑皮书》——生成式重排在内容推荐中的应用实践(7)
268 0