带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(3)

简介: 带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(3)

带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(2) https://developer.aliyun.com/article/1246887?groupCode=taobaotech



均匀保量

 

均匀保量是解决创作者流量确定性的第一个环节。在我们的系统中,最近7日内新发布并且曝光pv < x的内容会进入到均匀保量投放的阶段,当内容投放达到曝光pv上限后则会退出该阶段,该阶段会确保每条新内容都能获得一定的初始曝光,收集到的反馈数据有助于新内容在主链路中的透出。


为了防止一些创作者通过批量生产内容来获取系统流量,我们根据创作者历史生产内容的线上表现计算出了创作流量效率指数,根据该指数约束每个创作者每天在均匀保量阶段可以获得的流量上限 m,当作者创作的新内容在当天累计获得的曝光pv > m时则不再对内容进行保量投放。


助推放大


均匀保量策略有效缓解了新内容首曝周期长和难以获得初始流量的问题,但该链路没有充分考虑到给予潜在优质内容更多的流量,加速其成长为热门内容。我们为新内容引入助推成长的环节,根据内容在线上投放的实时表现动态调整扶持流量,随着效果的提高逐步放大流量,给予优质内容获取更多流量。


助推放大链路会对已经获得过一部分曝光并且点击率大于指定阈值min_ctr的内容执行分级的流量放大策略,在该策略中内容的扶持流量上限会随着内容实时的点击率动态的调整。我们根据大盘的内容效果和可用于扶持的流量比例划分了k个助推等级,根据实时计算的后验点击率确定内容所属的助推级别,当内容在助推链路中的曝光pv > 上限n后内容则会从助推链路中退出。


业务效果


流量新鲜度


1. 近N天发布内容pvr:每日曝光内容中发布时间在N天内的内容获取总流量占比(该指标越高表明新鲜度越高)

2. 按pv加权发布天数:每日曝光内容中按内容曝光pv加权计算得到的内容发布天数(该指标越低表明新鲜度越高)


我们在21年5月底启动了冷启系统优化的项目,新系统逐步放量,从时间周期来看,自线上运行以来,近N天发布内容pvr呈现逐步提高的趋势,而pv加权发布天数呈现逐渐下降趋势,表明新系统对于提高整体推荐系统的流量新鲜度具有正向促进作用,近7天发布内容pvr+15.8% ,近14天发布内容pvr +73.3% ,近30天发布内容pvr+17.1%



带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(4) https://developer.aliyun.com/article/1246884?groupCode=taobaotech

相关文章
|
监控 安全 物联网
什么是UWB定位技术?UWB定位的应用场景及功能介绍
uwb定位技术全称Ultra Wide Band,超宽带技术。uwb超宽带技术是一种全新的通信技术,与传统通信技术有极大差异。它不需要使用传统通信体制中的载波,而是通过发送和接收极窄脉冲来实现无线传输,由于脉冲时间宽度极窄,使用的带宽在500MHz以上。 后来,由于uwb定位技术穿透力强、功耗低、安全性高、定位精度高等优势,人们意识到了它在高精度定位领域的价值,uwb在工业定位领域的应用逐渐成为主流。
3002 0
|
2月前
|
缓存 自然语言处理 机器人
2026年阿里云OpenClaw(Clawdbot)一键部署+Discord快速接入指南
OpenClaw(原Clawdbot/Moltbot)作为阿里云生态下的开源AI自动化代理工具,凭借自然语言交互、跨平台任务自动化、插件化扩展的核心能力,已成为跨境团队协作、全球化办公提效的关键工具。2026年阿里云推出OpenClaw专属一键部署方案,结合Discord在海外协作场景的高渗透率,实现“Discord频道下达指令,OpenClaw自动执行跨境办公、多语言交互类任务”的高效模式。本文将完整拆解阿里云环境下OpenClaw的一键部署流程,重点详解Discord机器人创建、权限配置、跨境网络适配、对接调试的全步骤,包含实操代码命令与跨境场景避坑技巧,零基础用户也能快速完成从部署到落地
880 1
|
存储 人工智能 自然语言处理
LangChain让LLM带上记忆
最近两年,我们见识了“百模大战”,领略到了大型语言模型(LLM)的风采,但它们也存在一个显著的缺陷:没有记忆。在对话中,无法记住上下文的 LLM 常常会让用户感到困扰。本文探讨如何利用 LangChain,快速为 LLM 添加记忆能力,提升对话体验。
50614 7
LangChain让LLM带上记忆
|
机器学习/深度学习 数据采集 自然语言处理
【Deep Learning A情感文本分类实战】2023 Pytorch+Bert、Roberta+TextCNN、BiLstm、Lstm等实现IMDB情感文本分类完整项目(项目已开源)
亮点:代码开源+结构清晰+准确率高+保姆级解析 🍊本项目使用Pytorch框架,使用上游语言模型+下游网络模型的结构实现IMDB情感分析 🍊语言模型可选择Bert、Roberta 🍊神经网络模型可选择BiLstm、LSTM、TextCNN、Rnn、Gru、Fnn共6种 🍊语言模型和网络模型扩展性较好,方便读者自己对模型进行修改
1684 0
|
TensorFlow 算法框架/工具 Python
【Mac 系统】解决VSCode用Conda成功安装TensorFlow但程序报错显示红色波浪线Unable to import ‘tensorflow‘ pylint(import-error)
本文解决在Mac系统上使用VSCode时遇到的TensorFlow无法导入问题,原因是Python解析器未正确设置为Conda环境下的版本。通过在VSCode左下角选择正确的Python解析器,即可解决import TensorFlow时报错和显示红色波浪线的问题。
938 9
|
安全 算法 网络安全
信息安全:VPN 技术原理与应用
信息安全:VPN 技术原理与应用
1676 2
|
机器学习/深度学习 人工智能 自然语言处理
算法金 | 没有思考过 Embedding,不足以谈 AI
**摘要:** 本文深入探讨了人工智能中的Embedding技术,解释了它是如何将高维数据映射到低维向量空间以简化处理和捕获内在关系的。文章介绍了词向量、图像嵌入和用户嵌入等常见类型的Embedding,并强调了其在自然语言处理、计算机视觉和推荐系统中的应用。此外,还讨论了Embedding的数学基础,如向量空间和线性代数,并提到了Word2Vec、GloVe和BERT等经典模型。最后,文章涵盖了如何选择合适的Embedding技术,以及在资源有限时的考虑因素。通过理解Embedding,读者能够更好地掌握AI的精髓。
573 0
算法金 | 没有思考过 Embedding,不足以谈 AI
|
机器学习/深度学习 智能设计 自然语言处理
带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(7)
带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(7)
547 0
|
搜索推荐 算法
带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(2)
带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(2)
446 1
|
Linux 数据安全/隐私保护 网络安全