带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(4)

简介: 带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(4)

带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(3) https://developer.aliyun.com/article/1246886?groupCode=taobaotech



流量扶持效率


助推放大阶段引入了分级流量放大机制,将用于冷启扶持的流量更多倾斜到潜在优质内容,加速优质内容成长。我们采用近7天冷启链路曝光的内容在最近1天常规链路分发下的pctr衡量扶持效率。具体公式定义为:


image.png


image.png


image.png


内容潜力预估模型


模型设计


我们设计内容潜力预估模型来预测新发布的内容在未来成长为热门内容的概率。模型以内容是否能成为热门为目标,将在发布7天内迅速获得高曝光高点击的内容为正样本,其余为负样本。通过模型训练,捕获内容成长为热门的特征,从而挖掘出有潜力的内容。


特征工程


在特征选择上,主要分为2类:内容属性特征和内容封面图特征。其中,内容属性特征包括:内容所属的风格、空间,挂载商品的id、类目、店铺、组合价格等。通过一个预训练的模型提取对应的封面图图像embedding特征。值得注意的是,我们有意识地避开点击率等基于用户交互行为的统计特征,以期更专注于内容本身进行潜力预估。



带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(5) https://developer.aliyun.com/article/1246883?groupCode=taobaotech

相关文章
|
SQL Java 关系型数据库
若依框架---PageHelper分页(十一)
若依框架---PageHelper分页(十一)
591 0
|
算法 Java 测试技术
java性能调优涉及哪些方面
本文详细探讨了性能调优的各个方面,包括Java编程、多线程、JVM监控、设计模式和数据库调优。文章还介绍了性能调优的标准制定、介入时机、系统性能的影响因素,以及如何衡量和判断系统的性能与负载承受能力。最后,提出了性能调优的具体策略,包括代码、设计、算法优化及参数调整,并讨论了限流、智能化扩容等兜底策略。
287 0
java性能调优涉及哪些方面
|
机器学习/深度学习 人工智能 自然语言处理
算法金 | 没有思考过 Embedding,不足以谈 AI
**摘要:** 本文深入探讨了人工智能中的Embedding技术,解释了它是如何将高维数据映射到低维向量空间以简化处理和捕获内在关系的。文章介绍了词向量、图像嵌入和用户嵌入等常见类型的Embedding,并强调了其在自然语言处理、计算机视觉和推荐系统中的应用。此外,还讨论了Embedding的数学基础,如向量空间和线性代数,并提到了Word2Vec、GloVe和BERT等经典模型。最后,文章涵盖了如何选择合适的Embedding技术,以及在资源有限时的考虑因素。通过理解Embedding,读者能够更好地掌握AI的精髓。
573 0
算法金 | 没有思考过 Embedding,不足以谈 AI
|
机器学习/深度学习 智能设计 自然语言处理
带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(7)
带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(7)
547 0
|
搜索推荐 算法
带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(2)
带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(2)
446 1
|
传感器 监控 安全
地铁线路管理系统的设计与实现_kaic
地铁线路管理系统的设计与实现_kaic
|
Web App开发 存储 数据可视化
LaTeX基础使用【系列五】
LaTeX基础使用【系列五】
leetcode 150 逆波兰表达式
leetcode 150 逆波兰表达式
155 0
leetcode 150 逆波兰表达式
|
NoSQL Linux Redis
linux查看redis安装目录
linux查看redis安装目录
2743 0
|
缓存 Java 数据库
Java并发 之 线程池系列 (1) 让多线程不再坑爹的线程池
Java并发 之 线程池系列 (1) 让多线程不再坑爹的线程池
260 0
Java并发 之 线程池系列 (1) 让多线程不再坑爹的线程池

热门文章

最新文章