带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(5)

简介: 带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(5)

带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(4) https://developer.aliyun.com/article/1246901?groupCode=taobaotech



解码“迷失”


我们在解码过程中发现当一个商品输入关键词过多时,通常生产效果非常不好。如输入内容:“普通望远镜 户外 袖珍 单筒 迷你 高清”,生成的结果是“迷你袖珍单筒,高清防水,防水防紫外线,防水防雾”。造成此类问题的主

要原因是输入关键属性过多,模型注意力无法集中在某些重要属性,出现解码“迷失”,生成内容异常。针对此类问题,我们的主要解决方法是:在离线构造样本时,通过将输入内容规范化为特定几个属性输入,使得模型训练时能够聚焦于其中的重要属性。线上部署时,利用NLP工具将用户输入关键词进行拆解。提升输入丰富度同时减少解码“迷失”。


通过该方式,有效提升生成结果多样性以及采纳率,采纳率由85%,提升至90%+。


长尾商品训练不足


众所周知,由于“头部效应”影响往往少数几个类目能够获取大量关注与流量,而运营同学更偏向于为大众化的品类创作文案。统计发现10%的头部类目如连衣裙、T恤等有充足文案数据, 占据训练样本的80%以上。而大量长尾商品存在训练数据少或基本无可用素材。导致模型无法学习该到该商品特定内容,模型生成的文案质量差。


我们通过结合商品父类目、规范类目属性提升模型泛化能力。如加入 商品关联一级类目、商品叶子类目属性等等。进一步提升长尾商品文案生成质量。


总结


在智能文案一期工作中,我们完成了智能文案生成项目从0至1的搭建工作,包括算法方案设计、离线模型搭建、二方服务部署、Tpp服务开发、算法优化迭代等等,整体项目顺利上线。从业务角度出发主要解决如下几个问题:


1.解决了Push文案生成多样性不足问题。通过模板生成和模型生成方式,提供大量优质生成文案。线上平均单个素材文案条数提升17%。辅助运营同学进行文案创作,降低人工创作成本。与用户一对一调研中反馈显示2/3用户采纳智能文案生成模块生成内容并应用于线上。


2.构建统一的文案管理和沉淀平台。智能文案生成模块使得历史的优秀文案及时反馈到在线文案创建环节,同时提供算法智能化的文案创意。


3.提升Push点击。文案生成线上AB实验结果显示,算法组相对提升10.16%。


智能文案生成V2.0-淘宝Push文案层


智能文案一期主要围绕辅助用户创作这一目标进行,在整体模块设计中主要关注营销类Push文案的生成,包括模板话术生成、关键字生成。这两个模块在项目上线后都取得了不错的成果,然而在深入推广过程中也遇到了很多困难。Push素材更新本身频率较低,虽然有智能文案生成模块这一创作利器,仍然无法全面调动用户更新积极性。另一方面,用户在使用智能文案生成模块辅助内容创作时,多数时候会对文案进行修改且不会主动反馈,这使得我们的埋点追踪变得愈加困难,没有正向反馈的生成模型优化迭代非常有限。同时,我们也发现在淘宝Push中存在大量商品个性化推荐素材,其发送量约占总体发送的60%以上。由于此类个性化素材商品池庞大,通常运营同学会配置简单模板作为Push文案。为了适应所有商品,这类模板通常是欢迎语+商品标题的形式,整体投放量大但吸引力不足、点击率低。如果能为这类商品推荐素材提供个性化内容生成能力,将会对提升Push点击率有极大帮助。且自有文案投放可以精确埋点,感知用户反馈,灵活优化模型。




带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(6) https://developer.aliyun.com/article/1246899?groupCode=taobaotech


相关文章
|
存储 缓存 负载均衡
Tair分布式缓存
Redis很好用,相比memcached多了很多数据结构,支持持久化。但是在很长一段时间里,原生是不支持分布式的。后来就出现了很多redis集群类产品,Tair是其中胜出的优秀作品之一。 所以Tair的特性都是一些集群的特性,比如:容错、解决单点故障、跨机房管理、多集群管理、支持副本等。总而言之,是redis的高可用版本。
2217 1
Tair分布式缓存
|
机器学习/深度学习 搜索推荐 算法
推荐系统离线评估方法和评估指标,以及在推荐服务器内部实现A/B测试和解决A/B测试资源紧张的方法。还介绍了如何在TensorFlow中进行模型离线评估实践。
推荐系统离线评估方法和评估指标,以及在推荐服务器内部实现A/B测试和解决A/B测试资源紧张的方法。还介绍了如何在TensorFlow中进行模型离线评估实践。
1103 0
|
NoSQL 网络协议 安全
第5期 MongoDB配置启动方式
MongoDB配置启动方式
1100 0
|
监控 容灾 Java
系统稳定性建设三件事
本文分享了作者学习稳定性工作、构建思路、落实方案,面对问题不断反思再推进的经验总结。
系统稳定性建设三件事
|
NoSQL 算法 Java
Java Redis多限流
通过本文的介绍,我们详细讲解了如何在Java中使用Redis实现三种不同的限流策略:固定窗口限流、滑动窗口限流和令牌桶算法。每种限流策略都有其适用的场景和特点,根据具体需求选择合适的限流策略可以有效保护系统资源和提高服务的稳定性。
500 18
|
新零售 安全 Linux
阿里巴巴正式开源自研容器技术Pouch
阿里巴巴正式开源了基于Apache 2.0协议的容器技术Pouch。Pouch是一款轻量级的容器技术,拥有快速高效、可移植性高、资源占用少等特性,主要帮助阿里更快的做到内部业务的交付,同时提高超大规模下数据中心的物理资源利用率。
8823 1
|
机器学习/深度学习 自然语言处理 监控
带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(8)
带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(8)
344 0
|
人工智能 监控 算法
打造算法在线服务领域极致开发体验与性能 — 阿里TPP图化框架技术实践
TPP图化致力于打造一个算法在线服务领域易用、性能极致、迭代效率远超普通方式的产品。本文将介绍TPP图化以及2021年在性能、开发体验上的改进,并介绍未来TPP图化的规划。
打造算法在线服务领域极致开发体验与性能 — 阿里TPP图化框架技术实践
|
自然语言处理 算法
带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(4)
带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(4)
268 0
|
自然语言处理
带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(3)
带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(3)
237 0

热门文章

最新文章