带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(7)

简介: 带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(7)

带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(6) https://developer.aliyun.com/article/1246899?groupCode=taobaotech



文案内容排序与商品推荐排序任务类似,都是对单一候选序列经过特征工程、模型构建拟合样本分布预测是否点击该Push。因此文案排序可以抽象为文案点击率预估模型,以曝光的文案内容、商品基本信息、用户信息为输入样本,预测目标为用户是否点击。商品推荐排序关注商品本身以及端内用户与商品交互信息,而文案排序阶段已有明确投放目标,因此文案优选层更关注当前内容的文风是否符合用户偏好以及是否突出用户关注“卖点”。以下列用户浏览商品轨迹为例:


1. 【旗舰店】森海塞尔MOMENTUM真无线二代主动降噪蓝牙耳机官网

2. sony索尼wf1000xm4真无线蓝牙主动降噪耳机入耳式降噪豆1000xm3

3. B&O Beoplay EQ真无线蓝牙主动消噪耳机入耳式运动耳塞bo降噪豆eq

4. Bose博士消噪耳塞真无线蓝牙降噪耳机麦主动降噪运动耳机大鲨鱼鳍

5. .....


可以看到该用户浏览的商品中均出现了“降噪”属性,如果模型能够学习到用户这一偏好,选择突出该“卖点”的文案曝光,对吸引用户点击一定有提升作用。因此我们在设计模型时主要考虑用户文案风格偏好、“卖点”偏好信息的提取。模型输入特征由三部分组成:


1. 商品基础特征,主要是商品一级类目、二级类目、叶子类目、商品标题内容切分等等。

2. 文案特征,主要由文案内容切分、文案来源、关键属性信息等等组成,

3. 用户特征,由一般社会学统计特征、用户端内行为特征、长短期类目偏好特征、浏览行为序列组成。这里用户浏览序列特征与一般构造商品浏览序列不同,序列内部主要突出商品文案以及属性信息。模型主体结构如下:


image.png


为了提升模型捕获文案风格信息的能力,我们在base结构基础上加入了文案self-Attention结构,并通过用户的浏览商品的文案属性序列增强模型对Push场景下用户个性化偏好信息以及场景上下文信息的学习。同时,其他诸如商

品基础类目信息、用户偏置信息映射为Embeddding向量一并拼接到模型输入。


小结


本节从智能文案生成项目一期上线后遇到的种种困难出发,阐述了我们从智能文案生成模块升级到淘宝Push文案层链路所做的一系列工作,并重点叙述了我们在文案层链路设计、数据处理模块升级、物料库建设、排序模型优化探索等等几个重要节点的工作细节。文案层链路建设促进了淘宝Push整体商品个性化文案质量提升,取得线上点击率效果平均提升10.03%的成果。


带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(8) https://developer.aliyun.com/article/1246897?groupCode=taobaotech

相关文章
|
数据挖掘 数据处理 索引
数据分析必知必会 | TGI指数分析实战
TGI指数,全称Target Group Index,可以反映目标群体在特定研究范围内强势或者弱势。
3301 0
数据分析必知必会 | TGI指数分析实战
fbh
|
Web App开发 缓存 Linux
Chrome浏览器强制刷新页面(不使用缓存)
在Chrome浏览器中按下F5或 Ctrl+F5 都没用,Chrome总是会强制使用页面缓存进行刷新,如何不使用页面缓存进行刷新? Chrome官方推荐使用如下快捷键,就可以不使用页面缓存进行刷新 Windows和Linu...
fbh
11034 0
|
机器学习/深度学习 算法 Serverless
基于WOA-SVM的乳腺癌数据分类识别算法matlab仿真,对比BP神经网络和SVM
本项目利用鲸鱼优化算法(WOA)优化支持向量机(SVM)参数,针对乳腺癌早期诊断问题,通过MATLAB 2022a实现。核心代码包括参数初始化、目标函数计算、位置更新等步骤,并附有详细中文注释及操作视频。实验结果显示,WOA-SVM在提高分类精度和泛化能力方面表现出色,为乳腺癌的早期诊断提供了有效的技术支持。
|
机器学习/深度学习 算法 前端开发
公开下载 |《2022技术人的百宝黑皮书》来了!
大淘宝技术2022一整年干货合集,你今年错过的知识和分享,还来得及补救。
1525 0
公开下载 |《2022技术人的百宝黑皮书》来了!
|
JSON API 数据安全/隐私保护
python小知识-数据验证和解析神器pydantic
Pydantic是一个Python库,用于数据验证和设置管理,基于类型提示提供数据模型验证。它可以用于用户输入验证、JSON序列化和解析,以及API交互中的数据校验。安装Pydantic可使用`pip install -U pydantic`或`conda install pydantic -c conda-forge`。通过定义BaseModel子类并使用Field进行约束,可以创建数据模型并进行验证。例如,定义User模型验证用户名、邮箱和年龄。Pydantic还支持自定义验证器,允许在字段赋值时执行特定逻辑,如密码强度检查和哈希处理。5月更文挑战第19天
1731 1
|
网络协议 前端开发 数据安全/隐私保护
技术笔记:SOCKS5协议解析
技术笔记:SOCKS5协议解析
764 0
|
人工智能 自然语言处理 搜索推荐
|
机器学习/深度学习 自然语言处理 监控
带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(8)
带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(8)
344 0
|
定位技术 Python
Python根据经纬度在地图上显示(folium)
Python根据经纬度在地图上显示(folium)
913 0
Python根据经纬度在地图上显示(folium)
|
自然语言处理 算法 搜索推荐
带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(6)
带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(6)
424 0

热门文章

最新文章