为了验证算法的准确性、帮助用户更好的使用EasyRec,我们做了大量的benchmark测试。我们还提供公开数据集、EasyRec配置文件,供用户更好的理解和使用EasyRec。
单目标数据集
Taobao 数据集介绍
- 该数据集是淘宝展示广告点击率预估数据集,包含用户、广告特征和行为日志。天池比赛链接
- 训练数据表:pai_online_project.easyrec_demo_taobao_train_data
- 测试数据表:pai_online_project.easyrec_demo_taobao_test_data
- 在PAI上面测试使用的资源包括2个parameter server,9个worker,其中一个worker做评估:
{"ps":{"count":2,
"cpu":1000,
"memory":40000},
"worker":{"count":9,
"cpu":1000,
"memory":40000}
}
- 测试结果
model | global_step | best_auc | config |
MultiTower | 1800 | 0.614680 | taobao_mutiltower.config |
DIN | 1600 | 0.617049 | din.config |
DeepFM | 1600 | 0.580521 | deepfm.config |
DCN | 1500 | 0.596816 | dcn.config |
BST | 3500 | 0.566251 | bst.config |
AutoInt | 700 | 0.605982 | autoint.config |
Avazu CTR 数据集
- 该数据集是DSP广告公司Avazu在Kaggle平台举办的移动广告点击率预测模型挑战赛中使用的。Click-Through Rate Prediction比赛链接
- 训练数据表:pai_online_project.dwd_avazu_ctr_deepmodel_train
- 测试数据表:pai_online_project.dwd_avazu_ctr_deepmodel_test
多目标数据集
AliCCP 数据集
- 数据集采集自手机淘宝移动客户端的推荐系统日志,其中包含点击和与之关联的转化数据。天池比赛链接
- 训练数据表:pai_online_project.aliccp_sample_train_kv_split_score
- 测试数据表:pai_online_project.aliccp_sample_test_kv_split_score_1000w (只截取了1000万条)
- 在PAI上面测试使用的资源包括2个parameter server,9个worker,其中一个worker做评估:
{"ps":{"count":2,
"cpu":1000,
"memory":40000},
"worker":{"count":9,
"cpu":1000,
"memory":40000}
}
- 测试结果
model | global_step | ctr auc | masked cvr auc | ctcvr auc | 训练时间 | config |
SimpleMultiTask | 4100 | 0.592606 | 0.6306802 | 1小时 | simple_multi_task.config | |
MMoE | 3100 | 0.5869702 | 0.6330008 | 1小时 | mmoe.config | |
ESMM | 800 | 0.5974812 | 0.6841141 | 0.6362526 | 3小时 | esmm.config |
PLE | 3200 | 0.5874 | 0.6159 | 2小时 | ple.config |
CENSUS
- CENSUS有48842个样本数据,每个样本14个属性,包括age, occupation, education, income等。样本的标注值为收入水平,例如>50K、<=50K。Census Income数据集链接
- 训练数据表:pai_online_project.census_income_train
- 测试数据表:pai_online_project.census_income_test