带你读《2022技术人的百宝黑皮书》——倾向得分匹配（PSM）的原理以及应用(1)-阿里云开发者社区

带你读《2022技术人的百宝黑皮书》——倾向得分匹配（PSM）的原理以及应用(1)

2023-06-07 443

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 带你读《2022技术人的百宝黑皮书》——倾向得分匹配（PSM）的原理以及应用(1)

作者：八卜

出品：大淘宝技术

该文章主要介绍倾向得分匹配（PSM, Propensity Score Matching）方法的原理以及实现。这是一种理论稍微复杂、但实现较为容易的分析方法，适合非算法同学的使用。可用于（基于观察数据的）AB实验、增量模型搭建等领域。

文章主要分为四部分：前置知识（因果推断）介绍、倾向得分计算与匹配与匹配质量检验、匹配示例与增量计算还有一些补充的小知识点。对因果推断有简单了解的同学可以跳过第一部分，直接从第二节开始阅读。

前置知识介绍

对因果推断概念有所了解或想直接学习PSM的同学可跳过这一节。

概念一：干预效果 Treatment Effect

干预效果（Treatment Effect）：干预下的潜在结果减去未干预时的潜在结果（Rubin框架），即：

其中表示潜在结果，1和0代表是否受到干预。

举个例子：我们想知道我养狗给我提升了多少幸福度，理想情况下就是用我养狗时的幸福度减去我不养狗时的幸福度。

概念二：ATT Average Treatment Effect on the Treated

相较于个人的干预效果，我们更希望了解人群整体的干预效果，毕竟我们通常用策略干预的是一个人群。

应用PSM，我们通常希望计算得到被干预的用户的平均干预效果，即ATT（average treatment effect on the treated），即

其中变量代表是否收到干预。

可以看到代表被干预的用户假如不被干预的情况下的潜在结果，是一个无法观测的数值。倘若可以建立AB测试，我们可以利用对照组得到该结果，在无法进行AB测试的情况（例如是一个主动的行为）我们可以

通过PSM拟合一个虚拟的对照组进行计算。

带你读《2022技术人的百宝黑皮书》——倾向得分匹配（PSM）的原理以及应用(2) https://developer.aliyun.com/article/1243259?groupCode=taobaotech

文章标签：

算法

带你读《2022技术人的百宝黑皮书》——倾向得分匹配（PSM）的原理以及应用(1)

大淘宝技术

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

带你读《2022技术人的百宝黑皮书》——倾向得分匹配（PSM）的原理以及应用(1)

大淘宝技术

热门文章

最新文章

相关电子书