带你读《2022技术人的百宝黑皮书》——倾向得分匹配(PSM)的原理以及应用(7)

简介: 带你读《2022技术人的百宝黑皮书》——倾向得分匹配(PSM)的原理以及应用(7)

带你读《2022技术人的百宝黑皮书》——倾向得分匹配(PSM)的原理以及应用(6) https://developer.aliyun.com/article/1243254?groupCode=taobaotech




其他值得一提的点


ATT与ATE的区别


1. ATE:average treatment effect

2. ATT:average treatment effect on the treated


可以认为ATE是人群整体的干预增量效果,而ATT是实际被干预人群的干预增量效果。通常我们通过PSM+DID计算的是ATT,因为ATE还会涉及人群的干预率。更详细的解释可以参考stackexchange上的这个回答:


https://stats.stackexchange.com/questions/308397/why-is-average-treatment-effect-different from-average-treatment-effect-on-the-t


Bias与Variance


在匹配算法的步骤,我们有提到bias与varianc:


1. Bias 偏差:期望预测与真实结果之间的偏离程度,刻画算法本身的拟合能力

2. Variance 方差:同样大小训练集的变动所导致的学习性能变化,刻画数据扰动所造成的影响


可以认为bias代表算法本身的拟合能力而variance代表算法的稳定性,在匹配的不同方法中它们也存在trade-offs:


image.png


敏感性测试 Sensitivity Analysis


在前置知识介绍的部分有提到,做PSM需要满足两个假设——条件独立和共支撑。


对于第一个条件,其含义便是我们需要观测到所有同时影响到treatment和outcome的特征,否则估算的ATT会存在偏差。对于common support,我们实际上计算的是倾向得分重叠区域的ATT,其实际上也可能是有偏的。在这种情况下,我们需要去进行sensitivity analysis。换句话说,我们计算得到的增量结果其实是不稳健的,我们可以通过纳入不确定性的来估算一个ATT的区间,使之稳定性得到提升。




带你读《2022技术人的百宝黑皮书》——倾向得分匹配(PSM)的原理以及应用(8) https://developer.aliyun.com/article/1243251?groupCode=taobaotech

相关文章
|
Python
dataframe添加一新列
dataframe添加一新列
2798 2
|
5月前
|
人工智能 并行计算 算法
为什么 OpenSearch 向量检索能提速 13 倍?
本文介绍在最新的 OpenSearch 实践中,引入 GPU 并行计算能力 与 NN-Descent 索引构建算法,成功将亿级数据规模下的向量索引构建速度提升至原来的 13 倍。
812 25
为什么 OpenSearch 向量检索能提速 13 倍?
|
7月前
|
数据采集 数据库 索引
新闻网站的数据采集与更新思路
该方案设计了一个跨站点的增量更新引擎,用于高效采集央视新闻、中国新闻网和环球网等多源新闻数据。通过代理IP和内容哈希签名技术,实现新闻的新增与更新检测,大幅降低冗余抓取和带宽消耗。实验表明,该方法在多源新闻采集中具备高效性和实用性,可拓展为行业级舆情雷达系统,支持事件追踪与趋势分析。
401 2
新闻网站的数据采集与更新思路
|
9月前
|
SQL XML Java
MyBatis Mapper中使用limit参数的查询问题
总结而言,MyBatis中使用 `limit`参数的查询可以高度定制并且灵活,基于方法签名和XML映射文件的组合来达成多样化的查询需求。通过参数化查询和动态SQL,MyBatis可以有效地处理各种复杂情境下的数据库操作,并且将SQL语句的维护与业务代码的编写相分离,提升代码的可维护性和可阅读性。
742 13
|
人工智能 API
MMedAgent:专为医疗领域设计的多模态 AI 智能体,支持医学影像处理、报告生成等多种医疗任务
MMedAgent 是专为医疗领域设计的多模态AI智能体,支持多种医疗任务,包括医学影像处理、报告生成等,性能优于现有开源方法。
796 19
MMedAgent:专为医疗领域设计的多模态 AI 智能体,支持医学影像处理、报告生成等多种医疗任务
|
人工智能 算法 双11
公开下载 |《2023技术人的百宝黑皮书》来了!
公开下载 |《2023技术人的百宝黑皮书》来了!
965 3
|
人工智能 编解码 安全
【最新】Sora到底是什么?Sora详解:一文带你熟悉Sora
《Sora详解:一文带你熟悉Sora,以及Sora新手小白使用教程》是一篇深入介绍OpenAI最新文本生成视频大模型Sora的文章。它探讨了Sora的定义、功能和使用方法,为读者提供了全面了解和上手Sora的指南。这篇文章旨在帮助新手快速掌握Sora,并展示其在视频创作领域的潜力。
978 0
【最新】Sora到底是什么?Sora详解:一文带你熟悉Sora
|
自动驾驶 安全 物联网
2G、3G、4G与5G技术:主要区别详解
2G、3G、4G与5G技术:主要区别详解
8645 14
|
Python
【Pandas】Pandas的DataFrame按行插入list数据或者读取一行并存为csv文件
本文提供了使用Pandas库对DataFrame进行操作的示例代码。
1025 0
|
开发工具 git
【看这一篇就够了】如何删除gitHub仓库中的文件
【看这一篇就够了】如何删除gitHub仓库中的文件

热门文章

最新文章