带你读《2022技术人的百宝黑皮书》——倾向得分匹配(PSM)的原理以及应用(7)

简介: 带你读《2022技术人的百宝黑皮书》——倾向得分匹配(PSM)的原理以及应用(7)

带你读《2022技术人的百宝黑皮书》——倾向得分匹配(PSM)的原理以及应用(6) https://developer.aliyun.com/article/1243254?groupCode=taobaotech




其他值得一提的点


ATT与ATE的区别


1. ATE:average treatment effect

2. ATT:average treatment effect on the treated


可以认为ATE是人群整体的干预增量效果,而ATT是实际被干预人群的干预增量效果。通常我们通过PSM+DID计算的是ATT,因为ATE还会涉及人群的干预率。更详细的解释可以参考stackexchange上的这个回答:


https://stats.stackexchange.com/questions/308397/why-is-average-treatment-effect-different from-average-treatment-effect-on-the-t


Bias与Variance


在匹配算法的步骤,我们有提到bias与varianc:


1. Bias 偏差:期望预测与真实结果之间的偏离程度,刻画算法本身的拟合能力

2. Variance 方差:同样大小训练集的变动所导致的学习性能变化,刻画数据扰动所造成的影响


可以认为bias代表算法本身的拟合能力而variance代表算法的稳定性,在匹配的不同方法中它们也存在trade-offs:


image.png


敏感性测试 Sensitivity Analysis


在前置知识介绍的部分有提到,做PSM需要满足两个假设——条件独立和共支撑。


对于第一个条件,其含义便是我们需要观测到所有同时影响到treatment和outcome的特征,否则估算的ATT会存在偏差。对于common support,我们实际上计算的是倾向得分重叠区域的ATT,其实际上也可能是有偏的。在这种情况下,我们需要去进行sensitivity analysis。换句话说,我们计算得到的增量结果其实是不稳健的,我们可以通过纳入不确定性的来估算一个ATT的区间,使之稳定性得到提升。




带你读《2022技术人的百宝黑皮书》——倾向得分匹配(PSM)的原理以及应用(8) https://developer.aliyun.com/article/1243251?groupCode=taobaotech

相关文章
|
Python
dataframe添加一新列
dataframe添加一新列
2671 2
|
25天前
|
存储 人工智能 监控
构建AI智能体:三十二、LangChain智能体:打造会使用工具(Tools)、有记忆(Memory)的AI助手
文章摘要:本文系统介绍了LangChain框架的核心组件与工作机制。LangChain是一个为大语言模型应用开发设计的开源框架,包含模型层、提示管理、处理链、记忆系统和代理机制五大核心组件。重点分析了Tools系统、Memory系统和ReAct框架的协同工作机制:Tools扩展模型能力,Memory存储对话历史,ReAct框架实现智能推理与行动决策。通过多工具智能体示例,展示了三者如何协同完成复杂任务(如计算年龄平方根、网页内容提取等)。
272 1
|
5月前
|
SQL XML Java
MyBatis Mapper中使用limit参数的查询问题
总结而言,MyBatis中使用 `limit`参数的查询可以高度定制并且灵活,基于方法签名和XML映射文件的组合来达成多样化的查询需求。通过参数化查询和动态SQL,MyBatis可以有效地处理各种复杂情境下的数据库操作,并且将SQL语句的维护与业务代码的编写相分离,提升代码的可维护性和可阅读性。
511 13
|
10月前
|
监控 数据可视化 搜索推荐
营销人必看:复盘工具选对,效率直接翻倍
营销活动的结束并非任务的终点,而是优化的起点。复盘作为营销闭环中的关键环节,旨在总结经验、发现问题,并为后续策略提供数据支撑和方向指引。本文系统解析了如何高效完成有价值的复盘,涵盖目标回顾、数据拆解、策略优化及团队协作等方面,助力营销能力持续升级。通过明确复盘的核心价值(数据沉淀、策略校准、团队共识),避免常见误区,确保复盘真正推动营销进化,构建可持续的增长飞轮。
657 12
|
机器学习/深度学习 算法
深度学习之因果发现算法
基于深度学习的因果发现算法是一个旨在从复杂数据中自动挖掘变量之间潜在因果关系的研究领域。它结合了传统因果推理方法与深度学习的强大特征提取能力,帮助应对高维、非线性数据中的因果结构发现。
1109 9
|
人工智能 算法 双11
公开下载 |《2023技术人的百宝黑皮书》来了!
公开下载 |《2023技术人的百宝黑皮书》来了!
812 3
|
人工智能 编解码 安全
【最新】Sora到底是什么?Sora详解:一文带你熟悉Sora
《Sora详解:一文带你熟悉Sora,以及Sora新手小白使用教程》是一篇深入介绍OpenAI最新文本生成视频大模型Sora的文章。它探讨了Sora的定义、功能和使用方法,为读者提供了全面了解和上手Sora的指南。这篇文章旨在帮助新手快速掌握Sora,并展示其在视频创作领域的潜力。
818 0
【最新】Sora到底是什么?Sora详解:一文带你熟悉Sora
|
Python
【Pandas】Pandas的DataFrame按行插入list数据或者读取一行并存为csv文件
本文提供了使用Pandas库对DataFrame进行操作的示例代码。
840 0
|
Java 数据库 Spring
Spring 事务 (编程式 & 声明式, Spring 事务传播机制)
Spring 事务 (编程式 & 声明式, Spring 事务传播机制)
186 1
|
vr&ar
编译原理----算符优先级的分析(自底向上)
编译原理----算符优先级的分析(自底向上)
370 4