因果推断(三)各种效应和它们之间的关系:ATE、ATT、ATC、ITE、CATE、LATE

2023-10-07 04:40

本文主要是介绍因果推断(三)各种效应和它们之间的关系:ATE、ATT、ATC、ITE、CATE、LATE,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 1、思维导图
  • 2、效应
  • 3、ITE / ICE(Individual Treatment/Causal Effect)
  • 4、ATE / ACE(Average Treatment/Causal Effect)
  • 5、ATT / ATC(Average Treatment Effect on the Treated / Controlled)
  • 6、CATE (Conditional Average Treatment Effect)
  • 7、LATE (Local / Complier Average Treatment Effect)
  • 8、它们之间的关系?
  • 参考资料

1、思维导图

学习因果推断的时候,发现各种书籍和文献里出现了纷繁复杂的各种效应,已经傻傻分不清楚了!今天系统的整理下,后面如果有新的认知再修改和完善。
在这里插入图片描述

2、效应

用于评判干预与否的结果差异的指标。通过对各个研究对象干预与否的潜在结果的比较得出。

3、ITE / ICE(Individual Treatment/Causal Effect)

  1. 定义:对于同一个对象,处置和不处置的效应之差;
    τ i = Y i ( 1 ) − Y i ( 0 ) , i = 1 , . . . , N \tau_i = Y_i(1) - Y_i(0), i = 1, ..., N τi=Yi(1)Yi(0)i=1,...,N
  2. 特点:不可观测的 (unobservable);
  3. 举个例子:我们想知道对H同学而言,读博对她的收入有什么影响,那么我们需要知道读博后她的收入是多少,和不读博她的收入是多少,两者相减就可以得到 I T E ITE ITE。但是H同学不可能既读博,又不读博,所以我们说 I T E ITE ITE是不可观测的。

因此统计意义上,往往更关注总体的统计特征,即ATE。

4、ATE / ACE(Average Treatment/Causal Effect)

  1. 定义:假设所有对象都接受处置( X = 1 X=1 X=1)的平均结果是 E ( Y = 1 ) E(Y=1) E(Y=1),所有对象都接受对照( X = 0 X=0 X=0)的平均结果是 E ( Y = 0 ) E(Y=0) E(Y=0),那么:
    τ A T E = E [ I T E ] = E [ Y i ( 1 ) − Y i ( 0 ) ] = E [ Y i ( 1 ) ] − E [ Y i ( 0 ) ] \tau^{ATE} = E[ITE] = E[Y_i(1)-Y_i(0)]=E[Y_i(1)]-E[Y_i(0)] τATE=E[ITE]=E[Yi(1)Yi(0)]=E[Yi(1)]E[Yi(0)]
  2. 特点:关注所有对象的平均水平;可以通过随机对照试验(RCT: Randomlized Controlled Trial)获得,也就是:
    τ A T E = E [ Y ∣ X = 1 ] − E [ Y ∣ X = 0 ] \tau^{ATE} =E[Y|X=1] - E[Y|X=0] τATE=E[YX=1]E[YX=0]
    公式中不再含有潜在结果变量 Y i ( 1 ) Y_i(1) Yi(1) Y i ( 0 ) Y_i(0) Yi(0)
  3. 举个例子:我们想知道读博对薪酬的影响,我们计算所有读博同学的收入和未读博这同学的收入差,即为 A T E ATE ATE

这里经常会出现问题,就是读博的同学和未读博的同学,可能本身条件就有很大的差异,那这里的 A T T ATT ATT就出场了,帮助控制一些混杂变量。

5、ATT / ATC(Average Treatment Effect on the Treated / Controlled)

  1. 定义:受处理/不受处理对象的平均处理效应;
    τ A T T = E [ Y i ( 1 ) − Y i ( 0 ) ∣ Z i = 1 ] , τ A T C = E [ Y i ( 1 ) − Y i ( 0 ) ∣ Z i = 0 ] \tau^{ATT} =E[Y_i(1)-Y_i(0)|Z_i=1], \tau^{ATC} =E[Y_i(1)-Y_i(0)|Z_i=0] τATT=E[Yi(1)Yi(0)Zi=1],τATC=E[Yi(1)Yi(0)Zi=0]
  2. 特点:关注一部分对象(处置的或未被处置的);
  3. 举个例子:上例中,所有读博同学揪出来,如果这些人没有读博,他们的收入会是什么水平呢?那只能在没有读博的人里面找到各方面条件都跟他们十分匹配的样本,然后两者的收入差异就是 A T T ATT ATT啦!

6、CATE (Conditional Average Treatment Effect)

  1. 定义:总体中某一个组别内的平均处置效应;
    τ C A T E = E [ Y i ( 1 ) − Y i ( 0 ) ∣ X = x ] , \tau^{CATE} =E[Y_i(1)-Y_i(0)|X=x], τCATE=E[Yi(1)Yi(0)X=x],
  2. 特点
  3. 举个例子:比如我们想知道投放广告对转化率的影响有多大。这个时候,可能会首先根据用户画像,将所有用户分成不同的组别,然后在各个组别内部,去计算广告投放对这个组别内人群的转化的提升效果,这就是所谓的 C A T E CATE CATE啦!

可以看到CATE和ATT上有一点点相似,一个是对『动作』做了分组后计算的处置效应,一个是对『对象』分组后做的处置效应。

7、LATE (Local / Complier Average Treatment Effect)

这个稍微复杂点:

  1. 定义:LATE就是compliers的ATE。什么是compliers?在随机试验中,根据施加treatmen和实际treatmen的不同,可以分为4种人群:
  • always takers:无论在treatment组还是在control组,都能够获得treatment;(一般认为不存在)
  • never takers:无论在treatment组还是在control组,都不能够获得treatment;
  • compliers:在treatment组一定会获得treatment,在control组则一定不会获得treatment;
  • defiers:在treatment不会获得treatment,在control组则会获得treatment;(一般认为不存在)
    《Regression discontinuity designs: A guide to practice》这篇论文里有对这四者的一些解释。

我们一般计算的ATE是针对never takers和compliers的,而LATE要计算的对象则是compliers。

这个的计算和比较复杂。未来要用的时候再来补吧!

8、它们之间的关系?

挨个讲完了各种效应的含义,那么各种效应之间从数学推导上看有什么关系呢?目前我学习到的主要有下面几种:

  1. A T E ATE ATE I T E ITE ITE的关系,这个是最好理解的:
    A T E = E [ I T E ] = 1 N i ∑ i I T E i ATE = E[ITE] = \frac{1}{N_i}\sum_iITE_i ATE=E[ITE]=Ni1iITEi
  2. A T T ATT ATT I T E ITE ITE的关系:
    A T E = E [ I T E ] = 1 N i ∑ i : T i = 1 I T E i ATE = E[ITE] = \frac{1}{N_i}\sum_{i: T_i=1}ITE_i ATE=E[ITE]=Ni1i:Ti=1ITEi
  3. C A T E CATE CATE I T E ITE ITE的关系:
    A T E = E [ I T E ] = 1 N i ∑ i : X i = 1 I T E i ATE = E[ITE] = \frac{1}{N_i}\sum_{i: X_i=1}ITE_i ATE=E[ITE]=Ni1i:Xi=1ITEi

参考资料

[1] Why moving from ITE to ATE
[2] 马忠贵, 徐晓晗, 刘雪儿. 因果推断三种分析框架及其应用综述[J]. 工程科学学报, 2022, 44(7): 1231-1243. doi: 10.13374/j.issn2095-9389.2021.07.04.002.
[3] 聊一聊因果推断中的ATT、ITE、ATE和CATE
[4] 快速理解因果推断的LATE问题
[5] Yao L , Chu Z , Li S ,et al.A Survey on Causal Inference[J]. 2020.DOI:10.48550/arXiv.2002.02770.

这篇关于因果推断(三)各种效应和它们之间的关系:ATE、ATT、ATC、ITE、CATE、LATE的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/156091

相关文章

Tomcat版本与Java版本的关系及说明

《Tomcat版本与Java版本的关系及说明》:本文主要介绍Tomcat版本与Java版本的关系及说明,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Tomcat版本与Java版本的关系Tomcat历史版本对应的Java版本Tomcat支持哪些版本的pythonJ

Vue中组件之间传值的六种方式(完整版)

《Vue中组件之间传值的六种方式(完整版)》组件是vue.js最强大的功能之一,而组件实例的作用域是相互独立的,这就意味着不同组件之间的数据无法相互引用,针对不同的使用场景,如何选择行之有效的通信方式... 目录前言方法一、props/$emit1.父组件向子组件传值2.子组件向父组件传值(通过事件形式)方

Python实现PDF与多种图片格式之间互转(PNG, JPG, BMP, EMF, SVG)

《Python实现PDF与多种图片格式之间互转(PNG,JPG,BMP,EMF,SVG)》PDF和图片是我们日常生活和工作中常用的文件格式,有时候,我们可能需要将PDF和图片进行格式互转来满足... 目录一、介绍二、安装python库三、Python实现多种图片格式转PDF1、单张图片转换为PDF2、多张图

Java对象和JSON字符串之间的转换方法(全网最清晰)

《Java对象和JSON字符串之间的转换方法(全网最清晰)》:本文主要介绍如何在Java中使用Jackson库将对象转换为JSON字符串,并提供了一个简单的工具类示例,该工具类支持基本的转换功能,... 目录前言1. 引入 Jackson 依赖2. 创建 jsON 工具类3. 使用示例转换 Java 对象为

python安装whl包并解决依赖关系的实现

《python安装whl包并解决依赖关系的实现》本文主要介绍了python安装whl包并解决依赖关系的实现,文中通过图文示例介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 目录一、什么是whl文件?二、我们为什么需要使用whl文件来安装python库?三、我们应该去哪儿下

java父子线程之间实现共享传递数据

《java父子线程之间实现共享传递数据》本文介绍了Java中父子线程间共享传递数据的几种方法,包括ThreadLocal变量、并发集合和内存队列或消息队列,并提醒注意并发安全问题... 目录通过 ThreadLocal 变量共享数据通过并发集合共享数据通过内存队列或消息队列共享数据注意并发安全问题总结在 J

Java文件与Base64之间的转化方式

《Java文件与Base64之间的转化方式》这篇文章介绍了如何使用Java将文件(如图片、视频)转换为Base64编码,以及如何将Base64编码转换回文件,通过提供具体的工具类实现,作者希望帮助读者... 目录Java文件与Base64之间的转化1、文件转Base64工具类2、Base64转文件工具类3、

MYSQL关联关系查询方式

《MYSQL关联关系查询方式》文章详细介绍了MySQL中如何使用内连接和左外连接进行表的关联查询,并展示了如何选择列和使用别名,文章还提供了一些关于查询优化的建议,并鼓励读者参考和支持脚本之家... 目录mysql关联关系查询关联关系查询这个查询做了以下几件事MySQL自关联查询总结MYSQL关联关系查询

day-51 合并零之间的节点

思路 直接遍历链表即可,遇到val=0跳过,val非零则加在一起,最后返回即可 解题过程 返回链表可以有头结点,方便插入,返回head.next Code /*** Definition for singly-linked list.* public class ListNode {* int val;* ListNode next;* ListNode() {}*

POJ1269 判断2条直线的位置关系

题目大意:给两个点能够确定一条直线,题目给出两条直线(由4个点确定),要求判断出这两条直线的关系:平行,同线,相交。如果相交还要求出交点坐标。 解题思路: 先判断两条直线p1p2, q1q2是否共线, 如果不是,再判断 直线 是否平行, 如果还不是, 则两直线相交。  判断共线:  p1p2q1 共线 且 p1p2q2 共线 ,共线用叉乘为 0  来判断,  判断 平行:  p1p