因果推断(三)各种效应和它们之间的关系:ATE、ATT、ATC、ITE、CATE、LATE

2023-10-07 04:40

本文主要是介绍因果推断(三)各种效应和它们之间的关系:ATE、ATT、ATC、ITE、CATE、LATE,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 1、思维导图
  • 2、效应
  • 3、ITE / ICE(Individual Treatment/Causal Effect)
  • 4、ATE / ACE(Average Treatment/Causal Effect)
  • 5、ATT / ATC(Average Treatment Effect on the Treated / Controlled)
  • 6、CATE (Conditional Average Treatment Effect)
  • 7、LATE (Local / Complier Average Treatment Effect)
  • 8、它们之间的关系?
  • 参考资料

1、思维导图

学习因果推断的时候,发现各种书籍和文献里出现了纷繁复杂的各种效应,已经傻傻分不清楚了!今天系统的整理下,后面如果有新的认知再修改和完善。
在这里插入图片描述

2、效应

用于评判干预与否的结果差异的指标。通过对各个研究对象干预与否的潜在结果的比较得出。

3、ITE / ICE(Individual Treatment/Causal Effect)

  1. 定义:对于同一个对象,处置和不处置的效应之差;
    τ i = Y i ( 1 ) − Y i ( 0 ) , i = 1 , . . . , N \tau_i = Y_i(1) - Y_i(0), i = 1, ..., N τi=Yi(1)Yi(0)i=1,...,N
  2. 特点:不可观测的 (unobservable);
  3. 举个例子:我们想知道对H同学而言,读博对她的收入有什么影响,那么我们需要知道读博后她的收入是多少,和不读博她的收入是多少,两者相减就可以得到 I T E ITE ITE。但是H同学不可能既读博,又不读博,所以我们说 I T E ITE ITE是不可观测的。

因此统计意义上,往往更关注总体的统计特征,即ATE。

4、ATE / ACE(Average Treatment/Causal Effect)

  1. 定义:假设所有对象都接受处置( X = 1 X=1 X=1)的平均结果是 E ( Y = 1 ) E(Y=1) E(Y=1),所有对象都接受对照( X = 0 X=0 X=0)的平均结果是 E ( Y = 0 ) E(Y=0) E(Y=0),那么:
    τ A T E = E [ I T E ] = E [ Y i ( 1 ) − Y i ( 0 ) ] = E [ Y i ( 1 ) ] − E [ Y i ( 0 ) ] \tau^{ATE} = E[ITE] = E[Y_i(1)-Y_i(0)]=E[Y_i(1)]-E[Y_i(0)] τATE=E[ITE]=E[Yi(1)Yi(0)]=E[Yi(1)]E[Yi(0)]
  2. 特点:关注所有对象的平均水平;可以通过随机对照试验(RCT: Randomlized Controlled Trial)获得,也就是:
    τ A T E = E [ Y ∣ X = 1 ] − E [ Y ∣ X = 0 ] \tau^{ATE} =E[Y|X=1] - E[Y|X=0] τATE=E[YX=1]E[YX=0]
    公式中不再含有潜在结果变量 Y i ( 1 ) Y_i(1) Yi(1) Y i ( 0 ) Y_i(0) Yi(0)
  3. 举个例子:我们想知道读博对薪酬的影响,我们计算所有读博同学的收入和未读博这同学的收入差,即为 A T E ATE ATE

这里经常会出现问题,就是读博的同学和未读博的同学,可能本身条件就有很大的差异,那这里的 A T T ATT ATT就出场了,帮助控制一些混杂变量。

5、ATT / ATC(Average Treatment Effect on the Treated / Controlled)

  1. 定义:受处理/不受处理对象的平均处理效应;
    τ A T T = E [ Y i ( 1 ) − Y i ( 0 ) ∣ Z i = 1 ] , τ A T C = E [ Y i ( 1 ) − Y i ( 0 ) ∣ Z i = 0 ] \tau^{ATT} =E[Y_i(1)-Y_i(0)|Z_i=1], \tau^{ATC} =E[Y_i(1)-Y_i(0)|Z_i=0] τATT=E[Yi(1)Yi(0)Zi=1],τATC=E[Yi(1)Yi(0)Zi=0]
  2. 特点:关注一部分对象(处置的或未被处置的);
  3. 举个例子:上例中,所有读博同学揪出来,如果这些人没有读博,他们的收入会是什么水平呢?那只能在没有读博的人里面找到各方面条件都跟他们十分匹配的样本,然后两者的收入差异就是 A T T ATT ATT啦!

6、CATE (Conditional Average Treatment Effect)

  1. 定义:总体中某一个组别内的平均处置效应;
    τ C A T E = E [ Y i ( 1 ) − Y i ( 0 ) ∣ X = x ] , \tau^{CATE} =E[Y_i(1)-Y_i(0)|X=x], τCATE=E[Yi(1)Yi(0)X=x],
  2. 特点
  3. 举个例子:比如我们想知道投放广告对转化率的影响有多大。这个时候,可能会首先根据用户画像,将所有用户分成不同的组别,然后在各个组别内部,去计算广告投放对这个组别内人群的转化的提升效果,这就是所谓的 C A T E CATE CATE啦!

可以看到CATE和ATT上有一点点相似,一个是对『动作』做了分组后计算的处置效应,一个是对『对象』分组后做的处置效应。

7、LATE (Local / Complier Average Treatment Effect)

这个稍微复杂点:

  1. 定义:LATE就是compliers的ATE。什么是compliers?在随机试验中,根据施加treatmen和实际treatmen的不同,可以分为4种人群:
  • always takers:无论在treatment组还是在control组,都能够获得treatment;(一般认为不存在)
  • never takers:无论在treatment组还是在control组,都不能够获得treatment;
  • compliers:在treatment组一定会获得treatment,在control组则一定不会获得treatment;
  • defiers:在treatment不会获得treatment,在control组则会获得treatment;(一般认为不存在)
    《Regression discontinuity designs: A guide to practice》这篇论文里有对这四者的一些解释。

我们一般计算的ATE是针对never takers和compliers的,而LATE要计算的对象则是compliers。

这个的计算和比较复杂。未来要用的时候再来补吧!

8、它们之间的关系?

挨个讲完了各种效应的含义,那么各种效应之间从数学推导上看有什么关系呢?目前我学习到的主要有下面几种:

  1. A T E ATE ATE I T E ITE ITE的关系,这个是最好理解的:
    A T E = E [ I T E ] = 1 N i ∑ i I T E i ATE = E[ITE] = \frac{1}{N_i}\sum_iITE_i ATE=E[ITE]=Ni1iITEi
  2. A T T ATT ATT I T E ITE ITE的关系:
    A T E = E [ I T E ] = 1 N i ∑ i : T i = 1 I T E i ATE = E[ITE] = \frac{1}{N_i}\sum_{i: T_i=1}ITE_i ATE=E[ITE]=Ni1i:Ti=1ITEi
  3. C A T E CATE CATE I T E ITE ITE的关系:
    A T E = E [ I T E ] = 1 N i ∑ i : X i = 1 I T E i ATE = E[ITE] = \frac{1}{N_i}\sum_{i: X_i=1}ITE_i ATE=E[ITE]=Ni1i:Xi=1ITEi

参考资料

[1] Why moving from ITE to ATE
[2] 马忠贵, 徐晓晗, 刘雪儿. 因果推断三种分析框架及其应用综述[J]. 工程科学学报, 2022, 44(7): 1231-1243. doi: 10.13374/j.issn2095-9389.2021.07.04.002.
[3] 聊一聊因果推断中的ATT、ITE、ATE和CATE
[4] 快速理解因果推断的LATE问题
[5] Yao L , Chu Z , Li S ,et al.A Survey on Causal Inference[J]. 2020.DOI:10.48550/arXiv.2002.02770.

这篇关于因果推断(三)各种效应和它们之间的关系:ATE、ATT、ATC、ITE、CATE、LATE的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/156091

相关文章

day-51 合并零之间的节点

思路 直接遍历链表即可,遇到val=0跳过,val非零则加在一起,最后返回即可 解题过程 返回链表可以有头结点,方便插入,返回head.next Code /*** Definition for singly-linked list.* public class ListNode {* int val;* ListNode next;* ListNode() {}*

POJ1269 判断2条直线的位置关系

题目大意:给两个点能够确定一条直线,题目给出两条直线(由4个点确定),要求判断出这两条直线的关系:平行,同线,相交。如果相交还要求出交点坐标。 解题思路: 先判断两条直线p1p2, q1q2是否共线, 如果不是,再判断 直线 是否平行, 如果还不是, 则两直线相交。  判断共线:  p1p2q1 共线 且 p1p2q2 共线 ,共线用叉乘为 0  来判断,  判断 平行:  p1p

pip-tools:打造可重复、可控的 Python 开发环境,解决依赖关系,让代码更稳定

在 Python 开发中,管理依赖关系是一项繁琐且容易出错的任务。手动更新依赖版本、处理冲突、确保一致性等等,都可能让开发者感到头疼。而 pip-tools 为开发者提供了一套稳定可靠的解决方案。 什么是 pip-tools? pip-tools 是一组命令行工具,旨在简化 Python 依赖关系的管理,确保项目环境的稳定性和可重复性。它主要包含两个核心工具:pip-compile 和 pip

【每日一题】LeetCode 2181.合并零之间的节点(链表、模拟)

【每日一题】LeetCode 2181.合并零之间的节点(链表、模拟) 题目描述 给定一个链表,链表中的每个节点代表一个整数。链表中的整数由 0 分隔开,表示不同的区间。链表的开始和结束节点的值都为 0。任务是将每两个相邻的 0 之间的所有节点合并成一个节点,新节点的值为原区间内所有节点值的和。合并后,需要移除所有的 0,并返回修改后的链表头节点。 思路分析 初始化:创建一个虚拟头节点

linux中使用rust语言在不同进程之间通信

第一种:使用mmap映射相同文件 fn main() {let pid = std::process::id();println!(

O(n)时间内对[0..n^-1]之间的n个数排序

题目 如何在O(n)时间内,对0到n^2-1之间的n个整数进行排序 思路 把整数转换为n进制再排序,每个数有两位,每位的取值范围是[0..n-1],再进行基数排序 代码 #include <iostream>#include <cmath>using namespace std;int n, radix, length_A, digit = 2;void Print(int *A,

16 子组件和父组件之间传值

划重点 子组件 / 父组件 定义组件中:props 的使用组件中:data 的使用(有 return 返回值) ; 区别:Vue中的data (没有返回值);组件方法中 emit 的使用:emit:英文原意是:触发、发射 的意思components :直接在Vue的方法中声明和绑定要使用的组件 小炒肉:温馨可口 <!DOCTYPE html><html lang="en"><head><

数据流与Bitmap之间相互转换

把获得的数据流转换成一副图片(Bitmap) 其原理就是把获得倒的数据流序列化到内存中,然后经过加工,在把数据从内存中反序列化出来就行了。 难点就是在如何实现加工。因为Bitmap有一个专有的格式,我们常称这个格式为数据头。加工的过程就是要把这个数据头与我们之前获得的数据流合并起来。(也就是要把这个头加入到我们之前获得的数据流的前面)      那么这个头是

读软件设计的要素04概念的关系

1. 概念的关系 1.1. 概念是独立的,彼此间无须相互依赖 1.1.1. 一个概念是应该独立地被理解、设计和实现的 1.1.2. 独立性是概念的简单性和可重用性的关键 1.2. 软件存在依赖性 1.2.1. 不是说一个概念需要依赖另一个概念才能正确运行 1.2.2. 只有当一个概念存在时,包含另一个概念才有意义 1.3. 概念依赖关系图简要概括了软件的概念和概念存在的理

数据依赖基础入门:函数依赖与数据库设计的关系

在数据库设计中,数据依赖 是一个重要的概念,它直接影响到数据库的结构和性能。函数依赖 作为数据依赖的一种,是规范化理论的基础,对数据库设计起着至关重要的作用。如果你是一名数据库设计的初学者,这篇文章将帮助你理解函数依赖及其在数据库设计中的应用。 什么是数据依赖? 数据依赖 是指同一关系中属性间的相互依赖和制约关系,它是数据库设计中语义的体现。在现实世界中,数据之间往往存在某种依赖关系,而这