因果推理“三问”:是什么?为什么需要?如何使用?

2023-11-01 13:20

本文主要是介绍因果推理“三问”:是什么?为什么需要?如何使用?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

译者:AI研习社(听风1996)

双语原文链接:Causal Inference: What, Why, and How


作为一名经济学博士,我致力于寻找某些变量之间的因果关系,用来完成我的论文。因果关系强大到可以让人们有足够的信心去做决策、防止损失、求解最优解等。在本文中,我将讨论什么是因果关系,为什么需要发现因果关系,以及进行因果推理的常用技巧。

1. 什么是因果关系?

因果关系描述的是两个变量之间的关系,即一个变量如何诱发另一个变量的发生。它比相关关系要强得多,因为相关关系只是描述两个变量之间的共同运动模式。通过绘制散点图,可以很容易地观察到两个连续变量的相关性。对于分类变量,我们可以绘制柱状图来观察其关系。要知道两个连续变量之间的确切相关性,我们可以使用皮尔逊相关公式。皮尔逊(Pearson)的相关性介于-1和1之间,绝对值越大表示相关性越强。正相关意味着两个变量在同一方向共同运动,反之亦然。

但对于因果关系,要把握的关系就要复杂得多。为了知道变量A是否引起了变量B的发生,即干预A是否引起了结果B,我们需要保持所有其他变量不变,以隔离和量化干预的效果。我们需要控制的其他变量称为混杂变量,即与干预和结果都相关的变量:

有关混淆变量的例子

在上图中,我举了一个混淆变量,其中年龄与戒烟率和致死率都是正相关的。年龄越大,死亡率越高,但吸烟率越低。如果我们在估计吸烟对死亡率的影响时没有控制年龄,我们可能会观察到吸烟会减少死亡率这样荒谬结果。我们不能在这里得出因果关系,因为我们没有控制所有混杂变量。关于这个例子的更多细节,你可以阅读我讨论 "辛普森悖论 "的文章:

所谓的“辛普森悖论”

在得出因果效应的结论时,我们需要记住的另一个因素是选择偏差。为了隔离治疗效果,我们需要确保治疗组单位是在人群中随机选择的。这样,我们在治疗后观察到的差异不是因为其他因素,而是因为治疗。举个例子,当一家超市想估计提供优惠券对提高整体销售额的影响时。如果超市只把优惠券传递给在店里购物的顾客(干预组),发现他们比没有收到优惠券的顾客(对照组)购买了更多的商品,那

这篇关于因果推理“三问”:是什么?为什么需要?如何使用?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/323280

相关文章

使用Python开发一个图像标注与OCR识别工具

《使用Python开发一个图像标注与OCR识别工具》:本文主要介绍一个使用Python开发的工具,允许用户在图像上进行矩形标注,使用OCR对标注区域进行文本识别,并将结果保存为Excel文件,感兴... 目录项目简介1. 图像加载与显示2. 矩形标注3. OCR识别4. 标注的保存与加载5. 裁剪与重置图像

使用Python实现表格字段智能去重

《使用Python实现表格字段智能去重》在数据分析和处理过程中,数据清洗是一个至关重要的步骤,其中字段去重是一个常见且关键的任务,下面我们看看如何使用Python进行表格字段智能去重吧... 目录一、引言二、数据重复问题的常见场景与影响三、python在数据清洗中的优势四、基于Python的表格字段智能去重

使用Apache POI在Java中实现Excel单元格的合并

《使用ApachePOI在Java中实现Excel单元格的合并》在日常工作中,Excel是一个不可或缺的工具,尤其是在处理大量数据时,本文将介绍如何使用ApachePOI库在Java中实现Excel... 目录工具类介绍工具类代码调用示例依赖配置总结在日常工作中,Excel 是一个不可或缺的工http://

Java8需要知道的4个函数式接口简单教程

《Java8需要知道的4个函数式接口简单教程》:本文主要介绍Java8中引入的函数式接口,包括Consumer、Supplier、Predicate和Function,以及它们的用法和特点,文中... 目录什么是函数是接口?Consumer接口定义核心特点注意事项常见用法1.基本用法2.结合andThen链

Java之并行流(Parallel Stream)使用详解

《Java之并行流(ParallelStream)使用详解》Java并行流(ParallelStream)通过多线程并行处理集合数据,利用Fork/Join框架加速计算,适用于大规模数据集和计算密集... 目录Java并行流(Parallel Stream)1. 核心概念与原理2. 创建并行流的方式3. 适

如何使用Docker部署FTP和Nginx并通过HTTP访问FTP里的文件

《如何使用Docker部署FTP和Nginx并通过HTTP访问FTP里的文件》本文介绍了如何使用Docker部署FTP服务器和Nginx,并通过HTTP访问FTP中的文件,通过将FTP数据目录挂载到N... 目录docker部署FTP和Nginx并通过HTTP访问FTP里的文件1. 部署 FTP 服务器 (

MySQL 日期时间格式化函数 DATE_FORMAT() 的使用示例详解

《MySQL日期时间格式化函数DATE_FORMAT()的使用示例详解》`DATE_FORMAT()`是MySQL中用于格式化日期时间的函数,本文详细介绍了其语法、格式化字符串的含义以及常见日期... 目录一、DATE_FORMAT()语法二、格式化字符串详解三、常见日期时间格式组合四、业务场景五、总结一、

Python中配置文件的全面解析与使用

《Python中配置文件的全面解析与使用》在Python开发中,配置文件扮演着举足轻重的角色,它们允许开发者在不修改代码的情况下调整应用程序的行为,下面我们就来看看常见Python配置文件格式的使用吧... 目录一、INI配置文件二、YAML配置文件三、jsON配置文件四、TOML配置文件五、XML配置文件

Go使用pprof进行CPU,内存和阻塞情况分析

《Go使用pprof进行CPU,内存和阻塞情况分析》Go语言提供了强大的pprof工具,用于分析CPU、内存、Goroutine阻塞等性能问题,帮助开发者优化程序,提高运行效率,下面我们就来深入了解下... 目录1. pprof 介绍2. 快速上手:启用 pprof3. CPU Profiling:分析 C

MySQL InnoDB引擎ibdata文件损坏/删除后使用frm和ibd文件恢复数据

《MySQLInnoDB引擎ibdata文件损坏/删除后使用frm和ibd文件恢复数据》mysql的ibdata文件被误删、被恶意修改,没有从库和备份数据的情况下的数据恢复,不能保证数据库所有表数据... 参考:mysql Innodb表空间卸载、迁移、装载的使用方法注意!此方法只适用于innodb_fi