现实生活中,因果关系可以说是无处不在。但又不得不承认,因果关系的判定非常具有难度,无论是从数学、统计学或是哲学的意义上,都是一个值得钻研的课题。什么是因果?读者不妨暂停半分钟,试着给出一个对于因果关系的定义,然后想想看能否说服自己。 你会意识到回答这个问题确实十分困难,即使你有较好的统计学基础。学术界,对因果关系有过很多次的探讨。哲学家休谟说,“因果就是经常性联结。如果我们观察到,A总是在B之前发生,事件A与事件B始终联结在一起,那么A就导致了B,或者说A是B的原因。”但是,公鸡打鸣(A)与日出(B)符合休谟提出的条件,但任何有理性的人都知道,他们之间并不构成因果。因果之间讲究的是一种【介入关系】,即,如果控制住所有的公鸡,让它们不再打鸣,还会有日出吗?如果仍会有日出,那么这就不能用因果关系来形容。统计学界的相关不等于因果现在已经广为人知,不再赘述。历史上还有人曾将INUS条件认定为因果。INUS条件(和后文关系不大,不感兴趣可以跳过这一部分),全称为Insufficient but Necessary parts of a condition which is itself Unnecessary but Sufficient,翻译成中文,叫充分不必要条件中的必要不充分部分。闪电、干草堆、消防员玩忽职守、空气干燥都是一场火灾的INUS条件。拿闪电来说,出现足以引起火灾的闪电情况,是火灾的充分不必要条件(它足够引起火灾,但火灾并不一定要通过闪电来引起)。而闪电,又是出现足以引起火灾的闪电情况的必要条件(要出现这种情况,必须要有闪电)。但我们完全可以找到INUS条件不是原因的情况,比如雷声也是火灾的INUS条件(因为雷声与闪电如影随形),你能说打雷是火灾的原因吗?不能这么说。
02
计量经济学和流行病学科与因果推断
有些对计量经济学略有了解的同学可能会提到格兰杰因果检验和“先有鸡还是先有蛋”的故事。但很遗憾,格兰杰因果检验并不能够检验真正的因果关系。如果得知事件A的发生有助于预测之后的事件B,那么我们说A是B的【格兰杰因】(Granger Causality)。然而,格兰杰因果只包含了观测,却没有包含介入,直接操纵A并不一定能影响B,这与我们日常对因果的直觉不符。误认为格兰杰因果检验可以检验因果关系是犯了后此谬误(Post Hoc Fallacy)。实际上,计量经济学领域目前有一些较为常用的因果检验辅助手段,如工具变量、断点回归、双重差分、倾向值匹配、合成控制等,广泛用于政策效果研究等领域,横截面数据和面板数据都能找到对应方法,本文不过多介绍。 流行病学是研究一切健康现象与其原因之间关系的学科,出于此特殊性,流行病学领域对因果分析也看得十分重要。最有名的例子之一是,斯诺医生发现伦敦霍乱的元凶。这位名叫John Snow的医生(不是“you know nothing”的那位斯诺)不太相信空气传播霍乱的说法,认为水里携带的细菌才是主因。他通过走遍伦敦进行调查,绘制了一系列点图,发现霍乱的分布是较为分散的。而若按照空气传播说,疾病的分布应该会更平均才对。最终,Snow将传染源锁定为一个公共抽水机(从被污染了的泰晤士河里取水),并说服政府将抽水机挪走。这个研究经历了一些波折,但确实为人们提供了新的思路。现代流行病学,为了测量Risk、发现因果,需要各种实验设计。其中最好的自然是随机对照试验(Randomized Control Trail,RCT)。但由于RCT一般对经费要求较高,需要遵守一系列严格规范,而且受到道德约束(比如,你不能强迫一部分实验者吸烟)。因此,又衍生出事先确定好Exposure的队列研究(Cohort),回溯以往数据的病例对照研究(Case-control)和它的一些变体等,本文不过多介绍。 图:宽街的纪念雕塑和酒馆
03
因果网络简介
以上的关于因果推断的一些历史上的讨论和一些学科的处理方法。接下来,本文会主要通过因果网络分析,来简单阐释如何通过构造因果网络、控制变量和数据分析的方式,来进行因果推断,并由此来解释辛普森悖论的问题。本文主要思想来源于图灵奖得主Judea Pearl的著作《The Book of Why》,本文仅做掺杂个人理解的简单介绍,感兴趣的读者可以购买原著来学习。 先来了解一下三种因果网络的基本关联方式。这里的因果网络实际上来源于贝叶斯网络,箭头不一定代表因果,仅代表信息的传递和流通。 1. 链接合因果网络表现形式为A→B→C。例子如【火灾→烟雾→警报】,火灾引起烟雾,而常见的警报只能通过烟雾分子、而不是高温或火光等产生。在进行实验或分析数据时,控制住中介位B(即,分别只看烟雾=1或烟雾=0的情况),可以关闭A与C之间的信息流通。针对链接合,需要视情况选择是否控制B变量。当A→C有直接影响路径时,有时需要衡量总体的A对C的影响,那么无需控制B;若要分别衡量A对C的直接和通过B的间接影响,那么有时就需要控制B。(后文应用部分会提及) 2. 叉接合因果网络表现形式为A←B→C。B通常被视作A和C的共因或混杂因子,它会使得A和C会呈现出统计相关,但实际上可能并无因果关系。例子如【鞋的尺码←孩子的年龄→阅读能力】,鞋尺码大的孩子往往年龄较大,因此阅读能力也较强。但若你进行干预(或者说介入),给孩子穿更大码的鞋,他的阅读能力并不会因此而提升。控制住混杂位B,可以关闭A与C之间的信息流通。 3. 对撞接合因果网络表现形式为A→B←C。例子如【才华→名人←美貌】,才华和美貌都有助于演员的成功,但对大多数从事其他行业的人来说,才华和美貌完全不相关。因此,A和C本是相对独立的,但若你控制B(名人=1),才华和美貌则会呈现出负相关,这也被成为负相关效应或辩解效应。一种被广为接受的说法是,只要才华(演技)和美貌有一项很突出,就能够成为一名较为成功的演员了。即,一个演员演技极佳,那么他并不需要比普通人好看多少。因此,在实验或分析中,若控制住对撞位B,反而会导致A与C的信息流通渠道打开。 另外一个需要注意的基本规则是,控制一个变量的后代节点或替代物,就如同部分地控制了变量本身。如控制一个中介物的后代节点相当于部分地关闭了信息通道,控制一个对撞因子的后代节点相当于部分地打开了信息通道。