我们知道,因果关系具有时间上前后相继的特点,平常所谓的“见到”感觉都是相互联系的事件,或者“相继发生”的事件,总认为这些事件一般都有着因果关系。我们自然而然地得出如下结论,由于特征甲与特征乙之间有联系,就可以说是甲引起了乙。二者之间具有相关性并不意味着它们具有因果联系,而具有因果联系的有时也并不相关。
据说有科学研究表明,若是20~50岁男人射精越频繁,以后患前列腺癌风险就越低!
这个问题最近引起了不小的争论。你会相信这种说法吗?一般理智的人都会找一找相关的资料来试图了解这个问题。
其实,我们读到的科普文献或者科技新闻,许多都是经过一次或者几次转述,也很可能因为某种需要而作了夸张,为了辨别这些说法的真伪,最好看看原文的结论是什么,得出这个结论是用到了什么方法。所以应该有此处存疑,不可尽信的态度。
“若是20~50岁男人射精越频繁,以后患前列腺癌风险就越低”,根据原始文献,其研究结果只得出了相关性的结论,并没有给出因果关系。射精越频繁导致前列腺癌风险越低这样的结论就存疑。
我们再来看一个简单的例子。例如,公鸡打鸣与太阳升起:每天公鸡打鸣与太阳升起总是同时发生的,那是不是公鸡打鸣与太阳升起就具有因果关系呢?那就表示若把全世界所有的公鸡都杀光了,太阳就不会升不起来了。显然这个结论是荒诞的。
有数据统计表明,若手指头越黄,得肺癌的比例越大。其实手指头的颜色和得肺癌的概率之间并没有直接的因果联系。但是为什么统计数据会显示出二者具有相关性呢?仔细分析,这是另有原因的:手指黄和肺癌都是由吸烟造成的,由此造成了这两者之间产生了虚假的相关性。
与虚假的相关性数据相应的就是虚假的独立性数据。最著名就是“健康工人效应”,统计数据显示,铀矿工人居然与其他人的寿命差不多一样长或更长。这是不是说明铀矿对身体无害呢?当然是不可能的。分析其深层原因是因为去铀矿工作的都是挑选的身体素质最好的人,其寿命本该长一些,正是在铀矿工作的原因才把他们的寿命降到了平均水平。这一事实也给统计数据带来了虚假的独立性。
所以要记住:有相关并不能证明因果关系的存在!
例如,有这样一个有趣的研究:挑选出常吃海参和不常吃海参的两组人进行智商测试,最后研究人员得出结论:常吃海参和智商高之间是呈相关性。于是有的所谓“专家”就声称:海参吃得越多智商就越高!
退一步讲,常吃海参的平均智商真的高,且参与调查对象人数特多,具有统计意义,但“专家”声称还是有一个致命的逻辑缺陷:相关性并不代表因果性!比如有统计表明,游泳死亡人数越高,冰糕销量就越大,也就是游泳死亡人数和冰糕销量之间具有相关性。是冰糕销量使游泳死亡人数增加了?肯定不是的,实际上这两个事件都是气温升高了所导致的,二者之间不具有任何因果关系。
这些例子都充分说明了,若是只依据统计数据是不足以得出因果性的,想要得出因果性,必须从理论上、研究上证明两个变量之间确实有因果性,另外,还要排除掉第三个隐含变量同时导致这两个变量的可能性。
再说一说海参和智商之间的相关性。我们可以这样假设:经常吃到海参的家庭一般比较富裕,且还会给孩子提供更优质的教育,所以使孩子智商更高;还可以这样假设,由于基因的不同,使人喜欢吃海参且提升智商。当然,不排除还有其他可能性。也可看出,吃海参与智商不一定具有相关性。