二战时期,美国空军就很重视数据分析,他们会根据空战中积累的数据分析如何改进他们的装备和战术。
比如有一次美国空军想对加强飞机的装甲以提升飞机的防御能力,减少飞机的伤亡,但是如果装甲过多又会影响飞机的机动性,所以美国空军开始研究在飞机的哪个部位加强装甲。
于是他们对从欧洲上空和敌机交火后返回的飞机进行了观察和分析,他们发现机身上的弹孔比引擎部分的弹孔多很多,美国军官们觉得应该把装甲加在飞机最容易攻击的部分,即机身上。
他们把这个想法告诉了当时一位非常有名的数学家瓦尔德,想得到他的支持,没想到瓦尔德给出了截然相反的意见。
瓦尔德建议把装甲加在引擎上面,因为他认为飞机各部分受到攻击的概率是差不多的,引擎部位的弹孔少是因为引擎上弹孔多的飞机都未能生还,幸存的飞机机身上虽然布满了弹孔,但是飞机依然成功返回了,说明机身的抗击打能力还是可以了,相比之下,引擎部分就比较脆弱了,所以装甲最应该加在引擎部分。
这就是著名的幸存者偏差,要避开这个坑,我们要多问自己一个问题:
我有什么假设,我的假设是正确的吗?
比如在这个故事里面,美国军官们的假设是:返回的飞机是所有飞机的随机样本,显然这个假设是错误的,所以基于这个假设得出的结论也是错误的。
