统计数据会说谎

  1. 带有偏差的样本

《时代》杂志指出:耶鲁大学924届毕业生平均收入高达24111美元,可能有虚报或者瞒报
一个旨在研究杂志读者群的调查问:你们家一般都看什么杂志?出版商的印刷量和读者答案截然不同。《真人真事》发行量百万份,《哈波斯》只有几十万。
分层随机抽样:怎么分层是一个问题,如何在分层内部获取随机样本也是一个问题。
民意调查最终都会变盐城一场反对偏差来源的持久战。
调查人员的构成往往会以一种微妙的方式影响到调查结果。

  1. 精挑细选的平均数
    所有家庭年收入的算术平均数:15000美元
    家庭中有一半的年收入超过3500,另一半人低于3500
    一组数据中出现次数最多的数值:众数

  2. 没有透露的小小数据

  3. 横轴与纵轴

  4. 一维图形

  5. 看似相关的数据
    Eg: 1898年美西战争期间,美国海军的死亡率是9%,二同期纽约市市民的死亡率是16%
    7.因果颠倒

  6. 如何操纵统计
    9.如何避免

是谁这么说?
他怎么知道?
漏掉了什么
有人偷换概念了吗
这是否合乎情理

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容