假设检验之相关性分析

相关分析重点研究两个变量之间线性关系的强度和方向,两变量均为结果变量,不分主次。根据样本类型差异及研究目的不同,本文主要介绍偏相关分析、相关分析和多变量相关分析。

一、偏相关分析

偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响控制,只分析另外两个变量之间相关程度,控制变量个数为一时,偏相关系数称为一阶偏相关系数;控制变量个数为二时,偏相关系数称为二阶相关系数;控制变量个数为零时,偏相关系数称为零阶偏相关系数,也就是相关系数。

问:什么指两个变量同时与第三个变量相关?

可以这样理解,有IQ、数学成绩、语文成绩三个变量,想要分析数学成绩与语文成绩之间的相关性,但是由于数学成绩和语文成绩的最直接影响原因是IQ,即两个变量同时与IQ相关,但又想知道数学成绩与语文成绩之间单纯的相关性,就使用偏相关分析。

举例:想要分析考试所用时间与考试成绩的相关程度,但是这两个因素都与第三个因素平时学习效果相关,即平时学习效果好,则考试所用时间就少,考试成绩就好;平时学习效果不好,那么考试所用时间长,并且成绩不好。如果想单纯看这两个因素的相关性,就需要控制变量平时学习效果(试想一下,如果不进行控制变量的话,很可能会得出考试时间越短考试成绩越高的结论,但是如果没有平时学习效果好的前提下,得出这样的结论也是很荒谬的)。

注意:偏相关分析的两变量必须服从正态分布,即为连续性变量。

二、相关分析

无控制变量的分析即为相关分析,根据样本类型不同,分为Pearson、Spearman和Kendall检验。

1、Pearson相关系数

1)条件:服从正态分布的两连续性变量;

2)系数:

从公式可以看出,X与Y同向变化时,r为正;X与Y反向变化时,r为负。

3)说明:Pearson相关系数对异常值特别敏感,异常值甚至会导致符号的改变。

可以很明显的看出,无异常值时,x与y成负相关,但是异常值导致,是相关系数为正,也可以从计算公式理解异常值的导致计算结果的不同。

2、Spearman系数

1)条件:适用于不满足正态分布、总体分布未知的连续性变量;

2)系数:

Spearman系数不使用绝对数值,使用秩进行计算,d是每对观察值秩之差,n是观察对数。

3、Kendall等级相关系数

1)条件:是对两个有序变量或两个秩变量之间相关程度的度量;

2)Kendall‘ U系数:

    Kendall‘ W系数:

3)本节讨论Kendall‘ W系数

* Kendall’sW 检验条件:

a、观察者不少于3人,判定结果是有序分类变量;

b、不同观测者判定的对象相同,本研究中,5位放射科医生诊断的是同一组研究对象;

c、观察者之间相互独立。

* Kendall’sW 检验目的:

检验3个及以上角度对同一事物判断是否一致

* 举例:

分析5位放射科医生对疾病严重程度诊断的一致性。现搜集50位研究对象的MRI检查结果,要求放射科医生针对每份MRI检查给予Grade I(最轻)到GradeV(最重)五个等级的临床诊断,Grade I、GradeII、GradeIII、Grade

IV和Grade V赋值分别为1、2、3、4和5,部分数据如下图。

三、多变量相关分析

总结:根据样本类型选择相关性检验方法

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 基本概念 现实中,事物之间的联系是错综复杂的,而事物之间的关系可以看作两类:一类是函数关系,一类是相关关系。函数关...
    辛辛辛烷阅读 5,883评论 0 15
  • 01207汪慧美 今天带小朋友去公园抓小鱼,回来的路上看到一只小野猫,然后我就说了一句,小猫最喜欢吃小鱼啦!月儿小...
    ameimay阅读 289评论 0 1
  • 我一定要带你去维西看滇金丝猴,在这个精灵充满生机的动物王国里面,我想牵着你的手看你露出各种表情的面容。 我一定带你...
    洪阿柒阅读 271评论 0 2