事后多重比较
# 1、作用
方差分析的结果只能检验出三个以上的总体均值完全相同或不完全相同。当不完全相同时,至于是哪个或哪些总体均值与其它总体均值不同则是不能获知的。因此方差分析结束以后还需要做事后多重检验,分析出到底是哪个或哪些总体均值与众不同。
# 2、输入输出描述
输入:一个定类变量(如受教育程度)与一个或多个定量变量(如工资、家庭年收入)。
输出:方差分析结果:同一因素不同分组对定量变量产生/不产生显著性影响;事后多重比较结果:哪两类之间存在差异性。
# 3、案例示例
案例:分析个人受教育程度(定类变量)是否给个人的经济收入(定量变量)带来显著性影响。
# 4、案例数据
事后多重比较案例数据
# 5、案例操作
Step1:新建项目;
Step2:上传数据;
Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;
step4:选择【事后多重比较】;
step5:查看对应的数据数据格式,【事后多重比较】要求输入一个定类变量一个或多个定量变量;
step6:选择使用事后多重检验的方法与是否使用字母表示法;
step7:点击【开始分析】,完成全部操作。
# 6、输出结果分析
输出结果1:方差分析结果
图表说明:上表展示了方差分析的结果,包括均值±标准差的结果、F检验结果、显著性P值。 1. 分析每个分析项是否小于0.05或者0.01(根据检验标准要求,严格的话使用0.01)。 2. 若呈显著性,拒绝原假设,说明两组数据之间存在显著性差异,可以根据均值±标准差的方式对差异进行分析,反之则表明数据不呈现差异性。
分析:方差分析的结果显示,对于变量月收入,显著性P值为0.000***,水平上呈现显著性,拒绝原假设,说明变量月收入在学历之间存在显著性差异,需要进行事后多重比较。
输出结果2:方差分析对比图
图表说明:上图展示了方差分析的均值的结果,通过比较均值,可以挖掘其差异关系。
输出结果3:事后多重比较结果
图表说明:上图展示了事后多重比较的的结果,对变量之间具体差异进行分析。
分析:使用LSD方法的事后多重比较的结果显示: 对于变量月收入,均值大小排序为:大学>高中>初中>无。其中初中与大学、初中与高中、大学与无、大学与高中存在显著性差异。
# 7、注意事项
- 如果输入的定类变量仅两类,则一般不进行事后多重比较;
- 如果方差分析的结果P值大于0.05,说明各类之间没有差异性,则不需要进行事后多重比较;
- 尽量在方差齐性时进行方差分析甚至两两比较。
# 8、模型理论
1.简介
均值比较的假设检验是数据分析最重要的分析内容之一,根据参与比较的样本数量不同,使用的假设检验方法也不同。方差分析可以实现三个及三个以上定类变量的差异性比较,存在差异性时,具体哪个或哪些变量与其它变量均值存在差异是不能获知的。
因此方差分析结束以后还需要做事后多重检验,分析出到底是哪个或哪些变量均值之间存在差异。
2.原因 方差分析后进行事后多重比较而不直接用独立样本T检验进行多次两两比较。我们以方差分析为例,假如有5个样本,若使用多次两两比较,则比较的次数多达10次。设每次比较的显著性水平等于0.05,那么10次比较都不犯“弃真”错误的概率为(1-0.05)的十次方,为0.59左右,即犯“弃真”错误的概率高达0.40左右,这远远大于原先设定的显著性水平0.05。随着比较组数的增多,犯“弃真”错误的概率将会越来越大。
3.多重检验的方法 根据不同的目的和数据情况,学者们提出了很多不同的方法,主要有以下两大类:
1)两两比较的方法
- LSD法:最小显著性差异法,是最简单的比较方法之一。它是t检验的一个简单变形,并未对检验水准做出任何校正,只是在标准误(注意不是标准差)的计算上充分考虑了所有总体水平的样本信息,估计出了一个更为稳健的标准误。
- Sidak法:Sidak校正在LSD法上的应用。通过Sidak校正降低每次两两比较的“弃真”错误概率,以使最终整个比较的“弃真”错误概率保持为显著性水平a。这也就是说每次比较的显著性水平a会随着比较次数的增多而减小。显然,Sidak法比LSD法的灵敏度低。每次进行Sidak比较的显著性水平为:
- Bonferroni法:与Sidak法类似,它的每一次比较实际上是Bonferroni校正在LSD法上的应用。Bonferroni法修正后每次比较的显著性水平比Sidak法的更小,也就是说Bonferroni法比Sidak法的灵敏度更低。
- Scheffe法:Scheffe法的实质是对多个总体均值间的线性组合是否为0进行假设检验。多用在两组样本含量不同的情况。
- 以上方法的排列顺序是按照灵敏度从高到低排列为:LSD法>Sidak法>Bonferroni法>Scheffe法
2)形成同质亚组的方法
- SNK法:全称为Student-Newman-Keuls法。它实质上是根据预先指定的准则将各组均值分为多个亚组,利用Studentized Range分布来进行假设检验,并根据所要检验的均值个数调整总的“弃真”错误概率不超过设定的显著性水平a。
- Tukey法:全称为Tukey' s Honestly Significant Difference法。应用这种方法要求各组样本含量相同。它也是利用Studentized Range分布来进行各组均数间的比较,与SNK法不同地是,它控制所有比较中最大的“弃真”错误概率不超过设定的显著性水平a。
# 9、参考文献
[1] Scientific Platform Serving for Statistics Professional 2021. SPSSPRO. (Version 1.0.11)[Online Application Software]. Retrieved from https://www.spsspro.com.