独立样本MannWhitney检验
# 1、作用
MannWhitney 检验用于分析一个定类变量与一个或者多个定量变量之间有无明显差异,与独立样本 t 检验不同的是,MannWhitney 检验不需要数据呈现正态分布,需要特别注意的是,以上说到的定类变量为二分类变量(三分类及以上使用 Kruskal-Wallis 检验),各分类频数可以不相等。
# 2、输入输出描述
输入:一个定类变量 X(如学校字段,包括甲学校、乙学校)与定量字段 Y(如甲 40 名学生与乙学校 60 名学生的高考数学成绩)。
输出:模型检验的结果,如甲学校与乙学校的学生高考数学成绩存在/不存在显著性差异。
# 3、案例示例
示例:如研究不同学校的学生(各学校学生数不一定相等)成绩是否存在差异性。
# 4、案例数据
独立样本MannWhitney检验
# 5、案例操作
Step1:新建分析;
Step2:上传数据;
Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;
step4:选择【独立样本 MannWhitney 检验】;
step5:查看对应的数据数据格式,【独立样本 MannWhitney 检验】要求输入数据为定量变量,且至少有一项,另一个为定类变量,也是至少有一项;
step6:点击【开始分析】,完成全部操作;
# 6、输出结果分析
输出结果 1:正态性检验结果
图表说明:因为成绩样本 N≥5000,故采用 K-S 检验,显著性 P 值为 0.000,水平上呈现显著性,拒绝原假设,因此数据不满足正态分布,可以进行独立样本 MannWhitney 检验,若数据满足正态分布则可以采用独立样本 T 检验。
输出结果 2:正态性检验直方图
图表说明:上图展示了数据正态性检验的结果,正态图没有呈现出钟形(中间高,两端低)的情况,且是明显的右偏分布,说明数据不具有正态性,故进行 MannWhitney U 检验。
输出结果 3:MannWhitney U 检验分析结果表
图表说明:甲学校、乙学校在成绩上的中位数分别为:45.93/73.145,差异较大。标准差非常接近。检验结果 p 值为 0.000,因此统计结果显著,甲学校、乙学校在成绩上存在显著差异。其差异幅度 Cohen's d 值为:2.328,差异幅度非常大。
输出结果 4:MannWhitney U 检验频率直方图
图表说明:由上图可以直观发现,甲学校成绩偏低,乙学校成绩偏高。
# 7、注意事项
- 独立样本 MannWhitney 检验中的两分类样本数量可以不一样,如果超过三个分类,则采用使用 Kruskal-Wallis 检验。
- 各差异性分析模型的使用场景如下总结:
# 8、模型理论
Mann-Whitney 检验,又称符号等级检验,是一种非参数检验。
其计算方式如下:
设两个样本的数据量分布为 n1 和 n2,再令 R1 代表样本 1 的秩和,R2 代表样本 2 的秩和:
在检验时令:U=MIN(U1,U2),则当样本较大时
U的抽样分布迅速接近正态分布
或者使用等价公式不使用绝对值符号:
求出Z值后,查表即可判断两个样本的均值差异显著性。
# 9、参考文献
[1] Scientific Platform Serving for Statistics Professional 2021. SPSSPRO. (Version 1.0.11)[Online Application Software]. Retrieved from https://www.spsspro.com.
[2]杨维康,乔建芳,高行宜,钟文勤.秩和检验在鸟类栖息地选择分析中的运用[J].干旱区研究,2001(03):42-44.