卡方拟合优度检验
# 1、作用
卡方拟合优度检验是基于卡方统计量用于判断期望频数与观察频数是否有显著差异。
# 2、输入输出描述
输入:各分组项的期望比例。
输出:判断收集的数据分布与预期是否呈显著性差异。
# 3、案例示例
例如调查某行业从业人员学历水平程度,预计本科与硕士的学历比例为 9:1,实际收集到本科学历个数 87 人,硕士 13 人,判断收集的数据分布与预期是否呈显著性差异。
# 4、案例数据
卡方拟合优度检验案例数据
# 5、案例操作
Step1:新建分析;
Step2:上传数据;
Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;
step4:选择【卡方拟合优度检验】;
step5:查看对应的数据数据格式,【卡方拟合优度检验】要求输入数据为分组定类变量 X,(变量数=1);
step6:设定要验证的比率;
step6:点击【开始分析】,完成全部操作;
# 6、输出结果分析
输出结果 1:卡方检验分析结果
图表说明:卡方拟合优度检验的结果显示,显著性 P 值为 0.317,水平上不呈现显著性,不能拒绝原假设,因此数据的分布与预期相比无显著性差异。可认为本科生与研究生的比值为 9:1。
输出结果 2:期望频数图
图表说明:上图展示了各组别期望比例与实际比例的频数柱状图。可见实际观测者与预期差异不大。
# 7、注意事项
- 拟合卡方检验就是检验这两列数据是否呈现差异,通常应用于问卷的多重响应频率分析里面的响应率与普及率分析。
# 8、模型理论
卡方拟合优度检验是用来检验观测数与依照某种假设或分布模型计算得到的理论数之间一致性的一种统计假设检验,以便判断该假设或模型是否与实际观测数相吻合。其步骤为:
1)将观测值分为 K 组 。
2)计算 n 次观测值中每组的观测频数,记为 Oi。
3)根据变量的分布规律或概率运算法则,计算每组的理论频率为 Pi。
4)计算每组的理论频数 Ti 。
5)检验 Oi 与 Ti 的差异显著性,判断两者之间的不符合度。
a、零假设:H0:O-T=0;备择假设: O-T≠0
b、检验统计量:这里要求 n 充分的大,当 n≥50 时(最好 ≥100),所定义的检验统计量近似服从卡方分布,
Ti=nPi 不得小于 5,若小于 5,将尾区相邻的组合并,直到合并后的组的 Ti≥5,合并后再计算卡方值。
c、建立拒绝域
d、作出统计学结论
# 9、参考文献
[1] Scientific Platform Serving for Statistics Professional 2021. SPSSPRO. (Version 1.0.11)[Online Application Software]. Retrieved from https://www.spsspro.com.
[2]茆诗松, 王静龙, 濮晓龙, 等. 高等数理统计 (第二版)[M]. 北京: 高等教育出版社, 2006.
[3]王重, 刘黎明. 拟合优度检验统计量的设定方法[J]. 统计与决策, 2010(5):154-156.