摘要单因素方差分析
# 1、作用
一般进行单因素方差分析需要原始数据进行分析,但有时没有原始数据,如数据缺失或者验证论文时。此时只有样本量,平均值,标准差这样的汇总数据,可以使用摘要单因素方差分析检验差异是否显著。
# 2、输入输出描述
输入:一个定类字段(如受教育程度)、一个或多个定量字段(如工资、家庭年收入)
输出:模型检验的结果:同一因素不同分组(如:不同的受教育程度X)对定量变量(如:工资Y)产生/不产生显著性影响
# 3、案例示例
案例:验证三组病人的血糖是否存在差异性,但是数据缺失,只有汇总数据。一组病人(34人)的饭后血糖均值为4.63,标准差为0.8。一组(40人)的饭后血糖均值为 4.89,标准差为0.62。一组(36人),均值为4.78,标准差为 0.53。使用摘要单因素方差分析检验差异是否显著。
# 4、案例数据
摘要单因素方差分析案例数据
# 5、案例操作
step1:选择【摘要单因素方差分析】;
step2:输入对应摘要数据(样本量、均值、标准差),其中多组变量的变量名可以自定义,也可以自行添加和减少组别;
step3:选择置信度级别;
step4:点击【开始分析】,完成全部操作。
# 6、输出结果分析
输出结果1:
图表说明:
上表展示了方差齐性的结果,包括标准差、F检验结果、显著性P值。
1. 分析每个分析项的P值是否显著(P<0.05)。
2. 若呈显著性,拒绝原假设(原假设:满足方差齐性),则说明数据波动不一致,即说明方差不齐;反之则说明数据波动一致,说明数据满足方差齐性。
智能分析:
方差齐性检验的结果显示,显著性P值为0.008***,水平上呈现显著性,拒绝原假设,因此数据不满足方差齐性。
分析:
用于判断进行方差分析的前提条件(满足独立、方差齐、正态性),本次分析通过了方差齐性检验,完成方差齐的条件。
输出结果2:
图表说明:
上表展示了方差分析的结果,包括均值±标准差的结果、F检验结果、显著性P值。
1. 分析每个分析项的P值是否显著(P<0.05)。
2. 若呈显著性,拒绝原假设,说明两组数据之间存在显著性差异,可以根据均值±标准差的方式对差异进行分析,反之则表明数据不呈现差异性。
智能分析:
摘要单因素方差分析的结果显示,显著性P值为0.238,水平上不呈现显著性,不能拒绝原假设,不同分组样本之间不存在显著差异。
# 7、注意事项
- 方差分析的前提条件(满足独立、方差齐、正态性),方差齐部分SPSSPRO为您判断,其余两个需要根据数据来源自行判断。
# 8、模型理论
# 概念
- 因素(条件):在进行方差分析研究时,所要检验的对象称为因素或条件;
- 水平(处理):因素对应的不同取值称为水平或处理;
- 观测值:每个因素水平下得到的实验数据称为观 测值。 设因素共有k个水平,而各个水平的均值分别用
表示,要同时检验k个水平(即k个总体)的均值是否相等,需要提出如下假设: - ,因素对实验结果的影响比随机误 差对实验结果的影响小; - 不全相等,因素对实验结果的影响比 随机误差对实验结果的影响大。
# 基本假设
- 线性假定,即模型假定为线性的;
- 各个总体均服从正态分布。对于因素的每一个水平来说,观测值都是来自正态总体的简单随机样本;
- 各个总体的方差$σ^{2} $应相等。对于各组观测数据,它们是具有从相同方差的正态分布中抽取的;
- 观测值是独立的。
# 分析操作步骤
第一步:
提出两种假设(原假设与备择假设)。
,因素对实验结果的影响比随机误差对实验结果的影响小; 不全相等,因素对实验结果的影响比随机误差对实验结果的影响大。
如果拒绝原假设
如果不拒绝原假设
特别指出,当拒绝原假设
第二步:
选择并且构造检验统计量。 为了检验原假设H0是否成立,需要先选择合适的检验统计量,并且计算检验统计量的值。 分别计算因素在不同水平的均值:
计算全部观测值的总均值:
其中,n = n1 + n2 + ... + nk
为了构造检验统计量,首先需要计算3个误差平方和:分别是总误差平方和(SST )、因素误差平方和(SSA )、 随机误差平方和( SSE )。其计算公式如下:
三者之间存在:
即SST = SSA + SSE
由于三个误差平方和的大小都受到观测数据数目多少的影响,观测值数目越多,计算得到的误差平方和越大。为了消除观测值数目多少对误差平方和计算结果大小的影响,需要用各平方和计算结果除以它们各自所对应的自由度,即是均方。三个自由度分别为: n-1,k-1 与 n-k 。
SSA 的均方也被称为组间均方或组间方差,记为 MSA 。计算公式可以表示为:
SSE 的均方也被称为组内均方或组内方差,记为 MSE 。其计算公式为:
统计理论已经证明,组间均方与组内均方之比是一个服从F分布的统计量。将 MSA 与 MSE 进行对比,即得到所需要的 F 检验统计量,如下所示。
第三步:
根据给定的显著性水平α,查F分布表,确定临界值F_α(k-1,n-k)。
根据给定的显著性水平α 、分子(组间均方)自由度
第四步:
做出统计意义上的决策。 根据计算得到的检验统计量的值F,与查表所得的 临界值
若
若
在进行统计决策时,还可以直接利用方差分析表中输出 P值与显著性水平α进行比较,得出结论。
# 9、参考文献
[1] Scientific Platform Serving for Statistics Professional 2021. SPSSPRO. (Version 1.0.11)[Online Application Software]. Retrieved from https://www.spsspro.com.
[2]戴金辉, 袁靖. 单因素方差分析与多元线性回归分析检验方法的比较[J]. 统计与决策, 2016, No.453(09):23-26.