SPSSPRO,让数据分析更简单,问卷调查类数据分析不再愁 产品介绍 帮助中心 客户端
微信登录
  • 产品简介

  • 我的数据

  • 数据处理

  • 数据分析

    • 描述性分析

    • 问卷分析

    • 综合评价

    • 差异性分析

      • 差异性分析自动求解器
      • 参数检验

        • 单样本T检验
        • 配对样本T检验
        • 独立样本T检验
        • 单因素方差分析
        • 事后多重比较
        • 双因素方差分析
        • 三因素方差分析
        • 多因素方差分析
        • 摘要单因素方差分析
          • 1、作用
          • 2、输入输出描述
          • 3、案例示例
          • 4、案例数据
          • 5、案例操作
          • 6、输出结果分析
          • 7、注意事项
          • 8、模型理论
            • 概念
            • 基本假设
            • 分析操作步骤
          • 9、参考文献
        • 摘要T检验
        • 协方差分析
        • 多变量方差分析
      • 非参数检验

    • 相关性分析

    • 预测模型

    • 统计建模

    • 计量经济模型

    • 医学统计模型

    • 机器学习分类

    • 机器学习回归

    • 规划求解

    • 研究模型

    • 信号分析

    • 自定义算法

操作视频
建议反馈
1、作用
2、输入输出描述
3、案例示例
4、案例数据
5、案例操作
6、输出结果分析
7、注意事项
8、模型理论
概念
基本假设
分析操作步骤
9、参考文献

摘要单因素方差分析

操作视频
SPSSPRO教程-摘要单因素方差分析

# 1、作用

一般进行单因素方差分析需要原始数据进行分析,但有时没有原始数据,如数据缺失或者验证论文时。此时只有样本量,平均值,标准差这样的汇总数据,可以使用摘要单因素方差分析检验差异是否显著。

# 2、输入输出描述

输入:一个定类字段(如受教育程度)、一个或多个定量字段(如工资、家庭年收入)
输出:模型检验的结果:同一因素不同分组(如:不同的受教育程度X)对定量变量(如:工资Y)产生/不产生显著性影响

# 3、案例示例

案例:验证三组病人的血糖是否存在差异性,但是数据缺失,只有汇总数据。一组病人(34人)的饭后血糖均值为4.63,标准差为0.8。一组(40人)的饭后血糖均值为 4.89,标准差为0.62。一组(36人),均值为4.78,标准差为 0.53。使用摘要单因素方差分析检验差异是否显著。

# 4、案例数据


摘要单因素方差分析案例数据

# 5、案例操作


step1:选择【摘要单因素方差分析】;
step2:输入对应摘要数据(样本量、均值、标准差),其中多组变量的变量名可以自定义,也可以自行添加和减少组别;
step3:选择置信度级别;
step4:点击【开始分析】,完成全部操作。

# 6、输出结果分析

输出结果1:

图表说明:
上表展示了方差齐性的结果,包括标准差、F检验结果、显著性P值。
1. 分析每个分析项的P值是否显著(P<0.05)。
2. 若呈显著性,拒绝原假设(原假设:满足方差齐性),则说明数据波动不一致,即说明方差不齐;反之则说明数据波动一致,说明数据满足方差齐性。
智能分析:
方差齐性检验的结果显示,显著性P值为0.008***,水平上呈现显著性,拒绝原假设,因此数据不满足方差齐性。
分析:
用于判断进行方差分析的前提条件(满足独立、方差齐、正态性),本次分析通过了方差齐性检验,完成方差齐的条件。

输出结果2:

图表说明:
上表展示了方差分析的结果,包括均值±标准差的结果、F检验结果、显著性P值。
1. 分析每个分析项的P值是否显著(P<0.05)。
2. 若呈显著性,拒绝原假设,说明两组数据之间存在显著性差异,可以根据均值±标准差的方式对差异进行分析,反之则表明数据不呈现差异性。
智能分析:
摘要单因素方差分析的结果显示,显著性P值为0.238,水平上不呈现显著性,不能拒绝原假设,不同分组样本之间不存在显著差异。

# 7、注意事项

  • 方差分析的前提条件(满足独立、方差齐、正态性),方差齐部分SPSSPRO为您判断,其余两个需要根据数据来源自行判断。

# 8、模型理论

# 概念

  • 因素(条件):在进行方差分析研究时,所要检验的对象称为因素或条件;
  • 水平(处理):因素对应的不同取值称为水平或处理;
  • 观测值:每个因素水平下得到的实验数据称为观 测值。 设因素共有k个水平,而各个水平的均值分别用μ1,μ2,μ3,...,μk表示,要同时检验k个水平(即k个总体)的均值是否相等,需要提出如下假设: - H0:H0:μ1=μ2=μ3=...=μk ,因素对实验结果的影响比随机误 差对实验结果的影响小; - H1:μ1,μ2,μ3,...,μk不全相等,因素对实验结果的影响比 随机误差对实验结果的影响大。

# 基本假设

  • 线性假定,即模型假定为线性的;
  • 各个总体均服从正态分布。对于因素的每一个水平来说,观测值都是来自正态总体的简单随机样本;
  • 各个总体的方差σ2应相等。对于各组观测数据,它们是具有从相同方差的正态分布中抽取的;
  • 观测值是独立的。

# 分析操作步骤

第一步:
提出两种假设(原假设与备择假设)。

  • H0:μ1=μ2=μ3=...=μk,因素对实验结果的影响比随机误差对实验结果的影响小;
  • H1:μ1,μ2,μ3,...,μk不全相等,因素对实验结果的影响比随机误差对实验结果的影响大。

如果拒绝原假设H0,说明因素对实验结果的影响比随机误差对实验结果的影响大;
如果不拒绝原假设H0 ,则还没有充分证据证明因素对实验结果的影响比随机误差对实验结果的影响大。
特别指出,当拒绝原假设H0时,所有的总体均值μ1,μ2,...,μi,...,μk应该至少有两个总体的均值不相等,但不能保证所有的总体均值同时都不相等。

第二步:
选择并且构造检验统计量。 为了检验原假设H0是否成立,需要先选择合适的检验统计量,并且计算检验统计量的值。 分别计算因素在不同水平的均值:
xi¯=∑j=1nixijni
i=1,2,3,...,k ,其中,ni是第i个总体实验数据的个数;
计算全部观测值的总均值:
xi¯―=∑i=1k∑j=1nixijn=∑i=1knixi¯n

其中,n = n1 + n2 + ... + nk
为了构造检验统计量,首先需要计算3个误差平方和:分别是总误差平方和(SST )、因素误差平方和(SSA )、 随机误差平方和( SSE )。其计算公式如下:
SST=∑i=1k∑j=1ni(xij−x¯―)2
SSA=∑i=1k∑j=1ni(xi―−x¯―)2=∑i=1kni(xi¯−x¯―)2
SSE=SSE=∑i=1k∑j=1ni(xij−xi¯)2
三者之间存在:
∑i=1k∑j=1ni(xij−x¯―)2=∑i=1kni(xi¯−x¯―)2+∑i=1k∑j=1ni(xij−xi¯)2
即SST = SSA + SSE
由于三个误差平方和的大小都受到观测数据数目多少的影响,观测值数目越多,计算得到的误差平方和越大。为了消除观测值数目多少对误差平方和计算结果大小的影响,需要用各平方和计算结果除以它们各自所对应的自由度,即是均方。三个自由度分别为: n-1,k-1 与 n-k 。
SSA 的均方也被称为组间均方或组间方差,记为 MSA 。计算公式可以表示为:
组间平方和自由度MSA=组间平方和自由度=SSAk−1
SSE 的均方也被称为组内均方或组内方差,记为 MSE 。其计算公式为:
组内平方和自由度MSE=组内平方和自由度=SSEn−k
统计理论已经证明,组间均方与组内均方之比是一个服从F分布的统计量。将 MSA 与 MSE 进行对比,即得到所需要的 F 检验统计量,如下所示。
F=MSAMSE∼F(k−1,n−k)

第三步:
根据给定的显著性水平α,查F分布表,确定临界值Fα(k−1,n−k)。
根据给定的显著性水平α 、分子(组间均方)自由度df1=k−1 、分母(组内均方)自由度 df2=n−k ,查找Fα(k−1,n−k),确定相应的临界值。

第四步:
做出统计意义上的决策。 根据计算得到的检验统计量的值F,与查表所得的 临界值Fα(k−1,n−k)进行比较,做出统计意义上的决策。
若F>Fα,则拒绝原假设,即H0:μ1=μ2=μ3=...=μk的假设不成立,表明因素对实验结果的影响比随机误差对实验结果的影响大;
若F<Fα,则不能拒绝原假设H0,没有充分的证据证明因素对实验结果的影响比随机误差对实验结果的影响大。
在进行统计决策时,还可以直接利用方差分析表中输出 P值与显著性水平α进行比较,得出结论。

# 9、参考文献

[1] Scientific Platform Serving for Statistics Professional 2021. SPSSPRO. (Version 1.0.11)[Online Application Software]. Retrieved from https://www.spsspro.com.
[2]戴金辉, 袁靖. 单因素方差分析与多元线性回归分析检验方法的比较[J]. 统计与决策, 2016, No.453(09):23-26.

建议反馈