SPSSPRO,让数据分析更简单,问卷调查类数据分析不再愁 产品介绍 帮助中心 客户端
微信登录
  • 产品简介

  • 我的数据

  • PRO绘图

  • 数据处理

  • 数据分析

    • 描述性分析

    • 问卷分析

    • 综合评价

    • 差异性分析

    • 相关性分析

    • 预测模型

    • 统计建模

      • 主成分分析(PCA)
      • 典型相关分析
      • 泊松分布检验
      • 游程检验
      • 逐步回归
      • 线性判别
      • 关联分析
      • 拟合工具箱
      • 极差分析
        • 二阶聚类
        • 混合模型
        • 对数线性模型
        • 广义线性模型
        • 广义估计方程
      • 计量经济模型

      • 医学统计模型

      • 机器学习分类

      • 机器学习回归

      • 规划求解

      • 研究模型

      • 信号分析

      • 自定义算法

      • 过程能力分析

      • 控制图

      • 测量系统分析

      • 可靠性生存分析

    极差分析

    操作视频
    SPSSPRO教程-极差分析

    # 极差分析

    # 1、作用

    极差分析是一种通过比较极差大小来分析数据的方法,主要用于正交试验的数据分析。其原理是由于正交试验具有正交性和综合可比性,故可以将某个因素某个水平的平均数的数据变化看做该因素不同水平的效应,某个因素各个因素平均数的极差就可以看做该因素在整个试验的效应,该值越大说明对于这个试验越重要。

    # 2、输入输出描述

    输入: 一个定量实验结果变量、一个或多个定量或定类待检验变量。
    输出: 对应的极差值,以及试验影响最大的和最佳因素水平组合。

    # 3、案例示例

    案例: 根据过山车的属性(速度、高度、材质)构造不同的产品属性组合设计,使用极差分析对其进行评估,确定哪一种属性组合更受欢迎。

    # 4、案例数据


    极差分析案例数据

    # 5、案例操作


    Step1:新建分析;
    Step2:上传数据;
    Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;

    step4:选择【极差分析】;
    step5:查看对应的数据数据格式,【极差分析】要求自变量 X 至少一项或以上的定量变量或二分类定类变量,因变量 Y 要求为定量变量。
    step6:选择自动选择 λ 值或者手动输入 λ 值;
    step7:点击【开始分析】,完成全部操作。

    # 6、输出结果分析

    输出结果 1:因素水平表

    图表说明: 上表展示因素水平表,展示不同因素以及对应的水平情况。

    输出结果 2:极差分析结果


    图表说明: 上表展示了极差分析的结果:
    1. Ki 代表的该因素在水平 i 的情况下的实验结果之和。
    2. 带有横线的 Ki 代表 Ki 的均值,用于计算 R 值。
    3. R 值为极差值,为 Ki 最大的均值减去 Ki 最小的均值,用于对因素的主次进行排序。
    4. 因素每水平试验重复数为水平平均进行试验的次数。 5. 当对混合型正交表进行分析时,会附带 R'(折算后的极差)和 d(折算系数)。
    主要关注 R 和因素最佳水平,R 值越大说明“高度”属性越重要,因素最佳水平可以得到推荐的组合:速度为快、高度为高、材质为金属。

    输出结果 3:因素各水平均值图

    图表说明: 上图以可视化的形式展示因素各个水平的均值情况。对试验影响最大的因素为高度。 推荐的组合:速度为快、高度为高、材质为金属。

    # 7、注意事项

    • 无

    # 8、模型理论

    正交实验是一种用于设计和分析实验的方法,它通过构建正交表,减少了试验次数,并能独立评估影响因素。正交实验极差分析是正交实验设计的一部分,用于评估不同因素对实验结果的影响。在正交实验极差分析中,我们通常使用极差(Range)来衡量因素对结果的变异性。
    假设我们有 k 个因素,每个因素有 s 个水平(即不同的取值),而正交实验设计采用 m 个试验次数。对于正交实验极差分析,计算每个因素的极差需要按照以下步骤进行:

    1. 对每个因素进行正交表设计,以确保各个水平在各个试验次数中均匀分布。
    2. 进行 m 个试验并记录每个试验的结果。
    3. 计算每个因素每个水平下的观测值(试验结果)之间的极差。
    4. 对每个因素,计算其所有水平极差的平均值,得到该因素的总极差。
    5. 根据总极差,确定因素对结果的影响程度。较大的总极差表示该因素对结果的影响较大,反之,较小的总极差表示该因素对结果的影响较小。
    6. 在正交实验中,还可以计算因素之间的交互作用,以了解不同因素之间的相互影响。

    # 9、手推步骤

    组合 速度 高度 材质 受欢迎度
    1 低 低 金属 8.5
    2 高 低 金属 6.2
    3 低 高 金属 7.9
    4 高 高 金属 9.3
    5 低 低 木材 5.1
    6 高 低 木材 7.0
    7 低 高 木材 6.7
    8 高 高 木材 8.8

    极差分析求最佳组合过程如下:

    step1:因素编码
    这是一个全因子试验(3个因素:速度、高度、材质,每个因素2个水平),总共有 8 个组合。
    因素水平编码:
    速度:低=1,高=2
    高度:低=1,高=2
    材质:金属=1,木材=2

    step2:构造正交表
    通过因素水平编码得到正交表。

    试验号 速度 高度 材质 结果 y
    1 1 1 1 8.5
    2 2 1 1 6.2
    3 1 2 1 7.9
    4 2 2 1 9.3
    5 1 1 2 5.1
    6 2 1 2 7.0
    7 1 2 2 6.7
    8 2 2 2 8.8

    step3:计算Ki和均值
    速度(A)
    A1(低速度):试验号 1,3,5,7 → KA1=8.5+7.9+5.1+6.7=28.2
    均值K―A1=28.2/4=7.05
    A2(高速度):试验号 2,4,6,8 → KA2=6.2+9.3+7.0+8.8=31.3
    均值K―A2=31.3/4=7.825
    高度 (B)
    B1(低高度):试验号 1,2,5,6 → KB1=8.5+6.2+5.1+7.0=26.8
    均值K―B1=26.8/4=6.7
    B2(高高度):试验号 3,4,7,8 → KB2=7.9+9.3+6.7+8.8=32.7
    均值K―B2=32.7/4=8.175
    材质 (C)
    C1(金属):试验号 1,2,3,4 → KC1=8.5+6.2+7.9+9.3=31.9
    均值K―C1=31.9/4=7.975
    C2(木材):试验号 5,6,7,8 → KC2=5.1+7.0+6.7+8.8=27.6
    均值K―C2=27.6/4=6.9

    step4:极差分析
    各因素的极差R = 最大水平均值 − 最小水平均值
    速度RA=∣7.825−7.05∣=0.775
    高度RB=∣8.175−6.7∣=1.475
    材质RC=∣7.975−6.9∣=1.075

    step5:因素排序
    按极差大小:

    RB(1.475)>RC(1.075)>RA(0.775)

    主 → 次: 高度(B) → 材质(C) → 速度(A)

    step6:最优组合
    指标越大表示受欢迎程度越高。
    速度:选A2(KA2=7.825>KA1=7.05)
    高度:选B2(KB2=8.175>KB1=6.7)
    材质:选C1(KC1=7.975>KC2=6.9)
    所以最优组合是速度高、高度高、材质金属。

    # 10、参考文献

    [1] Scientific Platform Serving for Statistics Professional 2021. SPSSPRO. (Version 1.0.11)[Online Application Software]. Retrieved from https://www.spsspro.com.
    [2] 唐佳丽, 徐章韬. 正交试验中的极差分析与方差分析[J]. 中学数学:高中版, 2017(5):4.

    建议反馈