极差分析
# 极差分析
# 1、作用
极差分析是一种通过比较极差大小来分析数据的方法,主要用于正交试验的数据分析。其原理是由于正交试验具有正交性和综合可比性,故可以将某个因素某个水平的平均数的数据变化看做该因素不同水平的效应,某个因素各个因素平均数的极差就可以看做该因素在整个试验的效应,该值越大说明对于这个试验越重要。
# 2、输入输出描述
输入: 一个定量实验结果变量、一个或多个定量或定类待检验变量。
输出: 对应的极差值,以及试验影响最大的和最佳因素水平组合。
# 3、案例示例
案例: 根据过山车的属性(速度、高度、材质)构造不同的产品属性组合设计,使用极差分析对其进行评估,确定哪一种属性组合更受欢迎。
# 4、案例数据
极差分析案例数据
# 5、案例操作
Step1:新建分析;
Step2:上传数据;
Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;
step4:选择【极差分析】;
step5:查看对应的数据数据格式,【极差分析】要求自变量 X 至少一项或以上的定量变量或二分类定类变量,因变量 Y 要求为定量变量。
step6:选择自动选择 λ 值或者手动输入 λ 值;
step7:点击【开始分析】,完成全部操作。
# 6、输出结果分析
输出结果 1:因素水平表
图表说明: 上表展示因素水平表,展示不同因素以及对应的水平情况。
输出结果 2:极差分析结果
图表说明: 上表展示了极差分析的结果:
1. Ki 代表的该因素在水平 i 的情况下的实验结果之和。
2. 带有横线的 Ki 代表 Ki 的均值,用于计算 R 值。
3. R 值为极差值,为 Ki 最大的均值减去 Ki 最小的均值,用于对因素的主次进行排序。
4. 因素每水平试验重复数为水平平均进行试验的次数。 5. 当对混合型正交表进行分析时,会附带 R'(折算后的极差)和 d(折算系数)。
主要关注 R 和因素最佳水平,R 值越大说明“高度”属性越重要,因素最佳水平可以得到推荐的组合:速度为快、高度为高、材质为金属。
输出结果 3:因素各水平均值图
图表说明: 上图以可视化的形式展示因素各个水平的均值情况。对试验影响最大的因素为高度。 推荐的组合:速度为快、高度为高、材质为金属。
# 7、注意事项
- 无
# 8、模型理论
正交实验是一种用于设计和分析实验的方法,它通过构建正交表,减少了试验次数,并能独立评估影响因素。正交实验极差分析是正交实验设计的一部分,用于评估不同因素对实验结果的影响。在正交实验极差分析中,我们通常使用极差(Range)来衡量因素对结果的变异性。
假设我们有 k 个因素,每个因素有 s 个水平(即不同的取值),而正交实验设计采用 m 个试验次数。对于正交实验极差分析,计算每个因素的极差需要按照以下步骤进行:
- 对每个因素进行正交表设计,以确保各个水平在各个试验次数中均匀分布。
- 进行 m 个试验并记录每个试验的结果。
- 计算每个因素每个水平下的观测值(试验结果)之间的极差。
- 对每个因素,计算其所有水平极差的平均值,得到该因素的总极差。
- 根据总极差,确定因素对结果的影响程度。较大的总极差表示该因素对结果的影响较大,反之,较小的总极差表示该因素对结果的影响较小。
- 在正交实验中,还可以计算因素之间的交互作用,以了解不同因素之间的相互影响。
# 9、参考文献
[1] Scientific Platform Serving for Statistics Professional 2021. SPSSPRO. (Version 1.0.11)[Online Application Software]. Retrieved from https://www.spsspro.com.
[2] 唐佳丽, 徐章韬. 正交试验中的极差分析与方差分析[J]. 中学数学:高中版, 2017(5):4.