SPSSPRO,让数据分析更简单,问卷调查类数据分析不再愁 产品介绍 帮助中心 客户端
微信登录
  • 产品简介

  • 我的数据

  • PRO绘图

  • 数据处理

  • 数据分析

    • 描述性分析

    • 问卷分析

    • 综合评价

    • 差异性分析

    • 相关性分析

    • 预测模型

    • 统计建模

      • 主成分分析(PCA)
      • 典型相关分析
      • 泊松分布检验
      • 游程检验
      • 逐步回归
      • 线性判别
      • 关联分析
      • 拟合工具箱
      • 极差分析
      • 二阶聚类
      • 混合模型
        • 1、作用
        • 2、输入输出描述
        • 3、案例示例
        • 4、案例数据
        • 5、案例操作
        • 6、输出结果分析
        • 7、注意事项
        • 8、模型理论
        • 9、手推步骤
        • 10、参考文献
      • 对数线性模型
      • 广义线性模型
      • 广义估计方程
    • 计量经济模型

    • 医学统计模型

    • 机器学习分类

    • 机器学习回归

    • 规划求解

    • 研究模型

    • 信号分析

    • 自定义算法

    • 过程能力分析

    • 控制图

    • 测量系统分析

    • 可靠性生存分析

混合模型

操作视频
SPSSPRO教程-混合模型

# 混合模型

# 1、作用

混合模型用于估计固定效用对因变量Y的影响水平以及随机效应对因变量Y的影响差异。

# 2、输入输出描述

输入:1个定量因变量、固定变量、随机变量。
输出:固定效应水平和随机效应方差结果。

# 3、案例示例

案例:假设你正在研究不同植物品种在不同环境条件下的生长。你有一个数据集,其中包括以下信息:
固定效应:不同植物品种(假设有3个品种)。
随机效应:不同生长箱(假设有4个生长箱)和不同施肥水平(假设有2个水平)。
使用线性混合模型来分析这些数据,考虑到不同植物品种、施肥水平和生长箱对植物生长的影响。

# 4、案例数据


混合模型案例数据

# 5、案例操作

Step1:新建分析;
Step2:上传数据;
Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;

step4:选择【混合模型】;
step5:查看对应的数据数据格式,按照【混合模型】要求拖入变量
step6:点击【开始分析】,完成全部操作。

# 6、输出结果分析

输出结果1:固定效应检验

项 分子自由度 F P
PlantVariety 2 1.135 0.326

图表说明:上表展示了固定效应检验的结果,可以确定固定变量是否与因变量存在显著关联。 对于PlantVariety,F检验的显著性P值为0.326,水平上不呈现显著性,说明PlantVariety对Growth没有显著性影响。

输出结果2:固定效应估计结果

图表说明:上表是固定效用的估计结果。
(1)对于定量固定变量,固定效应的估计值表示每个定量变量单位的变化对因变量的平均影响。
(2)对于定类固定变量来说,固定效应的估计值表示相对于基准类别的平均差异(如果说某个因子有三个类别:A/B/C,以A作为基准类别,可以求出B/C的估计值):
● 如果估计值为正,表示相应的类别相对于基准类别在因变量上有正的平均差异;
● 如果估计值为负,表示相应的类别相对于基准类别在因变量上有负的平均差异。

输出结果3:随机效应方差估计结果

图表说明:上表是随机效用方差估计结果,随机效应的方差代表该变量对于因变量Y影响时,不同组别之间是否有着差异性。

# 7、注意事项

  • 选择固定效应变量还是随机效应变量取决于你对研究问题的理解、研究设计以及数据的特点。以下是一些指导原则:

(1)固定效应变量:如果你感兴趣的是研究样本中的个体之间的差异,而不是对整个人群进行推断,通常选择固定效应变量。例如,如果你想知道不同个体之间的特征对于某种结果的影响程度,固定效应模型可以提供对个体之间差异的更详细的解释。
(2)随机效应变量:如果你感兴趣的是对整个人群的推断,但是认识到个体之间可能存在随机差异,或者希望通过随机效应考虑个体之间的相关性,可以选择随机效应变量。随机效应模型可以更好地处理个体间的随机差异,提供更稳健和更一般化的推断。

# 8、模型理论

混合线性模型是一种考虑了固定效应和随机效应的线性模型,公式如下:

  • Y 是因变量向量。
  • X 是固定效应的设计矩阵。
  • β 是固定效应的参数向量。
  • Z 是随机效应的设计矩阵。
  • b 是随机效应的参数向量,满足 )b_∼_N(0,G),其中 G 是随机效应的协方差矩阵。
  • ϵ 是误差项,满足 ϵ_∼_N(0,R),其中 R 是误差项的协方差矩阵。

固定效应:Xβ 表示固定效应对因变量的影响。这部分效应是我们感兴趣的,因为它反映了在整个样本中固定效应的平均影响。
随机效应:Zb 表示随机效应对因变量的影响。这部分效应用于解释不同层次之间的变异性,例如不同个体之间的差异。
误差项:ϵ 表示未被模型考虑的其他因素对因变量的影响,以及由于测量误差引起的变异。

# 9、手推步骤

植物种类 施肥 长势
植物1 适量 8.4
植物2 适量 9.1
植物2 大量 5.3
植物1 大量 5.1
植物2 少量 5.9
植物1 少量 6.2

因变量(观测值):长势,固定变量:植物种类,随机变量:施肥

step1:构造模型
混合模型公式:

Y=Xβ+Zb+ε

X:固定效应(植物种类)的设计矩阵
β:固定效应系数(植物种类的效应)
Z:随机效应(施肥)的设计矩阵
b:随机效应系数,假设b∼N(0,G)
ε:残差,ε∼N(0,R),通常R=σe2I,表示残差的协方差矩阵R的结构
固定效应系数β=[μ,βplant2]T
其中μ是截距(植物1的平均效应),βplant2是植物2相对于植物1的效应。
设计矩阵

X=[101111101110]

行对应6个观测,列1是截距,列2是指示植物2。
随机效应是施肥,有 3 个水平:适量、大量、少量。假设它们来自N(0,σb2)。
施肥水平顺序:适量、大量、少量
设计矩阵

Z=[100100010010001001]

每行只有一个 1,表示该观测属于哪个施肥水平。

step2:求解方程
将模型写为矩阵模式有

[8.49.15.35.15.96.2]=[101111101110][μβplant2]+[100100010010001001][b1b2b3]+[ε1ε2ε3ε4ε5ε6]

其中,b∼N(0,σb2I3),ε∼N(0,σe2I6)。
已知G=σb2I3,R=σe2I6,通过最小二乘法可以得到MME

[XTR−1XXTR−1ZZTR−1XZTR−1Z+G−1][β^b^]=[XTR−1YZTR−1Y]

代入R−1=1σe2I,G−1=1σb2I,令λ=σe2/σb2,两边同时乘以σe2有

[XTXXTZZTXZTZ+λI][β^b^]=[XTYZTY]

计算:

XTX=[111111011010][101111101110]=[6333]ZTZ=[200020002]XTZ=[111111011010][100100010010001001]=[222111]ZTX=[110000001100000011][101111101110]=[212121]XTY=[111111011010][8.49.15.35.15.96.2]=[40.020.3]ZTY=[110000001100000011][8.49.15.35.15.96.2]=[17.510.412.1]

代入得到

[6322233111212+λ002102+λ021002+λ][μ^β^plant2b^1b^2b^3]=[40.020.317.510.412.1]

step3:求解λ

施肥水平 j 植物1 (i=1) 植物2 (i=2) 施肥水平平均
适量 (1) 8.4 9.1 8.75
大量 (2) 5.1 5.3 5.20
少量 (3) 6.2 5.9 6.05
植物平均 6.5667 6.7667 总平均=6.6667

通过方差分析法求解随机效应的方差。
总平方和SST:

SST=∑i,j(Yij−Y¯)2Y¯=40.0/6=6.667

计算得到SST=14.053
施肥平方和 SSA(随机效应因子):

SSA=∑j=1anj(Y¯j−Y¯)2

其中:
a = 施肥水平数(这里 a=3)
nj= 第 j个施肥水平的观测数(这里每个nj=2)
Y¯j= 第 j个施肥水平的平均值
Y¯= 总平均值
计算得到SSA≈13.7424
植物种类平方和 SSB(固定效应因子):

SSB=∑i=1bni(Y¯i−Y¯)2

其中:
b= 植物种类数(这里 b=2)
ni= 第 i个植物种类的观测数(这里每个ni=3)
Y¯i= 第 i个植物种类的平均值
Y¯= 总平均值
计算得到SSB=0.06
误差平方和SSE:

SSE=SST−SSA−SSB=14.053−13.7424−0.06=0.2503
来源 平方和 SS 自由度 df 均方 MS 期望均方 E(MS)
施肥(A) 13.7424 2 6.8712 σe2+2σb2
植物种类(B) 0.0600 1 0.0600 (固定效应,与F检验有关)
误差 0.2503 2 0.12515 σe2

自由度:施肥水平数 3-1=2,植物种类数 2-1=1,误差 df = (3-1)(2-1)=2
所以σe2=0.12515,σb2=(6.8712−0.12515)/2≈3.373,λ=σe2/σb2=0.0371

step4:求解模型
将λ代入有

[6322233111212.0371002102.0371021002.0371][μ^β^plant2b^1b^2b^3]=[40.020.317.510.412.1]

对于随机效应有∑b^j=0,计算得到

b^1≈2.0453,b^2≈−1.4397,b^3≈−0.6057,μ^≈6.567,β^plant2=0.2

固定效应(植物种类):
植物1均值 ≈ 6.567
植物2与植物1的差 = 0.2
因为植物2和植物1之间只有0.2的差异,所以植物种类对长势的影响不大。
随机效应(施肥):
适量 ≈ 2.0453
大量 ≈ -1.4397
少量 ≈ -0.6057
对于随机效应有:施肥影响明显,适量最好,大量最差。

# 10、参考文献

[1] Scientific Platform Serving for Statistics Professional 2021. SPSSPRO. (Version 1.0.11)[Online Application Software]. Retrieved from https://www.spsspro.com.

建议反馈