GMM估计
# 1、作用
GMM 估计和 TSLS 两阶段最小二乘回归都用于解决内生性问题的一种方法,如果存在异方差 GMM 的效率会优于 TSLS,但通常情况下二者结论相似,很多时候研究者会认为数据或多或少存在异方差问题,因而可直接使用 GMM 估计。
# 2、输入输出描述
输入:因变量 Y 要求为一个定量变量。内生变量 X1 要求为定量变量。
工具变量 Z 为定量变量,且个数要大于等于内生变量个数。
外生变量 X2 要求为定量变量,若为定类变量,建议自行对其进行哑变量化后再进行处理。
输出:回归估计系数及拟合效果。
# 3、案例示例
案例:想要研究影响工资收入的因素,我们根据理论知识,选用能力、受教育年限、是否居住于大城市、在现单位工作年限作为自变量。但是我们很快面临了一个问题,就是这个能力变量无法获得,因为一个人的能力我们很难了解,也很难衡量,这就是遗漏变量问题。解决方法:我们可以引入代理变量的概念,选择智商作为“能力”的一个代理变量, 智商解释了能力的一部分,这个是符合常理的,但由于智商不能完全度量能力,依旧是存在内生性问题。所以选用智商作为内生变量,并且由理论基础可以知道,在校成绩、母亲受教育水平与智商相关,与收入相关不大,由此选用这两个因素作为工具变量,建立 GMM 估计。
# 4、案例数据
# 5、案例操作
Step1:新建分析;
Step2:上传数据;
Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;
step4:选择【GMM 估计】;
step5:查看对应的数据数据格式,要求输入【GMM 估计】数据;
step6:点击【开始分析】,完成全部操作。
# 6、输出结果分析
输出结果 1:变量类型
字段名 | 变量类型 |
---|---|
工资 | 因变量 |
智商 | 内生变量 |
母亲受教育年限 | 工具变量 |
成绩 | 工具变量 |
受教育年限 | 外生变量 |
是否大城市 | 外生变量 |
当前单位工作年限 | 外生变量 |
图表说明:上表为模型变量类型。
内生变量和外生变量都是解释变量。外生变量是指可以直接完全对因变量产生影响的解释变量;内生变量是指可以直接但不完全对因变量产生影响的解释变量(通常包括有出现 X 变量遗漏、X 存在测量误差、XY 双向影响这三种情况的变量)。
工具变量是为了把内生变量中能对因变量的产生影响的那部分过滤出来。工具变量通常选取与内生变量 X1 有着强相关,但其与因变量 Y 有着弱相关的那些变量。
输出结果 2:内生性检验
检验 | 统计量 | P 值 |
---|---|---|
C 统计量 | 5.261 | 0.022** |
图表说明:上表格展示了内生性检验结果,显著性 P 值为 0.022**,水平上呈现显著性,拒绝原假设,选中的内生变量中具有内生性。
输出结果 3:过度识别检验
检验 | 统计量 | P 值 |
---|---|---|
Hansen J 检验 | 0.117 | 0.732 |
图表说明:上图展示了过度识别检验结果,显著性 P 值为 0.732,水平上不呈现显著性,不能拒绝原假设,工具变量全为外生。
输出结果 4:GMM 估计结果
图表说明:上表格展示了 GMM 估计的参数结果及检验结果,wald 值为 270.913,其显著性 P 值为 0.000***,水平上呈现显著性,拒绝原假设,说明解释变量中至少有一个变量会对被解释变量产生显著影响。
# 7、注意事项
-如果模型为恰好识别(即工具变量个数等于内生变量个数),则 GMM 完全等价于两阶段回归 2SLS。故使用 2SLS 就够了。在过度识别(工具变量多于内生变量)的情况下,GMM 的优势在于,它在异方差的情况下比 2SLS 更有效率。由于数据或多或少存在一点异方差,故在过度识别情况下,一般使用 GMM。
- 内生性问题首先是理论模型,需要根据理论研究来发现可能存在的内生性问题,其次才是统计模型,在发现可能存在的内生性问题后用统计模型去验证。所以内生性问题不是靠统计发现的,是要自己去发掘的。
# 8、模型理论
GMM 是矩估计(MM)的推广。在恰好识别情况下(待估参数个数等于矩条件个数),目标函数的最小值等于 0,GMM 估计量与 MM 估计量等价;然而在过度识别情况下(待估参数个数小于矩条件个数),MM 不再适用,GMM 可以有效地组合矩条件,使 GMM 比 MM 更有效。
为了解决过度识别问题,有三种解决思路:
第一,去掉多余的矩条件,使矩条件的个数等于未知参数的个数,或者说工具变量的个数等于参数的个数,也就是使用矩估计 MM 的方法来求解。
第二,既然无法满足每一个样本矩为 0,但可使它们尽可能地接近 0,因此可像 OLS 法那样让它们的平方和最小,即求如下问题的极小值。
第三,如同第二种那样使各样本矩接近 0,但对不同的样本矩给予不同的权重。
其中,广义矩估计 GMM 也就是依据第三种思路得到的,在选择适当的权矩阵后,来求解极小化问题。
# 9、参考文献
[1] Scientific Platform Serving for Statistics Professional 2021. SPSSPRO. (Version 1.0.11)[Online Application Software]. Retrieved from https://www.spsspro.com.
[2]陈强,高级计量经济学及 Stata 应用[M], 高等教育出版社,2014.