双重差分DID(倍差法)
# 1、作用
双重分析法的原理是使用观测数据模拟实验研究设计,其基本思路是将调查样本分为两组:一组为被政策影响组,即实验组,一组为未被政策影响组,即对照组。首先计算实验组在政策前后某个指标的变化量,再计算对照组在政策前后同一指标的变化量,然后计算上述两个变量的差值,从而反映政策的净影响。
# 2、输入输出描述
输入:因变量 Y 为定类变量,对照组标签 treat,事件发生标签 time,以及控制变量(可以不输入)。
输出:冲击的效应情况和 DID 结果。
# 3、案例示例
案例:中国部分地区在 1994 年实验组颁布了一项政策,而其他地区没有颁布,试用 DID 法分析政策效果。
# 4、案例数据
# 5、案例操作
Step1:新建分析;
Step2:上传数据;
Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;
step4:选择【双倍差分 DID(倍差法)】;
step5:查看对应的数据数据格式,按要求输入【双倍差分 DID(倍差法)】的数据。
step6:设置事件发生节点。
step7:点击【开始分析】,完成全部操作。
# 6、输出结果分析
输出结果 1:交叉汇总表
图表说明:
上表展示了数据各分组的分布情况。
● 事件发生前/事件发生后:
事件发生前(After)——time=0。
事件发生后(Before)——time=1。
● 对照组/处理组:
控制组(Control)代表未受政策干预——treat=0。
实验组(Treated)代表受政策干预——treat=1。
输出结果 2:DID 模型结果
图表说明:
上表展示了双重差分 DID(倍差法)模型的结果。
分析:
从双重差分项 Diff-in-Diff 来看其显著性 P 值为 0.088*,大于 0.05 不呈现显著性,故不拒绝原假设,认为政策干预无效。系数为-2634555497.543,系数小于 0,认为政策的效果为负向。
输出结果 3:时间趋势图
图表说明:
上图展示了实验组和控制组的时间趋势图,虚线为事件发生的时点。
分析:
从图上看,在时间发生前(1994 年)的,控制组和对照组的趋势类似,近似满足平行趋势假设,需要进一步使用事件研究法进行研究。
输出结果 4:事件研究法回归结果表
交互项 | 系数 | 标准误差 | T 值 | P 值 | 95%置信区间 | |
---|---|---|---|---|---|---|
const | 3871104 | 986555687.396 | 0.004 | 0.997 | -1980822938.175556 | 1988565146.175557 |
time | 1623615216 | 1395200433.152 | 1.164 | 0.250 | -1183166015.6057532 | 4430396447.605753 |
Before-3.0 | 526333461.778 | 2301963270.592 | 0.229 | 0.820 | -4104619303.2985206 | 5157286226.8540745 |
Before-2.0 | 1936525074.611 | 2301963270.592 | 0.841 | 0.404 | -2694427690.465187 | 6567477839.687408 |
Before-1.0 | -452620948.889 | 2301963270.592 | -0.197 | 0.845 | -5083573713.965187 | 4178331816.187408 |
current | -806101306.222 | 2301963270.592 | -0.35 | 0.728 | -5437054071.298519 | 3824851458.8540745 |
After1.0 | -7146325839.556 | 2301963270.592 | -3.104 | 0.003*** | -11777278604.631855 | -2515373074.4792604 |
After2.0 | -904418108.889 | 2301963270.592 | -0.393 | 0.696 | -5535370873.965187 | 3726534656.187408 |
After3.0 | 320778565.778 | 2301963270.592 | 0.139 | 0.890 | -4310174199.298519 | 4951731330.8540745 |
1991.0 | 391692214.667 | 1708764575.067 | 0.229 | 0.820 | -3045898703.8606453 | 3829283133.19398 |
1992.0 | -183415024.833 | 1708764575.067 | -0.107 | 0.915 | -3621005943.360646 | 3254175893.693979 |
1993.0 | 3391803238.667 | 1708764575.067 | 1.985 | 0.053* | -45787679.86064577 | 6829394157.193979 |
1994.0 | 2380742422.667 | 1708764575.067 | 1.393 | 0.170 | -1056848495.8606458 | 5818333341.193979 |
1995.0 | 2978912278.667 | 1708764575.067 | 1.743 | 0.088* | -458678639.86064625 | 6416503197.193979 |
1996.0 | 1177080094.667 | 1708764575.067 | 0.689 | 0.494 | -2260510823.860646 | 4614671013.193979 |
1997.0 | 1959957142.667 | 1708764575.067 | 1.147 | 0.257 | -1477633775.8606453 | 5397548061.19398 |
1998.0 | -629668992 | 1395200433.152 | -0.451 | 0.654 | -3436450223.605753 | 2177112239.605752 |
注**:*、**、*分别代表 1%、5%、10%的显著性水平
图表说明:
表内容是使用年份变量与是否处理组变量的交互项进行回归的结果。交互项的系数反映的就是特定年份(Before1-3 意义为事件发生年份前三年,After1-3 意义为后三年)处理组和控制组之间的差异。一般希望事件发生前(Before)的系数不显著,说明满足平行趋势假设,之后(After)再显著,体现政策的效果。
输出结果 5:事件研究法结果图
图表说明:
图内容为表内容的可视化,可以更加直观的看出政策的正负效应。若 95%的置信区间(图中虚线部分)包含了 0 值,则说明处理组和控制组差异不明显,一般希望在事件发生前(Before)出现该情况。若超出了 95%的置信区间则说明政策效应明显,一般希望在事件发生后(After)出现该情况,其在 0 值的上下代表政策的效应正负情况。
分析:
在事件发生前,虚线一直包含在 0,说明处理组和控制组差异不明显,满足平行趋势检验。在事件后,虚线超过了 95%置信区间(虚线),且小于零,可以认为政策存在一个明显的负效应。
# 7、注意事项
- DID 分析在结果 2 已经结束,后续结果为平行趋势假设检验。
- SPSSPRO 使用 DID 为标准 DID。
# 8、模型理论
双重差分是一种尝试采用控制组实际未经处理的结果变化作为处理组倘若未经处理的结果变化的反事实来分析因果效应的方法,通常包括冲击事件、处理组、控制组和时期这四个要素,其经典构造可以表示为如下形式:
其中,Yit 为结果变量,Di 为政策分组虚拟变量,Tt 为政策时间虚拟变量,DixTt 为两者交互项,δ、λ 和 β 为各项前的系数,εit 为随机误差项。对上式取条件期望后,可得到下表所示的估计效应。
其中 β 表示文章所关注的因果效应。双重差分法通常涉及两组人群与两个时期。其中一组人群在第一个时期未接受处理,在第二个时期则受到处理或干预;另一组人群则在两个时期都未接受处理。将个体 i 在时期 t 接受处理定义为定义 Dit=1,未接受处理定义为 Dit=0。一般将在处理组接受处理前的时期记为 T=0,处理后的时期记为 T=1。其中,对处理组个体有 Di1=1,对控制组个体有 Di1=0,对所有个体 i 有 Di0=0。
E(Y|D,T) | T=0 | T=1 | Δ |
---|---|---|---|
D=0 | α | α | λ |
D=1 | α+δ | α+δ+λ+β | λ+β |
Δ | δ | δ+β | β |
双重差分的核心是通过构造交互项来识别政策冲击对受影响个体(处理组)的平均处理效应(average treatment effect on the Treated,ATT),即基于一个反事实框架来评估政策冲击发生与不发生这两种情况下处理结果 Yit 的变化。真实的因果效应需要通过比较处理组接受处理与不接受处理的状态得出,然而在现实生活中,当冲击发生后,我们仅能观察到处理组受到冲击后的情况,无法真正知晓其未受冲击的情况。而在双重差分方法中,控制组提供了一个可供研究的反事实,即可将未受到处理的控制组在观察时期内的“变化”近似于处理组倘若未受到冲击将发生的变化。从处理组前后时期的变化中减去控制组前后时期的变化,即可得到因果效应 β。上述分析的数学表达式如下式所示,第一个中括号内为处理组前后时期的差分效应,第二个中括号内为控制组前后时期的差分效应,两个一次差分再相减后,得到双重差分处理效应:
在实际应用中,双重差分方法经常与面板数据联系起来使用,此时多采用双向固定效应(Two-
way fixed effects)模型,因此双重差分法有时会表述为如下形式:
其中,μi、γi 分别为个体固定效应(individual fixed effects)和时间固定效应(time fixed effects),通过在回归时加入个体虚拟变量和时间虚拟变量便可控制个体固定效应和时间固定效应,而此时如果再放入处理组虚拟变量会带来严格多重共线性。μi、γi 是对个体层面和每期时间的控制,比原本模型中的政策分组虚拟变量 Di(控制至组别层面)和政策时间虚拟变量 Ti(控制处理期前后的效应)更为精细,包含了更多的信息。
# 9、参考文献
[1] Scientific Platform Serving for Statistics Professional 2021. SPSSPRO. (Version 1.0.11)[Online Application Software]. Retrieved from https://www.spsspro.com.
[2]黄炜,张子尧,刘安然.从双重差分法到事件研究法[J].产业经济评论,2022(02):17-36.DOI:10.19313/j.cnki.cn10-1223/f.20211227.002.