若存在回归系数
显著,就表示调节效应显著。此时称 D 对 Y 的因果影响受到 M
的调节,可以将方程重写:
如果 > 0,则 D 对 Y
的正面影响随着 M 的增大而增强(或负面影响随着 M 的增大而减弱);如果
β3 < 0,则 D 对 Y 的正面影响随着 M
的增大而减弱(或负面影响随着 M 的增大而增强)。
如果 在统计上显著,则称观测到了显著的调节效应。但
的大小和统计显著性是否具有经济意义,要视具体的研究情境而定,因为此时
的含义是当 M = 0 时 D 对
Y 的因果效应。很有可能当 M = 0 时 D 对 Y
影响不显著,才是符合理论预期的。这里我的理解是:若处理变量 D 对 Y
的影响效应是不显著的,但是在调节变量 M 的作用下才会存在作用效应。
除了报告系数的估计结果之外,通常还会根据需要报告因果效应的一个或几个估计值(以及标准误、置信区间、显著性检验的
p 值等)。例如, ( 对于样本中的平均观测个体,D 对 Y
的因果效应有多大) ,或者 、 等。
根据公式推导上图调节效应关系,可知:
(实线斜率为 ,截距是 )实线表示因果效应的估计值,虚线表示给定置信水平的置信区间。可知:当
M < 时,D 对 Y
的因果效应是负向的;当 M <
时,这种负向效应在统计上显著; 当 M > 时,D 对 Y 的因果效应是正向的;当 M
> 时,这种正向效应在统计上显著。
当调节效应是虚拟变量的情形。当调节变量 M
为虚拟变量时,还可以把交互项模型等价地理解为分组回归:
意味着当 M = 1 和 M = 0
着两种情况是讨论分组回归两个组之间的组间异质性,可以理解为我们平常在论文中看到的异质性检验的做法,例如:当
M = 1(男生)和 M = 0 (女生)时,D 对 Y
研究的时学习天赋和学习成绩之间的关系。
分组回归下 D 对 Y
的因果效应的组间异质性可以通过交互项模型来检验,即表现为交互项 M × D
系数估计的统计显著性。这种检验总是有必要的,因为组间异质性不能诉诸于直观判断。例如,D
对 Y 的因果效应在 M = 0 组是不显著的,在 M = 1
组是显著的,但它们之间的差异很可能是不显著的。就是说:在M=0\1
的调节作用下的分组回归,我们除了要讨论组内的 D 对 Y
的显著性,也要讨论组间的差异是否是显著的,此时就表现为对交互项 M × D
系数估计的统计显著性探究。
为了和调节效应的基本模型相适应,可以对(2)进行转换,此时 是 M = 1 组时和 是 M = 0 组时分别 D 对 Y
的因果效应: 因此,当调节变量为虚拟变量时,有三种呈现结果的方式:
第一种是报告(1)式的结果,这种方式的好处是直接显示了 D 对 Y
的因果效应的组间异质性(看交互项系数),缺陷是 M = 1
组的因果效应没有直接显示;
当处理变量 D 和调节变量 M
均为虚拟变量时,交互项系数有一种方便的理解:处理组(D = 1)与控制组(D =
0)的结果均值的组间差异之差异,简称双重差分(Difference in
Differences)。对于(1)式的转换形式: 在(1)式中关于调节效应是否对 D 对 Y
产生影响主要是看交互项系数 ,对(6)进行运算可知: 例如,Y 表示工资水平,D 表示是否上大学,M 表示是否为男性,则
表示男性的上大学回报率与女性的上大学回报率的差异。
我们可以这样理解: 男生 A 上了大学和没有上大学的工资水平差额,
女生 B
上了大学和没有上大学的工资水平差额,而有上大学和没上大学的工资水平差额可以理解为上大学的回报率,男性的上大学回报率与女性的上大学回报率的差异
,这个系数可以理解为两组人群上大学回报率的组间异质性显著有多大。
特别地,当 D 为处理实施后的虚拟变量,M
为是否最终接受处理的虚拟变量,这种特殊的调节效应模型就是双重差分模型。反过来说,无论
D 和 M
是离散变量还是连续变量,无论其变动性是截面维度还是时间维度,交互项系数都应该在双重差分的意义(组间异质性)下去理解。
如何在双重差分的意义下表述交互项系数的经济含义?
D
M
Y
经济含义
是否上大学 (虚拟变量)
是否是男生 (虚拟变量)
工资水平
男生和女生上大学的回报率的差异
是否上大学 (虚拟变量)
家离大学有多远 (连续变量)
工资水平
家距离大学的距离远近对上大学回报率的差异
一国金融发展水平的指标 (连续变量)
某一行业外部融资依存度的指标 (连续变量)
该国该行业增加值的增长率
一国不同外部融资依存度不同行业下,金融发展水平对该行业增长率的影响
数字化转型 (连续变量)
是否是政策试行区 (虚拟变量)
GDP
是否是政策试行区的分组下,数字化转型对GDP增长的影响
调节效应分析和异质性分析的关系
调节效应分析和异质性分析这两者是一回事。最简单的理解:当调节变量 M
是虚拟变量时, 相当于把全样本分为 M = 0 和 M = 1 两个组,交互项 M × D
的系数就是分组进行的 Y 对 D 的回归中 D 的系数的组间异质性。当 M
是连续变量时,本质上并没有发生变化,D 对 Y 的因果效应受到 M
的调节,也就是可以理解为,D 对 Y 的因果效应在高 M 组和低 M
组之间存在异质性。而异质性分析更重要的作用正是通过分析因果关系
的作用机制来强化因果关系论证。
并且调节效应分析和平时我们论文看到的异质性分析(总样本回归和分样本回归)其实还是存在较大的区别的,调节效应和分组回归的区别:分组回归:放宽了假设,允许控制变量系数不一致;调节效应:做交互项时,控制变量系数一样。假设存在两个分组为
D = 0 和 D = 1:
当在调节效应分析的回归中做交互项的时候,是要求默认假设两个分组的控制变量的系数在回归中要求是一样的,但是在分组回归中,我们放宽了假设,允许分组回归的方程结果中控制变量的系数不一致。
2. 调节效应变量中心化处理
有时会对调节变量进行中心化(去均值)处理,中心化的意义还在于改善对结果的理解。中心化后,
变量的原点移到了样本均值的位置,将(8)式改造成如下等价形式:
进行这种处理的理由并不是有些文献所声称的为了避免变量之间的多重共线性,而仅仅是为了让一次项系数
具有更直观的含义,甚至在有时候我们可以通过中心化的手段使得回归参数可以显著:
可知,此时
为平均观测个体 的
D 对 Y 的因果效应。
3. 调节效应分析论证因果关系
如果从统计上发现了 D 与 Y 的相关性,并且想要主张 D 是 Y
的原因,那么可以通过检验 D 影响 Y 的某个具体机制来对从 D 到 Y
的因果关系进行论证。论证的逻辑如下:
提出一个 D 影响 Y 的理论 T。根据这个理论 T ,D 通过某个机制影响
Y,并且可以识别出这一机制在某些子总体中存在, 在另一些子总体中不存在,令
M = 1 表示存在这一机制的影响下 D 对 Y 效应,M = 0 表示不存在这一机制下的
D 对 Y 的影响效应;
在 M = 1 组,发现 D 与 Y 的相关性继续存在,而在 M = 0 组,D 与 Y
的相关性不复存在;
可能导致 D 与 Y 出现相关性的竞争性解释还包括 Y 影响 D 的反向因果理论
R,或者有混淆因素同时影响 D 和 Y 的遗漏变量理论 C。如果无法想象理论 R
或理论 C 发挥作用的机制在 M = 1 和 M = 0 组存在差异,则理论 R 或理论 C
很可能不成立。否则,应该在 M = 0 组也观察到 D 与 Y 的相关性。
这样就完成了因果关系的强论证。这一逻辑的总结见表
1。但是其实用最大白话说着来理解就是:研究 D 与 Y
的相关性时,首先我们先从 D 通过某个机制 T 影响 Y ,也就是最纯粹的研究从
D 到 Y 的因果关系,但是也许会存在反向因果理论 R 或者是遗漏变量理论 C
的存在导致了有 D 与 Y
这样的相关性关系,但是这个时候我们通过引入两组不一样的样本进行回归(M =
1 和 M = 0)。
有时两组中 D 与 Y 的相关性都存在,但在 M = 1 组这种相关性更强,表现在
Y 对 D 的回归中 D 的系数估计绝对值在 M = 1
组更大,且组间差异在统计上显著。这时至少可以说,D 与 Y
的相关性不全是理论 R 或理论 C 所带来的,否则这种相关性应该在 M = 1 和 M
= 0 这两组的组间差异是显著无差异的。这样尽管没有证伪理论 R 或理论
C,但至少证实了理论
T,也在因果论证上迈出了一大步。这一弱论证的逻辑可以通过对表 1
稍作修改来总结,如表 2 所示。
其实上述讨论了两种情况,第一种是当调节变量 M
是一个二元的虚拟变量的时候,我们怎么通过对两组(M = 1 和 M =
0)的组间异质性分析来得出 D 对 Y
的因果关系的论证,以及当调节变量是一个连续的情况。而当我们使用这个调节变量的时候就已经默认了其实调节效应,接着在这个成立了的调节效应下,我们去讨论
D 对 Y 的因果关系,如果调节效应下的分组的 D 对 Y
的因果关系是相同的,即是在 M = 0 组也观察到与在 M = 1 组的 D 与 Y
的相关性一致的结果,那么就是证明了机制 T (我们认为可能存在的 D 对 Y
的因果关系)其实是不成立的。但是我们一般在实证当中都是要求某种机制对某对分组之间产生组间差异,而其他机制无法在该分组组间产生相同的差异,就证明了在该分组的调节效应对于
D 对 Y 的关系产生作用。
调节效应分析是一种很重要的因果论证手段,但在使用这种手段之前,首先要发展出一个说得通的理论,即是我们事先提出一种
D 对 Y 的理论机制
T:如果金融促进增长这个“故事”成立,那么就应该看到不同行业的效应大小不同(因为对金融的需求不同);如果超级明星效应这个“故事”成立,那么就应该看到不同选手的效应大小不同(因为激励强度不同)。然后再构建相应的交互项模型去验证这个理论。这就是因果推断理论先行(Theory
Driven)的含义。
6. 调节效应的操作建议
将因果关系的作用机制检验视为因果识别的重要手段,尽量正式地讨论其如何有助于强化对文章主题(从
D 到 Y 的因果关系)的论证;