最近问纵向数据分析的同学贼多,像潜增长,GEE,多水平,之前都有写,今天偷空出个简易的交叉滞后教程哈,大家只要遇到像causal models,cross- lagged panel models,linear panel models 和autoregres-sive cross- lagged models 这些,都要反应过来他们都是一个东西,都叫面板模型,统一的数据特点就是把变量纵向测量很多波,然后想探讨变量间的关系,最简单的情形就是两波的时候啦,如下图:
我们看着这个图,可以自然而然地写出来这两个方程:
上面式子中的β1和β3叫做自相关系数,描述了此构象的稳定性。越大越稳定,很好理解哈。
β2和β4叫做交叉滞后系数,表示一个构象对滞后的另外一个构象的作用。这个系数是在控制自身预测作用后体现出来的一个变量对滞后一期的另外一个变量的作用,所以叫做滞后效应,其相对于传统回归的优势就在于其控制了自回归效应,然后在面板数据中我们既可以让x1影响y2,也可以让y1影响x2,图中就有一个交叉,所以就叫交叉滞后模型:
The fact that prior levels of the outcome construct are controlled for allows one to rule out the possibility that a cross-lagged effect is due simply to the fact that X and Y were correlated at time 1.
当然啦,上面的例子都是两个构象和两个时点的情况,该模型也可以延伸到多个构象和多个时间点,相应的系数都是一个意思。
The preceding model can be extended to more than two occasions and more than two constructs. The autoregressive and cross-lagged effects retain the same meaning.
交叉滞后的优势
搞纵向数据的时候我们其实是需要一个变量随时间变化的假设或者理论的,但是交叉滞后模型并没有这个一个假设,我们只是单纯地将自回归效应加进去而已,所以有人其实是不赞成这种方法,反而更加倾向于潜增长或者GEE等明确变异关系的方法:
path models, such as the panel model,should be avoided because they do not begin with an explicit statement of the expected change process
但是对变量间的具体变化并不关心的时候,交叉滞后不失为一种好方法,好处体现在:
- 对相互作用(Reciprocal Effects)的研究上
相互影响的关系其实是很多的,比如母亲和子代相互影响,人和环境相互影响等等,交叉滞后模型可以让这种关系的研究变得更容易,比如你可以很容易地通过交叉滞后模型知道到底是x在影响y还是y在影响x,或者是相互都有影响,以及每个路径的强度:
Results from a panel analysis can b