跳转到内容

计量经济学理论/多重共线性

来自维基教科书,开放的书籍,开放的世界

在对多个解释变量进行回归分析时,经常会遇到两个变量对因变量产生相同影响的问题。例如,假设你父亲的阅读水平和母亲的阅读水平可以预测你最终的最高阅读水平 **(YourLevel = a + b*FatherLevel + c*MotherLevel + u)**。然而,你的父母的阅读水平很可能很相似,因此使用两者可能是多余的。这就是所谓的 **多重共线性**。这个问题会导致估计量的偏差。假设我们可以通过你母亲的水平找到你的水平。**YourLevel = a + c*MotherLevel + u。**如果我们加上你父亲的水平,我们会提高对你水平的预测,尽管在现实生活中你的水平不会有任何提高。

检测多重共线性

[编辑 | 编辑源代码]

检测多重共线性可能比上面的例子更难。但第一步应该是检查正在测试的理论。使用母亲的水平和父亲的水平是多余的吗?如果这没有产生任何结果,可能是因为理论更复杂,导致多重共线性被隐藏,可以使用几种计量经济学技术来查找问题。

**1) 当添加或删除预测变量时,估计回归系数发生重大变化。**首先用 "FatherLevel" 进行回归,然后不使用它进行回归,可能会产生很大的差异,这表明存在错误。

**2) 简单线性回归的非显著结果。**显然,如果我们发现,在使用 FatherLevel 和 MotherLevel 的情况下,两者都不显著,那么就会发生一些奇怪的事情,这表明可能存在多重共线性。

**3) 估计回归系数的符号与预测相反** 如果在使用 FatherLevel 和 MotherLevel 的回归中,**b** 为正,但 **c** 为负;我们从理论上知道,母亲的阅读水平越高不会导致孩子成为一个更差的读者。这可能是多重共线性的一个迹象。

4) 正式检测 - 耐受度或方差膨胀因子 (VIF)

耐受度小于 0.1 表明存在多重共线性问题。

华夏公益教科书