计量经济学理论/经典线性回归模型的假设
我们通过线性回归创建的估计量为我们提供了变量之间的关系。然而,执行回归并不自动地为我们提供变量之间可靠的关系。为了创建可靠的关系,我们必须了解估计量的性质 并证明关于数据的某些基本假设是正确的。必须了解,拥有良好的数据集对于应用经济学研究至关重要。
在以下四个假设下,OLS是无偏的。这意味着
.
该模型必须在参数方面是线性的。
参数是自变量上的系数,如 和 。这些应该是线性的,因此具有 或 将违反此假设。
Y 和 X 之间的关系要求因变量 (y) 是解释变量和误差项的线性组合。该假设要求模型是完整的(模型规范),因为所有相关变量都已包含在模型中。模型必须在参数方面是线性的,但它不要求模型在变量方面是线性的。公式 1 和 2 描述了一个模型,该模型在参数和变量方面都是线性的。请注意,公式 1 和 2 以不同的符号显示了同一个模型。(1) (2) 为了使 OLS 起作用,指定的模型必须在参数方面是线性的。请注意,如果和之间的真实关系是非线性的,则无法以任何有意义的方式估计系数。公式 3 显示了一个经验模型,其中是二次性质。(3) CLRM 的假设 1 要求模型在参数方面是线性的。OLS 无法以任何有意义的方式估计公式 3。但是,假设 1 不要求模型在变量方面是线性的。OLS 将在公式 4 中生成对的有效估计。(4) 使用普通最小二乘法 (OLS) 方法可以估计模型,这些模型在参数方面是线性的,即使模型在变量方面是非线性的。相反,无法估计模型,这些模型在参数方面是非线性的,即使它们在变量方面是线性的。最后,每个用 OLS 估计的模型都应包含所有相关的解释变量,并且所有包含的解释变量都应是相关的。
所有 不能都具有相同的值。这是完全的多重共线性,不允许。
值必须是随机选择的。换句话说,两个不同的 x 值之间没有相关性: 对于 。
给定自变量 的特定值,误差项的均值为零。 。
在满足以下两个假设的情况下,OLS 是最佳线性无偏估计量(BLUE)。这意味着在所有可能的线性无偏估计量中,OLS 对 和 提供了最精确的估计。
在满足第三个假设的情况下,OLS 是最佳无偏估计量(BUE),因此它甚至优于非线性估计量。同样地,在满足这个假设的情况下, 服从于以 为中心的 Student's t 分布,而 以 为中心以特定方式分布。
误差项的方差是恒定的。 。这意味着误差项 的方差不依赖于 的值。如果情况如此,则误差项被称为同方差的。在经济数据中并非总是如此,例如,一个人的工资变化将随着他们的受教育程度而变化——一个高中辍学者不会有太多工资变化,而那些拥有博士学位的人可能会看到非常不同的工资。
误差项是独立分布的,因此它们的协方差为 0。 。
误差项是正态分布的。