跳转到内容

运输地理与网络科学/空间计量经济学

来自维基教科书,开放的书籍,开放的世界

探索包含区域相互依赖观测的空间数据样本的想法,促使研究人员引入了空间计量经济学[1]。该领域采用计量经济学方法和空间分析来研究观测变量之间的空间自相关或邻域效应[1]。空间计量经济学的概念在三个主要特征方面与传统的计量经济学模型完全不同,即空间依赖性、空间异质性和空间异方差性[2]。空间依赖性是指在附近位置的特征之间观察到正相关或负相关[3]。空间异质性是指因变量和自变量之间关系的差异;而空间异方差性则探索研究区域中空间单元之间未观测成分方差的异质性[4]。鉴于这些特征违反了 Gauss-Markov 假设,包括不相关的和同方差误差项,它们在传统的计量经济学技术中被忽略[1]。例如,Gauss-Markov 假设忽略了空间数据样本中方差的变化,并且只假设单个线性关系具有恒定方差。在过去的五十年中,大量研究[2] 试图利用空间分析中的多元方法来弥合这一差距,包括空间自相关、空间插值和空间交互。下面简要定义了它们各自的内容。

空间自相关

[编辑 | 编辑源代码]

空间自相关统计包括 Moran's 、Geary's 和热点分析(Getis's )并评估空间单元观测之间的依赖关系。为了探索数据的空间自相关,需要预先指定一个空间权重矩阵,该矩阵精确地指出了空间观测之间存在何种关系。空间权重矩阵的正分量表明观测位置和未观测位置的变量之间存在相似性,而负分量则说明存在差异[5]

空间插值

[编辑 | 编辑源代码]

空间插值方法通过利用观测位置的变量值来估计未观测位置的变量。逆距离加权法和克里格法通常用于估计未观测位置的变量值。前者表明,未观测位置的变量空间效应随着距观测位置距离的减小而不断减弱。而后者则在探索空间单元之间系统性和随机空间滞后的情况下,对未观测位置的变量效应进行插值[6]

空间交互

[编辑 | 编辑源代码]

空间交互是主要的空间分析工具之一,也被称为重力模型。重力函数包含空间单元的吸引力、通勤者数量和机会,以及位置之间的邻近关系。然后,通过计算方法和技术(如普通最小二乘法、最大似然法和人工神经网络)估计函数参数[2]

上述空间分析的特征和通用方法为读者提供了关于空间计量经济学分析概念的总体框架。然而,正如本文所详细讨论的,对数据位置方面的量化是空间依赖性、异质性和异方差性分析的基石。本文的其余部分将按以下顺序展开。下一节将讨论对数据位置方面的量化。然后,将提及空间计量经济学史,随后介绍该领域的发展方法和模型。最后,文章将回顾空间计量经济学在交通运输中的应用,并给出结论和未来可能的课题。

量化模型中的位置

[编辑 | 编辑源代码]

空间数据观测通常映射在笛卡尔空间上以显示位置和邻接信息[1]。位置信息由经度和纬度表示,以计算空间中任意点之间的观测距离。临近的观测反映出更大的空间依赖程度,而空间依赖性随着观测之间距离的增加而下降[1]。此外,随着空间的变化,观测之间的(不)相似性意味着数据中的空间异质性[1]。另一方面,邻接信息表示观测区域单元在空间中的相对位置,反映了邻近单元的概念[7]。只有当远离的单元的依赖性随着距离的增加而减弱时,数据中才会观察到空间依赖性。邻近单元之间的相似性也表明空间异质性[7]。下面提供了量化空间邻接和加权空间邻域矩阵的两个示例,以阐明上述概念的应用。

量化空间邻接

[编辑 | 编辑源代码]

为了捕捉空间单元之间的空间邻近性的概念,考虑图 1 中所示的假设区域。每个区域的邻近关系通常记录在一个对称的二元矩阵中[7]。每个元素代表两个区域之间的邻近关系。例如,第 1 行第 3 列的矩阵元素代表区域 1 和区域 3 之间的邻近关系。在二元配置中,矩阵元素用 0 或 1 表示,记录区域之间邻近关系的缺失或存在。已经推荐了许多方法来构建邻近矩阵,包括线性邻近、Rook 邻近、Bishop 邻近和 Queen 邻近。Kelejian 和 Robinson (1995)[8]详细讨论了每种方法。简而言之,下面提到了每种配置的元素概念。

线性邻近:当且仅当两个区域共享一个共同的边缘(在右侧或左侧)时,代表这两个区域之间邻近关系的元素等于 1。

Rook 邻近:当且仅当两个区域共享一个共同的边时,代表这两个区域之间邻近关系的元素等于 1。

Bishop 邻近:当且仅当两个区域共享一个共同的顶点时,代表这两个区域之间邻近关系的元素等于 1。

Queen 邻近:当且仅当两个区域共享一个共同的边或顶点时,代表这两个区域之间邻近关系的元素等于 1。


Spatial Econometrics Analysis
图 1 邻近性测量示例


此外,应该牢记,共享边界的长度也对确定邻近矩阵的元素起着至关重要的作用。两个实体之间的共同边界可能很短或很长,分别导致低或高邻近性。总体而言,邻近矩阵反映了数据中的空间依赖性,测量了相邻观测对向量中观测的平均影响。该矩阵在空间分析方法中的有效性将在方法和模型部分进行讨论。

量化加权空间邻域矩阵

[编辑 | 编辑源代码]

空间权重矩阵是空间计量经济学和空间分析的基石[2]。空间权重矩阵反映了空间单元之间可能的相互关系。每个非负元素代表两个实体之间的空间影响,不具有自影响特性[2]。换句话说,对角线元素等于零;而对称权重矩阵的其他元素则通过多种方法进行测量。然而,目前尚不清楚哪种配置比其他可能的配置表现得更好。因此,实践者通常建议选择最能反映数据空间单元之间实际交互的概化[9]。例如,当您测量森林中种子繁殖的树木时,某种形式的距离倒数可能是最合适的。另一方面,如果您探索通勤者在交通分析区域中的地理分布,那么行程时间或行程成本概化可能更合适。从量化的角度来看,空间权重矩阵配置可能分为两类:二元模式或可变加权模型。每种模式都包含各种方法。邻近矩阵、固定距离、Delaunay 三角剖分和时空窗口通常用于创建二元配置;而距离倒数和无差别区域方法则被提出来测量可变加权矩阵[10]

空间计量经济学历史:生命周期视角

[编辑 | 编辑源代码]

"空间计量经济学"一词的使用可以追溯到 1974 年,当时让·帕兰克在蒂尔堡举行的荷兰统计协会年会上,论证了为城市计量经济模型提供方法学基础的必要性[11]。此后,让·帕兰克和利奥·克拉森于 1979 年发表了一篇题为 "Spatial Econometrics" 的文章[12]

空间计量经济学的历史概述可以分为三个主要阶段,即诞生、成长和成熟,如图 2 所示。诞生阶段始于 1970 年,并发展到 1980 年代后期。该时代代表了空间计量经济学、估计方法、空间统计和空间数据分析等基本概念,并成为成长阶段的基石。必须指出,地理学和区域科学的两个重要进展进一步推动了诞生阶段的演变。一个是地理学中的定量分析革命,同时贝瑞和马布尔出版了题为 "Spatial Analysis: A Reader in Statistical Geography" 的书籍,介绍了空间分析,时间为 1968 年[13]。第二个进展是空间效应开始扎根于区域科学的操作模型,以及区域和城市经济学领域。格兰杰在 1969 年[14]和费舍尔在 1971 年[15]努力引入空间方法,并将其提取的尝试作为 "Econometric Estimation with Spatial Dependence" 发表在应用经济学文献中。


图 2 空间计量经济学的成熟生命周期


在快速发展时期,许多对空间回归问题感兴趣的区域科学家和地理学家涌现,例如 Brundson[16]、Boots、Tiefelsdorf[17] 和 Fotheringham[18]。随后,新一代学者,包括在萌芽阶段的活跃学者的学生,不断努力扩展空间计量经济学领域。例如,Case 在 1991 年[19] 进行了一项研究,通过应用空间随机效应模型来探索印度尼西亚对稻米的空间关系。McMillen 在 1992 年[20] 进一步努力通过采用加权最小二乘法和最大似然估计器来解决 Probit 模型与空间自相关的不一致性,而这种不一致性深深根植于异方差误差。从那时起,公共经济学、城市经济学、房地产经济学和发展[21] 领域出现了大量严谨的研究。此外,空间计量经济学研究为解决模型规范、估计和检验问题做出了贡献。例如,Kelejian 和 Robinson[8] 在 1995 年开发了空间误差成分方法,而 Anselin 和 Kelejian 在 1997 年[22] 将 Moran's I 应用于两阶段最小二乘回归。与此同时,地理加权回归作为空间计量经济学模型中一个关键的步骤,由 Fotheringham 在 1997 年至 1999 年间发展起来,以捕捉空间异质性[4] [18]。发展时期另一个独特的特点是统计软件的革命,以简化空间计量经济学的计算分析[23]。空间回归模型的估计通过 NCGIA 的 SpaceStat 在 1992 年[23] 变得实用。S+SpatialStats 和 Matlab 工具箱是另外两个同时推出的商业软件包[24]。轶事证据表明,空间计量经济学在 21 世纪初已获得了研究人员和从业人员的广泛认可,并已过渡到成熟阶段。发表大量文章和特刊、手册章节、不断发展的软件和商业软件包、不断增长的就业机会和研究经费可能是进入成熟时代的良好迹象。空间计量经济学的概念也继续渗透到犯罪分析、流行病学和公共卫生领域。这一阶段,包括 "空间数据分析:理论与实践"[25]、"用空间误差相关性检验面板数据回归模型"[26]、"空间分析:生态学指南"[27] 和 "贝叶斯疾病地图绘制,空间流行病学中的分层模型"[28] 等多本教科书变得更加普及。建模也进入成熟阶段,引入了最先进的方法,即空间面板模型、空间潜在变量模型和流动模型。规范检验和计算方面以及软件比发展阶段获得了更多关注。例如,拉格朗日乘子检验已显著扩展,以检测多种错误规范来源、不同类型的空间误差相关性和模型选择策略[9][5]

方法和模型

[edit | edit source]

空间计量经济学模型在过去几十年中引起了人们的广泛关注。从建模的角度来看,一种通用方法经常被应用于大多数实证研究中,以检验空间交互效应。Manski 在 1993 年[26] 引入了一个模型来探索空间观测之间的三种不同的交互效应,即内生交互效应、外生交互效应和相关效应。当空间单元的决策取决于其他空间单元的决策时,就会考虑内生交互效应。当空间单元的决策取决于其他空间单元决策的独立解释变量时,就会检验外生交互效应。正如之前所讨论的,当类似的未观察到的空间特征导致类似的行为时,相关效应也在模型中进行测量。空间权重矩阵由 表示。Manski 的通用模型由等式 1 公式化;其中, 代表内生交互效应, 表示外生交互效应,而 表示空间单元扰动项之间的交互效应。此外, 被称为空间自回归系数, 为空间自相关系数, 均为固定但未知参数的向量。

    (1)[29]

分别等于零时,Manski 方程简化为 Kelejian-Prucha 模型和空间 Durbin 模型[28]。换句话说,Kelejian-Prucha 模型考虑了空间滞后的因变量和空间自相关的误差项;而 Anselin 在 1988 年提出的空间 Durbin 模型则检验了空间滞后的因变量和空间滞后的自变量。因此,对一般模型施加更多约束,可以推导出两个主要模型:1) 空间滞后模型和 2) 空间误差模型,分别由公式 2 和 3 表述。

     (2)[29]
    (3) [29]

观察主要模型可以发现,将空间滞后模型中的 ρ 和空间误差模型中的 γ 强制为零,就形成了简单的回归模型。因此,为了检验空间交互效应,许多学者从简单的普通最小二乘模型开始,这被称为“特异性到一般性”方法。

从估计方法的角度来看,研究人员和实践者广泛应用了三种主要方法,包括最大似然法、广义矩估计法和贝叶斯马尔可夫链蒙特卡洛法[29]。这些方法的优缺点在文献中被广泛讨论[2]。例如,广义矩估计法不依赖于“扰动项的正态性”假设,并简化了先前方法的计算难度[2]。然而,此方法忽略了雅可比项,这会导致最终的系数估计值超出其参数空间[29]。尽管如此,Fingleton 和 Le Gallo 在 2008 年[30] 证明了广义矩估计法在包含一个或多个内生解释变量的线性空间模型中很有价值。包含空间滞后的模型可以通过两阶段最小二乘法进行估计[31]。而贝叶斯马尔可夫链蒙特卡洛法和最大似然法对于估计空间误差模型和空间 Durbin 误差模型非常有用[30]。贝叶斯马尔可夫链蒙特卡洛法还将区域科学思想纳入其中,包括 1) 随着距离增加,样本数据影响力的衰减;2) 观测值与相邻观测值的相似性;3) 地方或区域的层次结构;4) 随着空间移动,参数发生系统性变化,作为主观先验信息。

虽然在过去的 25 年里,估计方法和空间计量经济学模型取得了重大进展,但关于空间权重矩阵 () 估计的文献很少。当前空间计量经济学模型的主要弱点之一是空间权重矩阵是在事先确定的。然而,实际上采用了两种一般配置,包括一个非对角元素由 衡量的矩阵,以及一个元素由 衡量的矩阵,其中 代表两个单元之间的距离。此外,当前文献提出了一系列统计检验,例如拟合优度检验,并尽可能选择最佳的矩阵结构[32]

应用

[edit | edit source]

本文部分简要回顾了交通领域使用空间计量经济学模型的研究。浏览之前的研究可以使交通规划者了解空间计量经济学的应用。在交通领域,可能的应用将在课堂上讨论!


结论

[edit | edit source]

在过去的几十年里,区域科学、地理、城市规划和交通研究人员越来越感兴趣将空间计量经济学应用于各种问题。本文尽可能地概述了空间计量经济学和分析的起源、发展、主流和应用。一般计量经济学模型和空间计量经济学模型的主要区别在于,后者能够捕捉空间依赖性、空间异质性和空间异方差性。越来越多的证据表明,忽略空间依赖性、空间异质性和空间异方差性概念会导致许多研究问题的模型错误指定,并误导长期和短期政策[3][33]。然而,研究人员和实践者在这个领域想要探索的核心问题是:哪些、如何以及为什么空间单元相互依赖?回答这些问题不仅扩大了探索最先进方法的思路,而且努力量化空间单元之间相互依赖的空间关系。然而,关于特定权重矩阵配置下空间实体之间相互依赖关系的文献很少。换句话说,关于空间权重矩阵研究的知识还处于起步阶段,近年来引起了人们极大的关注。当前文献表明,由于各种关于空间依赖性的假设,导致了不同的权重矩阵配置,包括径向距离权重、幂距离权重、指数距离权重、空间邻接权重和共享边界权重。然而,哪一种最适合问题尚不清楚。

在方法和模型方面,近几十年来,引入了一些方法,这些方法都源于简单的回归或普通最小二乘模型。Manski 的一般模型可以被称为一种成熟的方法,它包含了空间实体之间所有类型的依赖关系。在模型应用方面,已经进行了大量的研究来探索空间相互依赖性对各种研究主题的影响。然而,在其他交通领域,还有许多开放性的研究思路,这些思路值得在将来进行探索。

参考文献

[edit | edit source]
  1. a b c d e f LeSage, J., & Pace, R. K. (2009). Introduction to spatial econometrics. CRC press.
  2. a b c d e f g Anselin, L. (1988). Spatial econometrics: methods and models (Vol. 4). Springer Science & Business Media.
  3. a b Anselin, L. 和 Griffith, D. A. (1988)。空间效应在回归分析中真的重要吗?区域科学论文,65(1),11-34。
  4. a b Stewart Fotheringham, A.,Charlton, M. 和 Brunsdon, C. (1996)。参数空间的地理:对空间非平稳性的调查。国际地理信息系统杂志,10(5),605-627。
  5. a b Anselin, L. (2001)。空间计量经济学。理论计量经济学伴侣,310330。
  6. Anselin, L. (2001)。计量经济学实践中的空间效应:环境与资源经济学。美国农业经济学杂志,705-710。
  7. a b c Anselin, L. (1995)。空间关联的局部指标 - LISA。地理分析,27(2),93-115。
  8. a b Kelejian, H. H. 和 Robinson, D. P. (1995)。空间相关性:对自回归模型的建议替代方案。空间计量经济学新方向(第 75-95 页)。施普林格柏林海德堡。
  9. a b Anselin, L. (1988)。空间依赖和空间异质性的拉格朗日乘数检验诊断。地理分析,20(1),1-17。
  10. Pace, R. K. 和 Gilley, O. W. (1997)。利用数据的空间配置来改进估计。房地产金融与经济学杂志,14(3),333-340。
  11. Paelinck, Jean HP 和 Peter Nijkamp。“区域经济学中的操作理论和方法。”(1975)。
  12. Paelinck, J. H. P. 和 Klaassen, L. L. H. (1979)。空间计量经济学(第 1 卷)。萨克森豪斯。
  13. Berry, B. J. 和 Marble, D. F. (1968)。空间分析:统计地理学读本。恩格伍德悬崖^e 新泽西州新泽西州:普伦蒂斯-霍尔。
  14. Granger, C. W. (1969)。空间数据和时间序列分析。伦敦区域科学论文,1,1-24。
  15. Fisher, W. D. (1971)。具有空间依赖的计量经济学估计。区域与城市经济学,1(1),19-40。
  16. Brunsdon, C. (1998)。地理加权回归:空间数据分析扩展方法的自然演变。环境。计划。A,30,1905-1927。
  17. Tiefelsdorf, M. 和 Boots, B. (1995)。莫兰 I 的精确分布。环境与规划 A,27,985-985。
  18. a b Fotheringham, A. S. 和 Brunsdon, C. (1999)。空间分析的局部形式。地理分析,31(4),340-358。
  19. Case, A. C. (1991)。家庭需求的空间模式。计量经济学:计量经济学会杂志,953-965。
  20. McMillen, D. P. (1992)。具有空间自相关的概率。区域科学杂志,32(3),335-348。
  21. Pace, R. K.,Barry, R. 和 Sirmans, C. F. (1998)。空间统计与房地产。房地产金融与经济学杂志,17(1),5-13。
  22. Anselin, L. 和 Kelejian, H. H. (1997)。在存在内生回归量的情况下检验空间误差自相关。国际区域科学评论,20(1-2),153-182。
  23. a b Anselin, L. 和 Hudak, S. (1992)。空间计量经济学实践:软件选项回顾。区域科学与城市经济学,22(3),509-536。
  24. Krivoruchko, K. (2011)。面向 GIS 用户的空间统计数据分析。美国红兰兹:Esri Press。
  25. Robert, H. (2003)。空间数据分析:理论与实践。
  26. a b Baltagi, B. H.,Song, S. H. 和 Koh, W. (2003)。检验具有空间误差相关的面板数据回归模型。计量经济学杂志,117(1),123-150。 无效的 <ref> 标签;名称“Twenty Six”在内容不同情况下被多次定义
  27. Dale, M. R. 和 Fortin, M. J. (2014)。空间分析:生态学家的指南。剑桥大学出版社。
  28. a b Lawson, A. B. (2013)。贝叶斯疾病地图绘制:空间流行病学中的分层建模。CRC 出版社。 无效的 <ref> 标签;名称“Twenty Eight”在内容不同情况下被多次定义
  29. a b c d e Elhorst, J. P. (2010)。应用空间计量经济学:提高标准。空间经济分析,5(1),9-28。
  30. a b Fingleton, B. 和 Le Gallo, J. (2008)。估计具有内生变量、空间滞后和空间相关扰动的空间模型:有限样本性质*。区域科学论文,87(3),319-339。
  31. Kelejian, H. H. 和 Prucha, I. R. (1998)。用于估计具有自回归扰动的空间自回归模型的广义空间两阶段最小二乘法程序。房地产金融与经济学杂志,17(1),99-121。
  32. Dray, S.,Legendre, P. 和 Peres-Neto, P. R. (2006)。空间建模:邻域矩阵主坐标分析 (PCNM) 的综合框架。生态建模,196(3),483-493。
  33. Case, A. (1992)。邻域影响与技术变革。区域科学与城市经济学,22(3),491-508。
华夏公益教科书