跳至内容

交通/选择建模基础

来自维基教科书,开放书籍,开放世界

出行方式选择分析 是传统的四步交通预测模型中的第三步,紧随出行生成目的地选择,但在路线选择之前。虽然出行分配的区域间相互作用分析产生了一组起点-目的地 (OD) 表格,该表格说明了旅行的目的地,但出行方式选择分析使模型构建者能够确定将使用哪种交通工具。

非聚合旅行需求模型

[编辑 | 编辑源代码]

旅行需求理论在交通生成附录中介绍。该领域的核心是继斯坦·华纳 (Stan Warner) 在 1962 年发表的《城市出行中的模式战略选择:一项二元选择研究》(Strategic Choice of Mode in Urban Travel: A Study of Binary Choice) 之后发展的一套模型。华纳利用来自 CATS 的数据,使用生物学和心理学中的模型研究了分类技术。基于华纳和其他早期研究者的工作,非聚合需求模型应运而生。分析是非聚合的,因为个人是观察的基本单位,但同时又是聚合的,因为模型产生了一组描述人口选择行为的单一参数。行为被纳入是因为该理论使用了经济学中的消费者行为概念和心理学中的部分选择行为概念。加州大学伯克利分校 (尤其是丹尼尔·麦克法登,他因其努力获得了诺贝尔经济学奖) 和麻省理工学院 (摩西·本-阿基瓦)(以及与麻省理工学院相关的咨询公司,尤其是剑桥系统公司)共同发展了现在被称为选择模型、直接需求模型 (DDM)、随机效用模型 (RUM) 或其最常用的形式——多项式 logit 模型 (MNL) 的模型。

选择模型吸引了大量的关注和研究;国际交通行为研究协会的会议记录了模型的演变。这些模型在现代交通规划和交通工程教科书中都有介绍。

模型快速发展的另一个原因是迫切的需求。当时正在提出一些系统(尤其是公交系统),而这些系统没有使用转向曲线中使用的经验数据。选择模型允许比较两个以上的备选方案,以及备选方案属性的重要性。人们普遍希望有一种分析技术,这种技术较少依赖聚合分析,并且具有更大的行为内容。此外,选择模型也具有吸引力,因为它们在逻辑和行为方面可以追溯到 20 世纪 20 年代,同时在凯尔文·兰卡斯特的消费者行为理论、效用理论和现代统计方法中都有根源。

Logit 模型

[编辑 | 编辑源代码]

Logit 模型由丹尼尔·麦克法登首次提出,该模型在各种形式下被广泛用于交通预测。Logit 模型指出,选择某种出行方式的概率与 的效用指数成正比,该效用指数除以所有效用指数的 的总和。

对于任何 Logit 模型,所有出行方式的概率之和都等于 1。

Logit 模型还指出,如果在系统中添加(或移除)新的交通工具,则原始交通工具将失去(或获得)与它们原本的份额成正比的旅行量。

Logit 模型的步骤

  • 计算每个 OD 对和出行方式的效用
  • 计算每个 OD 对和出行方式的效用指数
  • 对每个 OD 对的效用指数求和
  • 根据 OD 对计算每个出行方式的概率
  • 将每个 OD 对的概率乘以每个 OD 对的旅行次数

心理根源

[编辑 | 编辑源代码]
Distribution of perceived weights
感知权重的分布

早期心理学研究涉及典型的实验:这里有两个重量不同的物体,,哪个更重?从这样的实验中得出的结论是,重量差异越大,选择正确的概率就越大。结果与右侧的图表相似。

路易斯·莱昂·瑟斯顿(Louis Leon Thurstone)在 1920 年代提出,感知到的重量为

,

其中 是真实重量,而 是随机的,并且

假设 是正态分布且独立同分布(NID),就会得到二元 probit 模型。

计量经济学公式

[edit | edit source]

经济学家处理的是效用而不是物理重量,他们认为

观察到的效用 = 平均效用 + 随机项。

在这种情况下,效用指的是做出特定选择或消费商品或服务所获得的总满意度(或幸福感)。

必须考虑对象的特征 x,所以我们有

u(x) = v(x) + e(x)。

如果我们遵循瑟斯顿的假设,我们又会得到一个 probit 模型。

另一种方法是假设误差项独立同分布,服从 Weibull、Gumbel 类型 I 或双指数分布(它们非常相似,并且在尾部(更厚)与正态分布略有不同)。这将产生多项式 logit 模型 (MNL)。丹尼尔·麦克法登(Daniel McFadden)认为,与其他可能用到的分布相比,Weibull 具有理想的特性。除其他因素外,误差项是正态分布且独立同分布的。logit 模型只是选择一种模式的概率与不选择该模式的概率的 log 比值。

请注意 logit 模型与我们之前估计的 S 形曲线之间的数学相似性,尽管在这里共享量随着效用而不是时间而增加。使用选择模型,我们解释的是使用某一模式的旅行者比例(或单个旅行者使用某一模式的概率乘以旅行者数量)。

与 S 形曲线的比较表明,模式(或技术)随着其效用增加而被采用,这种情况随着时间的推移由于多种原因而发生。首先,因为效用本身是网络效应的函数,用户越多,服务越有价值,与加入网络相关的效用就越高。其次,因为效用随着用户成本下降而增加,这种情况发生在固定成本可以在更多用户中分摊时(另一种网络效应)。第三,技术进步随着时间的推移以及用户数量的增加而发生,从而降低了相对成本。

效用表达式的示例如下

其中

Pi = 选择模式 i 的概率。
PA = 选择汽车的概率
cA,cT = 汽车、公交的成本
tA,tT = 汽车、公交的行程时间
I = 收入
N = 旅行者数量

通过代数运算,该模型可以转化为其最常用的形式

对该模型的估计和使用,可以做出两个相互矛盾的陈述。

  1. 它是“纸牌屋”,
  2. 由技术熟练且思维严谨的分析师使用,它是有用的。

“纸牌屋”问题主要源于模型规范的效用理论基础。总体而言,效用理论假设 (1) 用户和供应商对市场拥有完美信息;(2) 他们具有确定性函数(面对相同的选择,他们将始终做出相同的选择);(3) 在备选方案之间切换是无成本的。这些假设与人们对行为的了解并不相符。此外,由于没有普遍的效用尺度,因此不可能将效用在人群中进行汇总。

假设一个选项的净效用为 ujk(选项 k,人 j)。我们可以想象它具有一个系统部分 vjk,它是对象特征和人 j 的函数,加上一个随机部分 ejk,它代表品味、观察误差和其他许多东西(这里变得模糊)。(车辆等物体没有效用,而是车辆的特性具有效用。)引入 e 使我们能够进行一些汇总。如上所述,我们认为可观察效用是一个函数

其中每个变量代表汽车旅行的一个特征。值 β0 被称为特定于替代方案的常数。大多数建模者认为它代表了方程式中遗漏的特征(例如,交通方式的政治正确性,如果我乘坐公共交通工具,我会感到道义上的正义,因此 β0 对于汽车来说可能为负),但也包括使误差项 NID 所需的任何内容。

计量经济学估计

[edit | edit source]
Figure: Likelihood Function for the Sample {1,1,1,0,1}.
图:样本 {1,1,1,0,1} 的似然函数。

现在谈一些技术问题,我们如何估计 v(x)?效用 (v(x)) 是不可观察的。我们所能观察到的只有选择(例如,测量为 0 或 1),并且我们想讨论从 0 到 1 的选择的概率。(如果我们对 0 和 1 进行回归,我们可能会测量 j 乘坐汽车的概率为 1.4 或 -0.2。)此外,误差项的分布将没有合适的统计特征。

MNL 方法是对这种函数形式进行最大似然估计。似然函数为

我们求解估计参数

使 L* 最大化。这种情况发生在

对数似然更容易处理,因为乘积变成了求和

考虑从 John Bitzan 的交通经济学笔记中采用的一个例子。令 X 为一个二进制变量,它以概率 (1- gamma) 为 gamma 和 0。然后 f(0) = (1- gamma) 且 f(1) = gamma。假设我们有 5 个 X 的观察值,得到样本 {1,1,1,0,1}。要找到 gamma 的最大似然估计量,检查 gamma 的各种值,并针对这些值确定抽取样本 {1,1,1,0,1} 的概率。如果 gamma 取值为 0,则抽取我们样本的概率为 0。如果 gamma 为 0.1,则得到我们样本的概率为:f(1,1,1,0,1) = f(1)f(1)f(1)f(0)f(1) = 0.1*0.1*0.1*0.9*0.1=0.00009。我们可以计算在 gamma 的一个范围内获得我们样本的概率——这是我们的似然函数。logit 模型中 n 个独立观察值的似然函数为

其中:Yi = 1 或 0(例如选择自动或非自动) 以及 Pi = 观察到 Yi=1 的概率

因此,对数似然函数为

在二项式(二元选择)logit 模型中,

,因此

对数似然函数通过将偏导数设置为零来最大化

以上是现代 MNL 选择模型的精髓。

无关备选方案独立性 (IIA)

[edit | edit source]

无关备选方案独立性是 Logit 的一个特性,但并非所有离散选择模型都具有此特性。简而言之,IIA 的含义是,如果您添加了一种模式,它将从现有的模式中以与现有份额成比例的方式提取。 (同样,如果您删除一种模式,其用户将以与其先前份额成比例的方式切换到其他模式)。 为了了解为什么此属性可能会导致问题,请考虑以下示例:假设在我们的 logit 模式选择模型中存在七种模式(独自驾车、拼车 2 人、拼车 3 人以上、步行至公交、自动驾驶至公交(路边停车)、自动搭乘公交(kiss and ride)以及步行或骑自行车)。 如果我们取消“kiss and ride”,可能会有不成比例的人使用“路边停车”或“拼车”。

再举一个例子。假设在驾驶和乘坐红色公交车之间进行模式选择,目前两者各占 50% 的份额。 如果我们引入另一种模式,称为蓝色公交车,其属性与红色公交车相同,logit 模式选择模型将为每种模式分配 33.3% 的市场份额,换句话说,公交车将总共占 66.7% 的市场份额。 逻辑上,如果模式完全相同,它将不会吸引任何额外乘客 (虽然人们可以想象,增加容量会增加公交模式份额,特别是如果公交车容量有限的情况下)。

有几种策略可以帮助解决 IIA 问题。选择嵌套可以帮助我们减少这个问题。 然而,存在嵌套结构适当性的问题。 其他替代方案包括更复杂的模型 (例如混合 Logit),这些模型更难估计。

回到根源

[edit | edit source]

以上讨论基于经济学家的效用公式。 在 MNL 建模开发时,人们曾将注意力集中在心理学家对选择的研究上 (例如, Luce 在 1959 年的《个人选择行为》中讨论的 Luce 选择公理)。 它在计算过程建模中具有分析方面。 重点在于人们在做出选择或解决问题时的思维方式 (见 Newell 和 Simon 1972)。 换句话说,与效用理论相反,它强调的不是选择,而是选择的做出方式。 它为旅行选择和活动议程提供了概念框架,包括对长期和短期记忆、效应器以及思维和决策过程的其他方面的考虑。 它以处理信息搜索和处理方式的规则形式出现。 尽管在交通工作中对行为分析非常重视,但现代心理学思想的精华才刚刚开始进入该领域。 (例如 Golledge、Kwan 和 Garling 1984; Garling、Kwan 和 Golledge 1994)。

示例

[edit | edit source]

示例 1:模式选择模型

[edit | edit source]
TProblem
T问题
问题

您被提供此模式选择模型

其中

  • = 模式成本(美分)/ 工资率(每分钟美分)
  • = 车内旅行时间(分钟)
  • = 车外旅行时间(分钟)
  • = 模式特定虚拟变量:(虚拟变量取值 1 或 0)
    • = 驾驶,
    • = 具有步行通道的公交,[基础模式]
    • = 具有汽车通道的公交,
    • = 拼车

有了这些输入

' 驾驶 步行连接公交 汽车连接公交 拼车
t = 车内旅行时间(分钟) 10 30 15 12
t0 = 车外旅行时间(分钟) 0 15 10 3
= 驾驶, 1 0 0 0
= 具有步行通道的公交,[基础模式] 0 1 0 0
= 具有汽车通道的公交, 0 0 1 0
= 拼车 0 0 0 1
成本 25 100 100 150
工资 60 60 60 60

最终的模式份额是多少?

Example
示例
解决方案
输出 1: 驾驶 2: 步行连接公交 3: 汽车连接公交 4: 拼车 总计
效用 -1.26 -2.09 -3.30 -3.58
EXP(V) 0.28 0.12 0.04 0.03
P(V) 59.96% 26.31% 7.82% 5.90% 100%

解释

时间价值

(以 1967 年的美元计算,当时工资率约为 2.85 美元/小时)

这意味着,如果您能以低于 1.10 美元/小时/人的成本改善旅行时间(通过增加公交数量,减少瓶颈等),那么它在社会上是值得的。

示例 2:模式选择模型解释

[edit | edit source]

在一个确定性世界中,鉴于这些事实,一个完全理性、完全知情的旅行者会选择哪种模式?

TProblem
T问题
案例 1
' 公交 汽车 参数
Tw 10 分钟 5 分钟 -0.147
Tt 40 分钟 20 分钟 -0.0411
C $2 $1 -2.24

汽车总是获胜(只要所有参数都小于 0,就与参数无关)

TProblem
T问题
案例 2
' 公交 汽车 参数
Tw 5 分钟 5 分钟 -0.147
Tt 40 分钟 20 分钟 -0.0411
C $2 $4 -2.24
结果 -6.86 -10.51

在观察到的参数下,公交总是获胜,但并非在所有参数下都如此。

需要注意的是,个人参数各不相同。我们可以引入社会经济和其他可观察的特征以及随机误差项,使问题更具现实意义。

示例问题

[edit | edit source]

其他问题

[edit | edit source]

变量

[edit | edit source]
  • - 从 i 到 j 通过 m 方式出行的效用
  • = 方式特异性虚拟变量:(虚拟变量取值为 1 或 0)
  • = 方式 m 的概率
  • = 方式成本(美分)/ 工资率(每分钟美分)
  • = 车内旅行时间 (分钟)
  • = 车外旅行时间 (分钟)
  • = 方式特异性虚拟变量:(虚拟变量取值为 1 或 0)

缩略语

[edit | edit source]
  • WCT - 步行连接公交
  • ADT - 汽车连接公交(独自开车/停车换乘)
  • APT - 汽车连接公交(汽车乘客/送客换乘)
  • AU1 - 汽车驾驶员(无乘客)
  • AU2 - 汽车 2 人乘坐
  • AU3+ - 汽车 3 人及以上乘坐
  • WK/BK - 步行/骑行
  • IIA - 无关选择项独立性

关键术语

[edit | edit source]
  • 出行方式选择
  • Logit 模型
  • 概率
  • 无关选择项独立性 (IIA)
  • 虚拟变量 (取值为 1 或 0)

视频

[edit | edit source]

参考文献

[edit | edit source]
  • Garling, Tommy Mei Po Kwan, 和 Reginald G. Golledge. 家庭活动安排,交通研究,22B,pp. 333–353. 1994。
  • Golledge. Reginald G.,Mei Po Kwan,和 Tommy Garling, “家庭出行决策的计算过程建模”,区域科学论文集,73,pp. 99–118. 1984。
  • Lancaster, K.J.,消费者理论的新方法。政治经济学杂志,1966. 74(2): p. 132-157。
  • Luce, Duncan R. (1959). 个人选择行为,理论分析。纽约,Wiley。
  • Newell, A. 和 Simon, H. A. (1972). 人类问题解决。新泽西州恩格尔伍德悬崖:普伦蒂斯-霍尔。
  • Ortuzar, Juan de Dios 和 L. G. Willumsen's 交通建模。第 3 版。Wiley and Sons. 2001,
  • Thurstone, L.L. (1927). 比较判断法。心理评论,34,278-286。
  • Warner, Stan 1962 城市出行中的模式战略选择:二元选择研究
华夏公益教科书