跳转至内容

交通/选择模型基础

来自维基教科书,开放的书籍,开放的世界

模式选择分析是传统四步交通预测模型的第三步,在出行生成目的地选择之后,路线选择之前。虽然出行分配的区域间交互分析产生了出行起源-目的地(OD)表,表明出行将在哪里发生,但模式选择分析允许建模者确定将使用哪种交通方式。

非聚集旅行需求模型

[编辑 | 编辑源代码]

旅行需求理论在交通生成附录中介绍。该领域的核心是一组模型,这些模型是在 Stan Warner 1962 年(城市旅行中的模式战略选择:二元选择研究)的工作之后发展起来的。使用 CATS 的数据,Warner 研究了使用生物学和心理学模型的分类技术。从 Warner 和其他早期研究人员开始,非聚集需求模型出现了。分析是非聚集的,因为个人是观察的基本单位,但又是聚集的,因为模型产生了一组描述人口选择行为的单一参数。行为进入是因为该理论利用了来自经济学的消费者行为概念和来自心理学的某些选择行为概念。加州大学伯克利分校的研究人员(尤其是 Daniel McFadden,因其贡献获得了诺贝尔经济学奖)和麻省理工学院 (Moshe Ben-Akiva)(以及与 MIT 相关的咨询公司,尤其是剑桥系统公司)发展了后来被称为选择模型、直接需求模型 (DDM)、随机效用模型 (RUM) 或其最常用形式,多项式 Logit 模型 (MNL) 的模型。

选择模型引起了很多关注和研究;国际旅行行为研究协会的会议记录了这些模型的演变。这些模型在现代交通规划和交通工程教科书中都有论述。

快速模型开发的一个原因是人们的切实需要。人们正在提出一些系统(尤其是交通系统),而这些系统中没有使用转向曲线中的经验数据。选择模型允许比较两种以上的替代方案以及替代方案属性的重要性。人们普遍希望有一种分析技术,这种技术更少依赖于聚合分析,并且具有更大的行为内容。此外,选择模型也具有吸引力,因为选择模型具有逻辑和行为根源,这些根源可以追溯到 1920 年代,以及凯尔文·兰卡斯特的消费者行为理论、效用理论和现代统计方法的根源。

Logit 模型

[编辑 | 编辑源代码]

Logit 模型广泛用于各种形式的交通预测,它最早由 Daniel McFadden 提出。Logit 模型指出,选择某种模式的概率与 乘以效用成正比,而与 乘以效用之和成正比。

对于任何 Logit 模型,所有模式的概率之和将等于 1。

Logit 模型还指出,如果在系统中添加新的交通方式(或取消交通方式),那么原始交通方式将失去(或获得)的出行量与其最初的份额成正比。

Logit 模型的步骤

  • 计算每个 OD 对和模式的效用
  • 计算每个 OD 对和模式的指数化效用
  • 对每个 OD 对的指数化效用求和
  • 计算每个模式的每个 OD 对的概率
  • 将每个 OD 对的概率乘以每个 OD 对的出行次数

心理根源

[编辑 | 编辑源代码]
Distribution of perceived weights
感知权重的分布

早期心理学研究涉及典型的实验:这里有两个物体,它们的重量分别是,哪个更重?从这样的实验中发现,重量差异越大,正确选择的概率就越大。类似于右图的图形将产生结果。

路易斯·利昂·瑟斯顿 (Louis Leon Thurstone) 在 1920 年代提出,感知重量

,

其中 是真实重量,而 是随机的,并且具有

假设 服从正态独立同分布(NID),就产生了二元概率模型。

计量经济学公式

[edit | edit source]

经济学家处理的是效用而不是物理重量,他们说

观察到的效用 = 平均效用 + 随机项。

在这种情况下,效用指的是从做出特定选择或消费商品或服务中获得的总满足感(或幸福感)。

必须考虑对象的特征 x,因此我们有

u(x) = v(x) + e(x)。

如果我们遵循瑟斯顿的假设,我们又会得到一个概率模型。

另一种选择是假设误差项独立同分布,并服从威布尔、古姆贝尔 I 型或双指数分布(它们非常相似,并且在尾部(更厚)与正态分布略有不同)。这会产生多项式 logit 模型 (MNL)。丹尼尔·麦克法登认为,威布尔分布与其他可能使用的分布相比具有理想的属性。其中,误差项服从正态独立同分布。logit 模型仅仅是选择一种模式的概率与不选择该模式的概率的对数比。

请注意 logit 模型与我们之前估计的 S 曲线之间的数学相似性,尽管这里的共享随着效用而不是时间的增加而增加。使用选择模型,我们解释了使用某种模式的旅行者比例(或者说单个旅行者使用某种模式的概率乘以旅行者数量)。

与 S 曲线的比较表明,随着效用的增加,模式(或技术)会被采用,而效用随着时间的推移会因多种原因而增加。首先,因为效用本身是网络效应的函数,用户越多,服务就越有价值,与加入网络相关的效用就越高。其次,因为效用随着用户成本下降而增加,当固定成本可以在更多用户之间分摊时(另一种网络效应),就会发生这种情况。第三,技术进步会随着时间的推移以及用户数量的增加而发生,从而降低相对成本。

效用表达式的示例如下

其中

Pi = 选择模式 i 的概率。
PA = 选择汽车的概率
cA,cT = 汽车、公交的成本
tA,tT = 汽车、公交的出行时间
I = 收入
N = 旅行者数量

通过代数运算,该模型可以转换为其最常用的形式

可以对该模型的估计和使用发表两个相互矛盾的意见

  1. 它就像“纸牌屋”,
  2. 但在技术娴熟且有思想的分析师手中,它很有用。

“纸牌屋”问题主要源于模型规范的效用理论基础。总体而言,效用理论假设(1)用户和供应商对市场拥有完美的信息;(2)他们具有确定性函数(面对相同的选择,他们始终会做出相同的选择);以及(3)在替代方案之间切换是无成本的。这些假设与人们已知的行为并不十分相符。此外,由于没有通用的效用尺度,因此无法跨人群聚合效用。

假设一个选项的净效用为ujk(选项k,人j)。我们可以想象它有一个系统部分vjk,该部分是对象和人j特性的函数,加上一个随机部分ejk,它代表了品味、观测误差以及一大堆其他因素(这里变得模糊不清)。(例如,汽车本身并没有效用,是汽车的特性具有效用。)引入e 使我们能够进行一些聚合。如上所述,我们认为可观察效用是以下函数:

其中,每个变量都代表汽车旅行的一个特征。值β0被称为替代方案特定常数。大多数建模者说它代表了方程式中遗漏的特征(例如,一种模式的政治正确性,如果我乘坐公交,我会感到道义上的正义,因此β0对于汽车来说可能是负的),但它包含了使误差项NID 所需的一切。

计量经济学估计

[edit | edit source]
Figure: Likelihood Function for the Sample {1,1,1,0,1}.
图:样本 {1,1,1,0,1} 的似然函数。

现在转到一些技术问题,我们如何估计v(x)?效用 (v(x)) 是不可观察的。我们所能观察到的只是选择(例如,测量为 0 或 1),我们想讨论的是选择概率,范围从 0 到 1。(如果我们对 0 和 1 进行回归,我们可能会测量j 的概率为 1.4 或 -0.2 的乘坐汽车。)此外,误差项的分布将没有合适的统计特征。

MNL 方法是对这种函数形式进行最大似然估计。似然函数是

我们求解估计参数

使 L* 最大化。当

对数似然更容易处理,因为乘积变成了求和

考虑 John Bitzan 的《运输经济学笔记》中采用的一個例子。令X 为二元变量,以概率 (1- gamma) 为gamma 和 0。那么 f(0) = (1- gamma) 且 f(1) = gamma。假设我们有 5 个关于 X 的观测值,得到样本 {1,1,1,0,1}。要找到gamma 的最大似然估计,请检查gamma 的各种值,并针对这些值确定绘制样本 {1,1,1,0,1} 的概率。如果gamma 取值为 0,则绘制我们样本的概率为 0。如果gamma 为 0.1,则得到我们样本的概率为:f(1,1,1,0,1) = f(1)f(1)f(1)f(0)f(1) = 0.1*0.1*0.1*0.9*0.1=0.00009。我们可以在gamma 的范围内计算得到我们样本的概率——这就是我们的似然函数。logit 模型中 n 个独立观测值的似然函数是

其中:Yi = 1 或 0(例如,选择汽车或不选择汽车)和 Pi = 观察 Yi=1 的概率。

因此,对数似然为

在二项式(两个选择)logit 模型中,

,所以

对数似然函数通过将偏导数设为零来最大化

以上是现代 MNL 选择模型的本质。

无关选择独立性(IIA)

[edit | edit source]

无关选择独立性是 Logit 的一个属性,但并非所有离散选择模型都具有该属性。简而言之,IIA 的含义是,如果你添加一个模式,它将按现有模式的份额比例从现有模式中提取。 (同样,如果你删除一个模式,它的用户将按其先前份额的比例切换到其他模式)。为了了解为什么该属性可能会导致问题,请考虑以下示例:假设在我们的 logit 模式选择模型中,我们有七种模式(单独驾驶、拼车 2 人、拼车 3 人以上、步行到公交、驾车到公交(停车换乘)、驾车乘客到公交(kiss and ride)、步行或骑自行车)。如果我们取消 Kiss and Ride,可能会有不成比例的人使用停车换乘或拼车。

再举个例子。假设在驾驶和乘坐红色巴士之间进行模式选择,目前两者各占 50% 的份额。如果我们引入另一种模式,我们称之为蓝色巴士,其属性与红色巴士相同,那么 logit 模式选择模型将给每种模式 33.3% 的市场份额,换句话说,巴士将总共占据 66.7% 的市场份额。逻辑上,如果模式是真正相同的,它就不会吸引任何额外的乘客(虽然可以想象添加容量会增加巴士模式的份额,特别是在巴士容量受限的情况下)。

有几种策略可以帮助解决 IIA 问题。嵌套选择可以帮助我们减少这个问题。但是,嵌套结构存在问题。其他替代方案包括更复杂的模型(例如混合 Logit),这些模型更难估计。

回归本质

[edit | edit source]

以上讨论基于经济学家的效用公式。在 MNL 模型开发时,人们对心理学家对选择的研究(例如, Luce 在其 1959 年的《个人选择行为》一书中讨论的 Luce 选择公理)也有一些关注。它在计算过程建模中有一个分析方面。重点是如何人们在做出选择或解决问题时思考(见 Newell 和 Simon 1972)。换句话说,与效用理论相反,它强调的不是选择本身,而是选择的方式。它为出行选择和涉及长期和短期记忆、效应器以及其他思维和决策过程方面的活动议程提供了一个概念框架。它采取规则的形式,处理信息搜索和处理的方式。虽然在交通工作中有很多关注行为分析,但现代心理学中最棒的想法才刚刚开始进入该领域。(例如 Golledge、Kwan 和 Garling 1984;Garling、Kwan 和 Golledge 1994)。

例子

[edit | edit source]

示例 1:模式选择模型

[edit | edit source]
TProblem
TProblem
问题

给定一个出行方式选择模型

其中

  • = 出行方式成本(美分)/ 工资率(每分钟美分)
  • = 车内旅行时间(分钟)
  • = 车外旅行时间(分钟)
  • = 出行方式特定虚拟变量:(虚拟变量取值为1或0)
    • = 自驾,
    • = 步行接驳公交,[基准出行方式]
    • = 汽车接驳公交,
    • = 拼车

给出这些输入

' 自驾 步行接驳公交 汽车接驳公交 拼车
t = 车内旅行时间(分钟) 10 30 15 12
t0 = 车外旅行时间(分钟) 0 15 10 3
= 自驾, 1 0 0 0
= 步行接驳公交,[基准出行方式] 0 1 0 0
= 汽车接驳公交, 0 0 1 0
= 拼车 0 0 0 1
成本 25 100 100 150
工资率 60 60 60 60

最终的出行方式份额是多少?

Example
示例
解决方案
输出 1: 自驾 2: 步行接驳公交 3: 汽车接驳公交 4: 拼车 总计
效用 -1.26 -2.09 -3.30 -3.58
EXP(V) 0.28 0.12 0.04 0.03
P(V) 59.96% 26.31% 7.82% 5.90% 100%

解释

时间价值

(1967年美元,当时的工资率约为2.85美元/小时)

这意味着,如果你能以低于1.10美元/小时/人的成本改善旅行时间(例如通过增加公交线路、减少交通瓶颈),那么从社会角度来看这是值得的。

示例2:出行方式选择模型解读

[edit | edit source]

在一个确定性世界中,考虑到以下事实,一个完全理性的、完全知情的旅行者会选择哪种出行方式?

TProblem
TProblem
情况1
' 公交 汽车 参数
Tw 10分钟 5分钟 -0.147
Tt 40分钟 20分钟 -0.0411
C $2 $1 -2.24

汽车总是胜出(只要所有参数都小于0,就与参数无关)

TProblem
TProblem
情况2
' 公交 汽车 参数
Tw 5分钟 5分钟 -0.147
Tt 40分钟 20分钟 -0.0411
C $2 $4 -2.24
结果 -6.86 -10.51

在观察到的参数下,公交总是胜出,但在所有参数下不一定如此。

需要注意的是,个体在参数方面存在差异。我们可以引入社会经济特征和其他可观察特征,以及随机误差项,使问题更接近现实。

示例问题

[edit | edit source]

附加问题

[edit | edit source]

变量

[edit | edit source]
  • - 从i到j通过出行方式m的效用
  • = 出行方式特定虚拟变量:(虚拟变量取值为1或0)
  • = 模式 m 的概率
  • = 模式成本(美分)/ 工资率(每分钟美分)
  • = 车内旅行时间(分钟)
  • = 车外旅行时间(分钟)
  • = 出行方式特定虚拟变量:(虚拟变量取值为1或0)

缩略语

[edit | edit source]
  • WCT - 步行接驳公交
  • ADT - 汽车接驳公交(独自驾驶/停车换乘)
  • APT - 汽车接驳公交(汽车乘客/接送)
  • AU1 - 汽车驾驶员(无乘客)
  • AU2 - 汽车 2 名乘客
  • AU3+ - 汽车 3+ 名乘客
  • WK/BK - 步行/骑行
  • IIA - 无关选择的独立性

关键术语

[edit | edit source]
  • 出行方式选择
  • Logit 模型
  • 概率
  • 无关选择的独立性 (IIA)
  • 虚拟变量(取值为 1 或 0)

视频

[edit | edit source]

参考文献

[edit | edit source]
  • Garling, Tommy Mei Po Kwan 和 Reginald G. Golledge。家庭活动安排,交通研究,22B,第 333-353 页。1994 年。
  • Golledge。Reginald G.,Mei Po Kwan 和 Tommy Garling,“家庭出行决策的计算过程建模”,区域科学论文集,73,第 99-118 页。1984 年。
  • Lancaster, K.J.,消费者理论的新方法。政治经济学杂志,1966 年。74(2): 第 132-157 页。
  • Luce, Duncan R. (1959)。个人选择行为,理论分析。纽约,Wiley。
  • Newell, A. 和 Simon, H. A. (1972)。人类问题解决。新泽西州英格伍德悬崖:普伦蒂斯-霍尔。
  • Ortuzar, Juan de Dios 和 L. G. Willumsen 的交通建模。第三版。Wiley 和 Sons。2001 年,
  • Thurstone, L.L. (1927)。比较判断法。心理评论,34,278-286。
  • Warner, Stan 1962 城市旅行中的出行方式战略选择:二元选择研究
华夏公益教科书