动物行为/建模
同时考虑所有可能影响行为的重要因素和相互作用来研究行为是一项艰巨(或不可能)的任务。另一种方法试图通过将人们的期望融入基于少量重要变量的数学抽象集中来减少相关的复杂性。由此产生的定量预测必然是不完整的,但通常不太模棱两可且更容易测试。目标是模拟动物在获得有关世界的一些信息后,采取何种行动的理性决策。然后,玩家将根据行动、其他玩家的行动(如果适用)以及周围环境的状态来承担决策的后果。预计玩家会通过最大化预期效用来进行理性决策。
最优性模型定量预测了特定动物在与环境对抗时以某种方式行为的后果。它假设动物应该表现得使自己的适应性最大化。最优性模型考虑了在决策变量(即感兴趣的变量)给定范围内单独的、相关的适应性益处 (B) 和适应性成本 (C)。最优性模型的解决方案试图找到净收益(即 B-C)最大化的点。个体解决方案考虑了焦点动物的后果,而不管其他个体正在采用什么策略。
最优性模型的主要优点在于它们
- 帮助我们澄清我们的假设
- 迫使我们思考动物拥有的信息
- 将许多不同的想法整合在一个地方
- 产生可检验的预测
行为决策的后果被描述为方程式,其中一个个体决策的成功与其他动物的决策无关。
- 决策变量是我们旨在优化的变量(例如,优化速度以获得从这里到那里驾驶的最佳里程数)
- 货币是指用于检查决策变量不同值的成果的标准(里程数)
- 约束是限制决策变量和货币之间关系的因素(例如,限速)
最优性模型使用微积分和逻辑来求解特定函数 f(x) 的最小值或最大值。这可以通过取函数的导数 df[x)/dt(即获得函数的斜率)并将其设置为 0 来实现。这种方法也可用于探索决策变量值变化的敏感性,并确定哪些类型的信息与关系相关。可以将精确预测形式化,以便进行经验测试。
为了研究捕食和种群振荡,Huffaker 使用了螨虫物种,一种是捕食者,另一种是猎物。[1] 通过修改栖息地的空间结构,他可以操纵种群动态并提高两种物种的总体存活率。他通过改变猎物和橙子(它们的食物)之间的距离、建立捕食者运动障碍以及为猎物创建分散走廊来做到这一点。这些变化增加了栖息地斑块,进而为猎物提供了更多寻求临时保护的区域。当猎物在一个栖息地斑块中局部灭绝时,它们能够通过迁移到新的斑块并在被捕食者攻击之前重新建立来恢复。这种栖息地斑块的空间结构允许捕食者和猎物物种共存,并促进了稳定的种群振荡模型。[2] 捕食者-猎物相互作用进而影响种群动态,这已得到详细描述[3]
OFT 检查食物项目的选取。这种猎物模型(即使猎物不一定必须是另一种动物)着眼于基本饮食选择的决策。动物寻找食物,并一次找到潜在的猎物。它必须决定是否停止搜索并吃掉它找到的食物,或者是否忽略食物并继续搜索。我们假设动物试图在一个特定时间段内最大化其货币(即以卡路里衡量的能量摄入率)。每种食物在消耗过程中都需要不同的处理时间。例如,西北乌鸦在退潮时沿着水线寻找名为蛾螺的大型软体动物。当它找到一个时,它会向上飞并将其扔到岩石上以将其砸开。较小的蛾螺较难打破,需要从更高的位置掉落,因此可能会被忽略。同样,某些种类的坚果的内容比其他种类的坚果更难获取。
E1 和 E2 分别指类型 1 或 2 的猎物中包含的卡路里能量。获取此类猎物卡路里含量所需的处理时间为 h1 和 h2。如果类型 1 每单位时间获得的净能量(或能量获得率)超过项目 2
那么你最好在找到类型 1 的猎物时就吃掉它。如果你找到类型 2 的物品,你可能会考虑拒绝它并继续搜索,如果在搜索类型 1 物品时损失的能量加上其处理时间小于直接吃掉类型 2 物品所获得的能量。
根据此方程式的关系,捕食者应该只吃猎物 1(并且成为专家)或者它应该吃猎物 1 和猎物 2(并且成为通才)。这种专业化的决定取决于 S1 的质量和丰度,而与 S2 无关。
MVT 考虑了一种最优觅食生物,它利用零散的资源,因为它必须决定何时转移到下一个斑块。当它试图优化成本/收益比率时,个体会随着斑块之间距离的增加或当整个环境的获利能力下降时停留更长时间。
理想自由分布描述了动物如何在多个资源斑块中分配自身的方式——理想地(完全了解资源的分布情况)并且自由地(在放置在首选位置方面没有障碍)。该理论指出,单个动物将在各个斑块中聚集,与每个斑块中可获得的资源数量成正比。例如,如果斑块 A 包含的食物是斑块 B 的两倍,那么在斑块 A 中觅食的个体数量将是斑块 B 的两倍。[4]
要更全面地预测动物最有利可图的行为,我们可能还需要考虑其他动物的行为。当某种行为在种群中比较罕见时(例如,欺骗),它可能非常有益,但当它变得普遍时,对行为实施者的益处可能就没有那么大了。因此,博弈论模型考虑了依赖于频率的适应性益处的价值。博弈论最初被开发为预测理性人类经济行为的工具,但将其应用于许多进化问题,已经提高了我们对以下情况的理解:行为的适应性后果取决于种群中其他动物表现出的行为类型和频率。
假设个体代表一个博弈中的参与者,所有参与者都了解规则,都试图有意识地最大化自己的收益,并试图预测对手的行动。参与者同时行动,或者至少在做出自己的行动之前没有观察到其他参与者的行动。
策略B1 | 策略B2 | |
---|---|---|
策略R1 | [3], [3] | [2], [-1] |
策略R2 | [-1], [2] | [2], [2] |
收益矩阵用于正式表示一个博弈,其中包含所有可能的策略,以及每个策略相对于任何其他策略的相应收益。博弈的矩阵规定了每个参与者在行动组合中获得的收益。例如,如果玩家1选择顶部,玩家2选择左侧,则玩家1获得4,玩家2获得3。在每个单元格中,第一个数字表示行玩家(在本例中为玩家1)的收益,第二个数字表示列玩家(在本例中为玩家2)的收益。
策略1 | 策略2 | |
---|---|---|
策略1 | 3 | 2 |
策略2 | -1 | 2 |
如果收益不依赖于哪个玩家选择每个行动,则存在对称博弈的情况。在上面的例子中,如果策略R1(玩家1的策略1)与B1(玩家2的策略1)相同,并且策略R2与策略B2相同,则就是这种情况。然后可以用每个单元格中的单个收益来表示博弈,即表示行玩家收益的收益。例如,如果R1 = B1且R2 = B2,则右侧的收益矩阵表示与上面矩阵相同的博弈。
博弈论旨在识别形成进化稳定策略(或ESS)的行为规则。当种群中的所有参与者都采用这种策略时,任何突变策略都无法入侵。因此,一旦策略在种群中固定下来,只要没有新的选择压力,自然选择本身就足以阻止替代策略入侵种群。进化稳定策略这个特定术语首次出现在约翰·梅纳德·史密斯1972年的著作中,[5]它广泛应用于行为生态学和经济学,并在人类学、进化心理学、哲学和政治学中得到应用。
B不作证 | B作证 | |
---|---|---|
A不作证 | -1, -1 | -12, 0 |
A作证 | 0, 12 | -3, -3 |
囚徒困境使用博弈论来探讨在特定情况下个人为何合作或为何不合作。在这种情况下,基本情况是对抗性的,但他们仍然可以找到共同点来一起工作。这就是场景……
“两人因共同犯罪而被捕,但证据不足以定罪。在将两人分开后,警方向两人提供了相同的交易——如果他指证他的搭档并提供参与犯罪的证据(即背叛),他将以牺牲对方的利益为代价获得好处。如果对方保持沉默(即合作),则背叛者将被释放,而合作者将受到全部判决。如果每个玩家都“告发”对方,则两人都将受到略微减少的全部判决。然而,如果两人都保持沉默,则两人都将被判处最短的监禁时间,因为他们只能因轻罪被起诉。每个囚徒必须选择背叛搭档(即告发他)或与他合作(即保持沉默)。他们应该怎么做?”
由于他们试图限制自己的负面后果(即减少监禁时间),因此逻辑上的决定导致每个人都背叛对方,因为无论玩家B做出什么决定,这个决定都能提供更好的单次收益(即在两列中,第二行值都列出了优于第一行值的收益)。因此,如果只面临一次这样的决定,可以合理地预期两个玩家都会背叛他们的搭档,导致两个玩家都得到第二糟糕的结果。然而,最大的个人综合收益(两人因较轻罪名被判处1个月监禁)本来可以通过他们都合作来实现。因此,在个人反复面临此类决定的情况下,信任与合作将比简单的利己主义解决方案为双方带来更大的利益。在重复囚徒困境场景中,最成功的策略是以牙还牙,参与者通过在第一轮合作并随后采用对方在上一轮使用的策略来最大化他们的收益。
博弈模型极大地提高了我们对仪式化展示取代攻击性互动的条件的理解。梅纳德·史密斯的理论涉及群体成员之间以资源为中心的冲突,这些成员将遵循不受约束地使用武器(鹰)或依赖于高度仪式化的战斗要素(鸽子)的策略。
鹰 | 鸽 | |
---|---|---|
鹰 | (V−C)/2 | V |
鸽 | 0 | V/2 |
收益矩阵的不同单元格代表两个玩家的策略组合,其中每个玩家都希望获胜,希望平局而不是失败,并希望失败而不是受伤。博弈论可用于解决以下条件:这些策略在进化上是稳定的(即ESS)。首先,我们询问采用一种策略的种群是否会被一些采用另一种策略的动物入侵。为了检查鸽子是否是ESS,我们检查鸽子种群是否会被鹰入侵?具体来说,我们询问在这种情况下的鹰在鸽子种群中的效用(u)是否大于鸽子的效用。
只要赢得资源的收益(V)大于零,当鹰与其他鸽子对抗时,鹰总是会胜过鸽子(V/2)。因此,鸽子不能是ESS。鹰将能够入侵鸽子种群,直到鹰遇到另一只鹰的情况变得普遍。为了检查鸽子是否能够入侵鹰的种群,我们检验当面对鹰的种群时,鸽子的收益是否大于鹰的收益。正式地,这是评估是否……
因此,关于鸽子是否能够入侵鹰群的结论将取决于 V 是否大于 C。如果资源价值超过受伤成本,则鹰的收益将为正(即大于 0),并且鹰群无法被入侵。因此,在存在宝贵资源的情况下,鹰代表了一种 ESS。但是,如果 V
因此,博弈论为动物倾向于只有在存在具有重大价值的资源时才会进行激烈争斗提供了理论基础。例如,在象海豹中,争斗尤其激烈,因为获胜的雄性能够独占一块包含许多雌性的广阔海滩区域。然而,在绝大多数情况下,资源很少值得为之受伤,竞争个体将通过仪式化的展示来解决大多数冲突。
在这个模型中,侵略性表现为两个竞争者争夺价值为 V 的资源,他们在持续的过程中不断积累成本,持续时间为 t。在消耗战场景中,战斗者试图削弱对手的防御能力。与失败或争夺相关的固定成本不存在,但随着遭遇的持续,每个参与者都会累积增量成本。当一个人放弃时,就会产生放弃的决定,放弃对争夺资源的访问权,而不是继续承受进一步的伤害。
转向 | 直行 | |
---|---|---|
转向 | 0 | -1 |
直行 | 1 | -50 |
懦夫博弈是鹰鸽博弈的一个变体。在其中,每个玩家都希望不要屈服于对方,但两个玩家都不屈服的结果是迄今为止对两个玩家来说最糟糕的结果。它起源于两个司机在碰撞过程中迎面驶来的情况:一个人必须转向,否则两人都可能在撞车中丧生。转向的司机被称为“懦夫”。该博弈最重要的特征是,在双方都选择冲突而不是调和的情况下,必然存在重大的代价。“失败”即决定转向与无人转向导致的碰撞相比是微不足道的,因此合理的策略是转向。然而,知道这一点,人们很可能会决定不转向,赌对方会理性。
基于存在压倒性惩罚性后果的行为可预测性的见解构成了冷战军事理论相互确保毁灭的核心组成部分,其中任何一方使用核武器都将确保侵略者及其目标的毁灭。这种威慑理论认为,将强大的武器作为对敌人的威胁至关重要,以防止使用同样的武器。阻止任何一方诉诸这些武器的成功,只有在双方都相信选择冲突将导致所有参与者最糟糕的结果时才有效——即由可信的二次打击能力导致的侵略者被核毁灭。
- ↑ Huffaker CB. 1958. 捕食实验研究:扩散因素和捕食者-猎物振荡。Hilgardia 27: 83
- ↑ Kareiva P. 1987. 生境破碎化与捕食者-猎物相互作用的稳定性。自然 326: 388
- ↑ Janssen A. 等。1997. 持久性捕食者-猎物系统的元种群动态
- ↑ Fretwell SD & Lucas HL. 1970. 关于鸟类领地行为和其他影响栖息地分布的因素。I. 理论发展。Acta Biotheoretica 19: 16-36
- ↑ Maynard Smith, J. (1972). “博弈论与战斗的进化”。论进化。爱丁堡大学出版社。 ISBN 0-85224-223-9.