概率/简介
概率理论为随机性和不确定性的研究提供了数学模型。从商业、政府、科学、娱乐,甚至个人生活中的许多重要决策,都必须在信息不完整或存在一定程度的不确定性的情况下做出。因此,对不确定或随机结果的正式研究在现代社会中占有重要地位。在可能出现多种结果的情况中,概率论的数学模型提供了量化这些结果的可能性 associated with those outcomes. 概率还提供工具,使我们能够超越仅仅描述数据集中的信息(描述性统计),而真正从数据中推断更多信息(推断性统计)。许多早期对可能性建模的尝试来自机会游戏。有关概率的简史,请参见这维基百科文章。
尽管概率论现在已经成为一个非常正式的数学分支,但概率的语言通常在日常语言中非正式使用。我们根据我们的经验,以及在某些情况下根据统计数据,使用直觉来表达我们对涉及不确定性的情况中结果的可能性的信念。请考虑以下示例
- 比尔说:“不要在这里买鳄梨;大约有一半时间,它们都烂了。” 比尔正在表达他对事件发生的概率的信念——鳄梨会腐烂——这是基于他的个人经验。
- 丽莎说:“我 95% 确定西班牙的首都巴塞罗那。” 在这里,丽莎表达的信念只是从她的角度来看的概率,因为只有她不知道西班牙的首都马德里(从我们的角度来看,概率是 100%)。但是,我们仍然可以将其视为主观概率,因为它表达了不确定性的度量。就好像丽莎在说“在我对这件事有和现在一样肯定的 95% 的情况下,我最终会被证明是对的”。
- 苏珊说:“在奥马哈被枪击的可能性低于在底特律被枪击的可能性。” 苏珊正在表达基于(可能是)统计数据的信念。
- 史密斯博士对克里斯蒂娜说:“你有 75% 的机会能活下来。” 史密斯博士是根据他的研究得出的这个结论。
- 尼古拉斯说:“明天可能会下雨。” 在这种情况下,下雨的可能性用模糊的术语表达,并且是主观的,但暗示说话者认为它大于(或 50%)。主观概率已被广泛研究,特别是在赌博和证券市场方面。虽然这种类型的概率很重要,但它不是本书的主题。一个很好的参考是史蒂文·维克 (2002) 的“信念程度”。
请注意,在前面的示例中,任何特定结果的可能性都用百分比(介于 0% 和 100% 之间)表示,这在日常语言中很常见。但是,正式概率论中的概率始终用间隔 中的实数表示(例如,概率 0.25 可以表示为 25%,或概率 可以表示为大约 31.83%)。常见概率表达式和正式概率论之间存在其他差异。例如,概率 0% 通常被认为意味着分配该概率的事件是不可能的。但是,在概率论中(通常在存在无限多个可能结果的情况下),分配概率为零的事件实际上可能发生。在某些情况下,可以肯定这样的事件会发生(例如,在 0 和 1 之间选择一个实数时,选择任何给定数字的概率为零,但可以肯定的是,将选择一个这样的数字)。
表达结果概率的另一种方法是使用几率:事件发生的“成功”概率与事件不发生的“失败”概率的比率。在博彩中,几率表示为参与者在赌注中所冒的赌注比率。例如:一个博彩公司提供3比1的赔率“反对”一匹马,将支付给赌徒他们赌注的三倍(如果马获胜)。事实上,博彩公司(忽略诸如其潜在的“减免”会导致其面临整体不可接受的损失的可能性等因素)宣布他认为这匹马获胜的概率为。如果我们将赔率表示为“获胜概率”:“不获胜概率”,那么3比1反对将表示为 或 。因此,概率为 或 25% 的事件的几率为 33%。这种差异在事件概率为 50% 时更为明显(例如,硬币正面朝上的概率为 50%:50% = 1:1 或 )。
如前所述,概率可以以多种不同的方式非正式地表达,但即使是正式定义和方法也各不相同。最普遍和最严格的方法被称为公理概率论,这将是后续章节的重点。在这里,我们简要讨论其他一些方法,以及它们的用途和局限性。所有这些方法或多或少都依赖于实验的概念。回想一下,概率提供了研究随机性和不确定性的方法。
实验是指任何结果可能受到不确定性或随机性影响的行动或过程。
这里的“实验”一词的使用范围比它通常在受控实验室环境中的含义更广。关于实验的进一步说明将在稍后给出,但现在以下实验示例就足够了
- 观察商品是否为缺陷产品。
- 抛硬币一次或多次,或从一副牌中抽取一张牌。
- 进行调查。
- 测量特定区域的风速或降雨量。
假设实验可以在相同条件下重复进行,则每次重复实验称为试验。
从概念上解释概率有两种标准方法:相对频率方法和主观信念(或置信方法)。在频率概率论中,概率是在重复试验中特定结果出现的相对频率的极限(注意,任何单次试验的结果不能依赖于其他试验的结果)。相对频率方法要求实验是随机的,并且在执行实验之前所有可能的结果都是已知的。任何一组结果的概率表示为这些结果在多次重复试验中出现的相对频率。
物理概率属于客观概率或频率概率的范畴,与轮盘、掷骰子和放射性原子等随机物理系统有关。在这样的系统中,给定结果(例如,骰子出现六点)在长时间的试验中往往以稳定的速率或“相对频率”出现。物理概率要么解释,要么被用来解释这些稳定的频率。
相对频率概率始终表示为介于 0%(结果几乎永远不会发生)和 100%(结果几乎总是发生)之间的数字,或者类似地表示为介于 0 和 1 之间的数字。根据频率概率论,“A 发生的概率为 p%”意味着,如果你在本质上相同的条件下重复进行实验很多次,那么 A 发生的次数与总试验次数的比率将收敛到 p。例如,硬币正面朝上的概率为 50%,这意味着如果你不断地抛硬币,那么硬币正面朝上的次数与总抛掷次数的比率将随着抛掷次数的增加而趋近于 50%。请注意,一次抛掷的结果与另一次抛掷无关,并且正面朝上的次数与总抛掷次数的比率始终介于 0% 和 100% 之间。
在主观概率论中,概率衡量说话者对一组结果将在 0%(完全不相信事件会发生)到 100%(完全相信事件会发生)的尺度上产生结果的“置信程度”。根据主观概率论,“A 发生的概率为 ”意味着我相信 A 会发生的强度是 A 不会发生的强度的两倍。主观概率论在为原则上只能发生一次的结果的概率赋予意义时特别有用。例如,如何才能用相对频率来解释以下陈述的含义:“圣安地列斯断层在 2050 年之前发生 8 级或更大地震的概率为 25%”?用相对频率来量化这一指标将非常困难。
贝叶斯方法可以用来表示个人对给定可用证据的陈述的置信程度。证据概率,也称为贝叶斯概率,可以赋予任何陈述,即使没有涉及随机过程。在大多数情况下,证据概率被认为是置信程度,在特定赔率的赌博倾向方面定义。主要的证据解释包括经典解释、主观解释、认识论或归纳解释和逻辑解释。
接下来的几节将讨论相对频率概率方法中的主要理论。
概率的经典方法将概率表示为一系列连续试验中有利结果的数量与所有可能结果的数量的比率。请注意,这直接意味着所有可能结果的数量必须是已知的。此外,所有可能的结果被认为是等可能的,并且没有两个可能的结果可以来自同一个试验。在这里,“有利”这个词不是主观的,而是表示结果属于一组感兴趣的结果。这组结果被称为事件,它将在引入公理概率理论时被正式化。
如果属于事件 的结果数量为 ,而结果的总数为 ,那么事件 的概率定义为 。 |
例如,一副标准扑克牌(不带小丑)有 52 张牌。如果我们从牌堆中随机抽取一张牌,我们可以将每张牌视为一个可能的结果。因此,共有 52 个结果。现在我们可以看看各种事件并计算它们的概率。
- 在 52 张牌中,有 13 张梅花。因此,如果我们感兴趣的事件是抽取一张梅花,那么有 13 个有利结果,该事件的概率是 。
- 有 4 张国王(每种花色一张)。抽取一张国王的概率是 。
- 抽取一张国王或一张梅花的概率是多少?这个例子稍微复杂一些。我们不能简单地将每个事件的结果数量分别加在一起(),因为这样做无意中将其中一个结果计算了两次(梅花国王)。正确答案是 ,来自 ,这本质上是 。
经典概率有一个严重的局限性。概率的定义隐含地将所有结果定义为等概率的。虽然这可能对抽取卡片、掷骰子或从坛子里抽取球很有用,但它没有提供任何方法来处理具有不等概率的结果。
这种局限性甚至会导致关于概率的错误陈述。一个经常给出的例子是这样的
- 我明天可能会被流星击中。有两种可能的结果:我会被击中,或者我不会被击中。因此,我明天被流星击中的概率是 。
当然,这里的问题不在于经典理论,而在于试图将该理论应用于不适合它的情况。
然而,这种局限性并不意味着经典概率理论毫无用处。在公理化概率方法发展中的许多点上,经典理论都是一个重要的指导因素。
经验概率或统计概率或发生频率
[edit | edit source]这种概率方法非常适合广泛的科学学科。它基于这样一个想法,即事件的潜在概率可以通过重复试验来衡量。
设 为事件 在 次试验中发生的次数。我们定义事件 的概率为
|
当然,不可能进行无限多次试验。但是,通常进行大量的试验就足够了,其中“大”的标准取决于所测量的概率以及我们需要多精确的测量。
关于概率定义的一个说明:我们怎么知道序列 在极限情况下每次都会收敛到相同的结果,或者它会收敛吗?不幸的是,我们不知道。为了说明这一点,考虑一个无限次抛硬币的实验。我们对正面朝上的概率感兴趣。想象结果是以下序列
- HTHHTTHHHHTTTTHHHHHHHHTTTTTTTTHHHHHHHHHHHHHHHHTTTTTTTTTTTTTTTT...
其中每个长度为 的正面序列和长度为 的反面序列后面跟着另一个两倍长的序列。对于这个例子,序列 在大约 和 之间振荡,并且不收敛。
我们可能会认为这样的序列不太可能出现,我们是对的。稍后将证明,这种序列的概率为 0,收敛到除事件的潜在概率之外的任何值的序列也是如此。但是,这样的例子清楚地表明,上述定义中的极限并不代表更熟悉的意义上的收敛,而是某种概率意义上的收敛。准确地表述这意味着什么的问题属于公理化概率论。
公理化概率论
[edit | edit source]虽然公理化概率论对初学者来说往往令人望而生畏,但它是概率的最普遍方法,已被用来解决概率中一些更困难的问题。它从一组公理开始,这些公理虽然不是立即直观的,但以更熟悉的古典概率论为指导。这些公理将在(尚未编写)的下一章中讨论。