统计学/概率
概率与一些不可预测性有关。我们知道可能出现哪些结果,但不能确定具体是哪一个。所有可能结果的集合起着基本作用。我们称之为样本空间,并用S表示。S的元素称为结果。掷骰子的样本空间为S = {1,2,3,4,5,6}。我们不仅谈论结果,还谈论事件,结果的集合(或样本空间的子集)。例如,掷骰子时,我们可以询问结果是否为偶数,这意味着询问“偶数”事件= E = {2,4,6}。在结果数量有限的简单情况下,我们为每个结果s (∈ S) 指定其概率(出现概率)p(s)(用小写p表示),它是一个介于0和1之间的数。这是一个非常简单的函数,称为概率函数,其唯一其他属性是所有概率的总和为1。我们也讨论事件A的概率P(A)(用大写P表示),它只是A中所有结果的概率之和。对于一个公平的骰子,p(s) = 1/6,对于每个结果s,P(“偶数”) = P(E) = 1/6+1/6+1/6 = 1/2。
非有限样本空间的概率的一般概念稍微复杂一些,尽管它建立在相同的想法之上。
数学中很少有真正自包含的东西。许多数学分支相互接触和相互作用,概率和统计领域也不例外。对概率的基本理解对于理解基本统计学至关重要,而概率在没有统计学来确定“现实世界”概率的情况下在很大程度上是抽象的。
本节并非旨在对概率进行全面讲授,而是简单地触及本课程所需的概率基础,涵盖贝叶斯分析的基础知识,以供那些寻求更有趣内容的学生使用。这些知识对于尝试理解各种分布的数学原理将非常宝贵,这些分布将在后面介绍。
集合是一组对象。我们通常用大写字母表示集合,例如,A是这个房间里所有女性的集合。
- 集合A的成员称为A的元素,例如,帕特里夏是A的一个元素(帕特里夏∈ A);帕特里克不是A的一个元素(帕特里克∉ A)。
- 全集U是所考虑的所有对象的集合,例如,U是这个房间里所有人的集合。
- 空集或空集∅没有任何元素,例如,这个房间里身高超过2.8米的男性集合是一个空集。
- 集合A的补集Ac是U中不在A中的所有元素的集合,即,x ∈ Ac 当且仅当 x ∉ A。
- 设A和B为2个集合。如果A的每个元素也是B的元素,则A是B的子集。写成A ⊂ B,例如,这个房间里戴金属框眼镜的女性集合 ⊂ 戴眼镜的女性集合 ⊂ 这个房间里的女性集合。
• 两个集合A和B的交集A ∩ B是共同元素的集合。即,x ∈ A ∩ B 当且仅当 x ∈ A 且 x ∈ B。
• 两个集合A和B的并集A ∪ B是A或B中所有元素的集合。即,x ∈ A ∪ B 当且仅当 x ∈ A 或 x ∈ B。
韦恩图以视觉方式对定义的事件进行建模。每个事件用一个圆圈表示。具有共同结果的事件将重叠,被称为事件的交集。
否定是一种表达“非A”的方式,因此表示A的补集已经发生。注意:事件A的补集可以表示为A'或Ac
例如:“六面骰子不落在1上的概率是多少?”(六分之五,或p = 0.833)
或者,更口语化地说,“‘非X’的概率加上‘X’的概率等于1或100%。”
相对频率描述了成功次数与总结果次数之比。例如,如果抛硬币50次,其中29次正面朝上,那么相对频率是
两个事件的并集是指你想知道事件A或事件B。
这与“和”不同。“和”是交集,而“或”是事件的并集(两个事件合在一起)。
在上面的事件示例中,你会注意到...
事件A是星星和钻石。
事件B是三角形、五边形和星星。
(A ∩ B) = (A 和 B) = A 与 B 的交集,只有星星
但 (A ∪ B) = (A 或 B) = A 与 B 的并集,是所有东西。三角形、五边形、星星和钻石
注意,事件A和事件B都有星星作为共同点。但是,当你列出事件的并集时,你只列出星星一次!
事件A = 星星,钻石 事件B = 三角形,五边形,星星
当你将它们组合在一起时,你得到(星星+钻石)+(三角形+五边形+星星),但是等等!星星被列出了两次,所以需要从列表中减去多余的星星。
你应该注意到,是交集被列出了两次,所以你必须减去重复的交集。
事件并集的公式:P(A ∪ B) = P(A) + P(B) - P(A ∩ B)
示例
设 P(A) = 0.3,P(B) = 0.2,P(A ∩ B) = 0.15。求 P(A ∪ B)。
P(A ∪ B) = (0.3) + (0.2) - (0.15) = 0.35
示例
设 P(A) = 0.3,P(B) = 0.2,P(A ∩ B) = 0。求 P(A ∪ B)。
注意:由于事件的交集为空集,那么你便知道事件是分离的或互斥的。
P(A ∪ B) = (0.3) + (0.2) - (0) = 0.5
全概率定理[1] 是一个定理,在离散情况下,它表明如果 {\displaystyle \left\{{B_{n}:n=1,2,3,\ldots }\right\}}\left\{{B_{n}:n=1,2,3,\ldots }\right\} 是样本空间的一个有限或可数无限划分(换句话说,一组两两不相交的事件,它们的并集是整个样本空间),并且每个事件 {\displaystyle B_{n}}B_{n} 是可测的,那么对于同一个概率空间的任意事件 {\displaystyle A}A
{\displaystyle P(A)=\sum _{n}P(A\cap B_{n})}{\displaystyle P(A)=\sum _{n}P(A\cap B_{n})} 或者,另一种说法是[1]
{\displaystyle P(A)=\sum _{n}P(A\mid B_{n})P(B_{n}),}{\displaystyle P(A)=\sum _{n}P(A\mid B_{n})P(B_{n}),} 其中,对于任何 {\displaystyle n}n,如果 {\displaystyle P(B_{n})=0}{\displaystyle P(B_{n})=0},这些项将被简单地从求和中省略,因为 {\displaystyle P(A\mid B_{n})}{\displaystyle P(A\mid B_{n})} 是有限的。
给定另一个事件发生的情况下,一个事件的概率是多少?例如,给定老鼠找到了迷宫的房间,那么它找到迷宫尽头的概率是多少?
这用以下方式表示
或“给定B的情况下,A的概率”。
如果A和B彼此独立,例如抛硬币或生育孩子,那么
因此,“给定上一个孩子是男孩,那么下一个孩子是男孩的概率是多少?”
这也可叠加,其中A的概率有几个“给定”。
或“给定B1、B2和B3为真,那么A的概率是多少?”
-->