统计学/分布/离散
外观
“离散”数据是指假设某些离散和量化值的数据。例如,是非答案是离散的,因为只有两种可能的选项。阀门设置,如“高/中/低”,可以被视为离散值。作为一般规则,如果数据可以在实践中被计数,那么它们可以被认为是离散的。
为了说明这一点,让我们考虑世界人口。这是一个离散数字,因为平民人数在理论上是可以计数的。但是由于这在实践中不可行,统计学家通常将此数据视为连续的。也就是说,我们认为人口处于一个数字范围内,而不是一个单独的点。
对于好奇的人来说,截至 2006 年 8 月 9 日,世界人口为 6,533,596,139。请注意,统计学家并没有通过计数单个居民来得出这个数字。他们使用了人口中更小的样本估计了整体。回到第一章,这是一个学习统计学的绝佳理由 - 我们只需要更小的数据样本就可以对整个人口进行智能描述!
离散分布是通过绘制本质上离散的数据的频率分布而得到的。
离散随机变量具有累积分布函数,它描述了随机变量低于该点的概率。累积分布必须向 1 递增。根据随机变量的不同,它可能在有限数量时达到 1,也可能不会。cdf 用大写 F 表示。
ń====概率质量函数====
离散随机变量具有概率质量函数,它描述了随机变量在特定点上的可能性。概率质量函数的总和必须为 1,并且加起来等于 cdf。pmf 用小写 f 表示。
离散变量的期望值为
离散变量的任何函数 g() 的期望值为
方差等于
外部链接
模拟二项式、超几何和泊松分布:离散分布