卡方
概率密度函数
|
累积分布函数
|
符号 |
或  |
参数 |
(称为“自由度”) |
支持
|
如果 ,否则  |
PDF
|
|
CDF
|
|
平均值
|
|
中位数
|
|
众数
|
|
方差
|
|
偏度
|
|
峰度
|
|
熵
|
|
矩生成函数 (MGF)
|
|
特征函数 (CF)
|
|
概率生成函数 (PGF)
|
|
卡方分布与正态分布相关。卡方统计量是若干个独立的标准正态随机变量的平方和。
假设我们有 n 个服从正态分布的随机变量 Z。因此,我们可以写成
。如果我们将 Z 平方,使得
,那么我们得到卡方分布
。如果我们将 n 个
相加,我们可以写成
.
例如,我们想知道一组八个苹果的重量是否服从正态分布。卡方分布可以用来检验这一点。假设这些苹果的重量分别为 88 克、93 克、110 克、76 克、78 克、121 克、92 克和 86 克,并且我们知道所有苹果的平均重量和标准差。通过减去平均重量 (93) 并除以标准差 (15.41),我们得到服从正态分布的 Z 值。例如,第一个苹果的 Z 分数为
,保留四位小数。将所有 Z 值平方,然后将它们加起来得到一个服从卡方分布的随机变量,其平均值为 8,方差为 16。
现在,当我们得到卡方统计量 Y 的值时,我们将它与卡方分布在自由度 n = 8 且显著性水平为 95% 时的临界值进行比较,这些临界值可以在卡方统计表中找到。零假设是这组苹果的重量服从正态分布。如果检验统计量的值大于临界值,则拒绝零假设。
卡方分布是 伽玛分布 的特例,其中 a=2 和 p=k/2。概率密度函数为
![{\displaystyle {\frac {1}{2^{k/2}\Gamma (k/2)}}\;x^{k/2-1}e^{-x/2}\quad x\geq 0,\,k\in [1,2,...]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8ec261086bed171dd2fddc9c01dbfec2854f42fb)
卡方分布的平均值为 
卡方分布的方差为 
有关这些证明,请参见 伽玛分布。