统计/测试数据/z检验

零假设应该是关于总体均值的假设。数据应该由来自总体的单个定量数据样本组成。

要求

样本应该来自已知标准差（或方差）的总体。此外，测量的变量（通常列为 $x-{\bar {x}}$ 是样本统计量）应该服从正态分布。

请注意，如果总体中变量的分布是非正态的（或未知的），那么 z 检验仍然可以用于获得近似结果，前提是样本量足够大。历史上，样本量至少为 30 被认为足够大；现实（当然）要复杂得多，但这个经验法则仍在许多教科书中使用。

如果总体标准差未知，则通常不适合使用 z 检验。但是，当样本量很大时，样本标准差可以用作总体标准差的估计，并且 z 检验可以提供近似结果。

术语定义

\mu _{0}

= 总体均值

\sigma

= 总体标准差

{\bar {x}}

= 样本均值

n

= 样本大小

步骤

零假设

这是一个关于无变化或无影响的陈述；通常，我们正在寻找该陈述不再正确的证据。

H₀ : μ = μ₀

备择假设

这是一个关于不等式的陈述；我们正在寻找该陈述是正确的证据。

H₁ : μ < μ₀ 或

H₁ : μ > μ₀ 或

H₁ : μ ≠ μ₀

检验统计量

z={\frac {{\bar {x}}-\mu _{0}}{\sigma /{\sqrt {n}}}}

显著性（p 值）

使用备择假设计算观察 z 值（来自标准正态分布）的概率，以指示在概率密度函数下计算面积的方向。这是获得的显著性，即 p 值。

请注意，一些（较旧的）方法首先选择一个显著性水平，然后将其转换为 z 值。在没有计算机和图形计算器的时代，这样做更有意义（也更容易！）。

决策

获得的显著性表示如果零假设为真，则获得与我们的检验统计量一样极端或更极端的检验统计量的概率。

如果获得的显著性（p 值）足够低，则表明我们的检验统计量不寻常（罕见）——我们通常将此作为零假设有误的证据。在这种情况下，我们拒绝零假设。

如果 p 值很大，则表明检验统计量很常见——我们将其视为缺乏反对零假设的证据。在这种情况下，我们未能拒绝零假设。

通常将 5% 用作常见和不常见之间的分界线；同样，现实更复杂。如果错误的后果会导致一个可能伤害或杀死人或造成重大经济损失的决定，有时必须选择更低的确定性水平。我们更有可能容忍一种杀死患有绝症的患者 5% 但治愈 95% 患者的药物，但我们几乎不能容忍一种使 5% 的使用者的外貌发生改变的化妆品。

实例

孩子们是否高于平均水平？

某项数学能力测试的平均分为 μ = 50，标准差为 σ = 10。一位业余研究人员认为他所在地区的学生比平均水平更聪明，并希望测试他的理论。

研究人员获得了来自他所在地区学生的 45 个分数的随机样本。该样本的平均分为 52。

研究人员是否有证据支持他的信念？

零假设是没有区别，他所在地区的学生与总体中的学生没有区别；因此，

H₀ : μ = 50

（其中 μ 表示他所在地区学生的平均分数）

他正在寻找证据表明他所在地区的学生高于平均水平；因此，备择假设是

H₁ : μ > 50

由于假设涉及单个总体均值，因此指示使用 z 检验。样本量相当大（大于 30），并且已知标准差，因此 z 检验是合适的。

z={\frac {{\bar {x}}-\mu _{0}}{\sigma /{\sqrt {n}}}}={\frac {52-50}{10/{\sqrt {45}}}}=1.3416

现在，我们找到正态分布曲线下z=1.3416右侧的面积（因为备择假设是在右侧）。这可以通过查表或软件来完成——我得到了0.0899的值。

如果原假设为真（这些学生与普通人群没有区别），那么得到样本均值为52或更高的概率为8.99%。这种情况相当常见（使用5%规则），所以看起来并不奇怪。我无法拒绝原假设（在5%水平）。

看来证据 *并不* 支持研究人员的观点。

机器工作正常吗？

苏是饮料生产工厂的质量控制负责人。目前，她正在检查一台机器的操作情况，该机器应该将355毫升的液体注入铝罐中。如果机器注入的液体过少，则当地监管机构可能会对公司处以罚款。如果机器注入的液体过多，则公司可能会损失资金。出于这些原因，苏正在寻找机器注入量与355毫升存在差异的任何证据。

在调查期间，苏获得了一个10个罐头的随机样本，并测量了以下体积

355.02 355.47 353.01 355.93 356.66 355.98 353.74 354.96 353.81 355.79

机器的规格声称注入的液体量服从正态分布，其均值为μ=355毫升，标准差为σ=0.05毫升。

数据是否表明机器工作正常？

原假设是机器按照其规格进行操作；因此

H₀ : μ = 355

（其中μ是机器注入的液体平均体积）

苏正在寻找 *任何* 差异的证据；因此，备择假设是

H₁ : μ ≠ 355

由于假设涉及单个总体均值，因此需要进行z检验。总体服从正态分布，并且已知标准差，因此z检验是合适的。

为了计算检验统计量（z），我们必须首先从数据中找到样本均值。使用计算器或计算机来计算 ${\bar {x}}=355.037$ .

z={\frac {{\bar {x}}-\mu _{0}}{\sigma /{\sqrt {n}}}}={\frac {355.037-355}{0.05/{\sqrt {10}}}}=2.34

p值的计算会稍微不同。如果我们只找到正态曲线下z=2.34 *上方* 的面积，那么我们找到了得到样本均值为355.037或 *更高* 的概率——那么得到较低值的概率呢？

如果备择假设使用≠，则p值是通过 *将尾部面积加倍* 来找到的——在本例中，我们将z=2.34上方的面积加倍。

z=2.34上方的面积为0.0096；因此，本检验的p值为0.0192。

如果机器注入的是355毫升，那么得到样本均值离355毫升如此远（0.037毫升）或更远的概率为0.0096，即0.96%。这是相当罕见的；我将拒绝原假设。

看来机器工作不正常。

注意：由于备择假设是≠，因此我们不能得出机器注入的液体 *超过* 355毫升的结论——我们只能说注入量与355毫升 *不同*。