统计/测试数据/z检验2
零假设应该是关于两个总体均值差异的假设(注意,在每个总体中必须测量相同的定量变量)。数据应包含两个定量数据的样本(每个总体一个)。这些样本必须独立地从彼此获得。
样本必须来自具有已知标准差(或方差)的总体。此外,每个总体中测量的变量(一般表示为 x1 和 x2)应具有正态分布。
注意,如果总体中变量的分布是非正态的(或未知的),则仍然可以使用双样本 z 检验来获得近似结果,前提是组合样本量(样本量之和)足够大。历史上,组合样本量至少为 30 被认为足够大;现实(当然)要复杂得多,但这个经验法则仍在许多教科书中使用。
- 零假设
- H0 : μ1 - μ2 = δ
其中 δ 是零假设下期望值之间的假定差异。
- 备择假设
- H0 : μ1 - μ2 < δ
- H0 : μ1 - μ2 > δ
- H0 : μ1 - μ2 ≠ δ
有关零假设和备择假设的更多信息,请参见单均值 z 检验页面。
- 检验统计量
通常,零假设是总体均值相等;在这种情况下,公式简化为
过去,如果可以假设两个总体的方差(以及标准差)相等,则计算更简单。此过程称为合并,许多教科书仍然使用它,尽管它正在逐渐被淘汰(因为计算机和计算器几乎消除了所有计算问题)。
- 显著性(p 值)
使用备择假设计算观察到 z 值(来自标准正态分布)的概率,以指示在概率密度函数下方计算面积的方向。这是获得的显著性或 p 值。
注意,一些(较旧的)方法首先选择一个显著性水平,然后将其转换为 z 值。这在计算机和图形计算器出现之前的时代更有意义(也更容易!)。
- 决定
获得的显著性表示在零假设为真的情况下,获得与我们的检验统计量一样极端或更极端的检验统计量的概率。
如果获得的显著性(p 值)足够低,则表明我们的检验统计量是不寻常的(罕见的)——我们通常将其视为零假设有误的证据。在这种情况下,我们拒绝零假设。
如果 p 值很大,则表明检验统计量是通常的(常见的)——我们将此视为缺乏反对零假设的证据。在这种情况下,我们无法拒绝零假设。
通常使用 5% 作为常见与不寻常之间的分界线;再次,现实更复杂。
美国大学和学院按提供的最高学位分类。IIA 类机构提供硕士学位,IIB 类机构提供学士学位。一位正在寻找新职位的教授想知道 IIA 和 IIB 类机构之间的薪资差异是否真的有意义。
他发现,随机抽取的 200 家 IIA 类机构的平均工资(正教授)为 $54,218.00,标准差为 $8,450。随机抽取的 200 家 IIB 类机构的平均工资(正教授)为 $46,550.00,标准差为 $9,500(假设样本标准差实际上是总体标准差)。
这些数据表明 IIA 类机构的工资明显更高吗?
零假设是没有差异;因此
- H0 : μA = μB
(其中 μA 是 IIA 类机构的真实正教授平均工资,μB 是 IIB 类机构的平均工资)
他正在寻找 IIA 类机构平均工资更高的证据;因此备择假设是
- H1 : μA > μB
由于假设涉及来自独立样本的均值(我们假设这些是独立样本),因此建议进行双样本检验。样本量很大,并且已知标准差(假设?),因此双样本 z 检验是合适的。
现在我们找到标准正态分布中z=8.5292右侧的面积。这可以通过表格或软件完成,我得到0。
如果零假设成立,并且两种机构类型之间的薪资没有差异,那么获得样本的概率,其中IIA机构的平均值至少比IIB机构的平均值高出7668美元,实际上为零。这种情况发生的频率太低,无法归因于偶然变异;这似乎很不寻常。我拒绝零假设(在任何合理的显著性水平上!)。
看起来IIA学校的薪资明显高于IIB学校。
示例2
[edit | edit source]一名学生在微积分考试中取得了65分,考试平均分为50分,标准差为10分;她在历史考试中取得了30分,考试平均分为25分,标准差为5分。比较她在两场考试中的相对位置?