使用 t 统计量的统计推断

过去 50 年来，社会发生的重大变化之一是女性经济权利的扩展。越来越多的女性在家庭之外工作，而且女性能够从事比以往更多的工作。女性仍然面临着许多挑战，包括工作场所的歧视，但高薪工作不再仅仅是为男性保留。机会正变得更加平等。不久前，许多职业对女性是封闭的。美国全国青年纵向调查 (NLSY) 的原始调查样本中的女性出生于 1957 年至 1964 年。这些女性在 1980 年代初期开始职业生涯，当时大多数职业对女性开放，但严重的工资歧视仍然存在。在许多情况下，这些女性也被期望将育儿责任放在职业发展之前。如今，随着这些女性临近退休，几十年来她们所面临的歧视可能意味着她们的收入仍然低于她们的知识和经验应得的水平。她们一生都遭受着挑战，这些挑战为未来的女性打开了机会。这些女性的女儿主要出生于 1980 年代。她们在 2000 年代进入劳动力市场。这些女性所面临的工资歧视远低于她们的母亲。因此，我们可能会假设原始 NLSY 女性的女儿将比她们的母亲赚取更高的工资。图 6-1 说明了一个比较 NLSY 女儿工资和她们母亲工资的数据库。女儿的工资取自 2008 年 NLSY，与 2007 年日历年获得的工资有关。仅包含在此期间约 23-30 岁的女儿。母亲的工资取自 1988 年 NLSY，与 1987 年日历年有关，当时她们也是 23-30 岁。母亲的工资已按通货膨胀进行调整。仅包含报告有工资收入的女儿和母亲（没有收入或收入缺失者被排除在外）。图 6-1 显示了数据库的前 30 行，但完整的数据库总共包含 642 对母女。数据库包括 7 列。前两个是元数据项：女儿和母亲的案例识别号。数据库中包含的五个变量是：B.YEAR -- 女儿的出生年份 D.WAGE -- 女儿在 2007 年的工资收入 M.WAGE -- 母亲在 1987 年的工资收入 M.ADJ -- 母亲的工资收入按通货膨胀调整到 2007 年美元 DIFF -- 每个女儿的工资收入与其母亲的工资收入之间的差额，或女儿比母亲多赚多少钱

图 6-2 报告了女儿的工资和她们母亲的工资（按通货膨胀调整）的描述性统计数据。女儿的工资的观察均值（23,881 美元）远高于她们母亲的工资的观察均值（17,181 美元）。这表明女性就业机会确实发生了代际变化。

推断性统计数据可用于对代际母女工资差异进行高置信度的结论。观察到的母女工资差异的平均值为 6700 美元。该平均工资差异的标准误差仅为 792 美元。这意味着工资的真实平均差异在 5900 美元到 7500 美元左右。它可能落在该范围之外，但鉴于观察到的平均值和标准误差，工资差异的真实平均值可能为 0 的可能性极低。我们可以自信地得出结论，受雇的 NLSY 女儿比她们的母亲 20 年前赚的钱更多。乍一看，这是一个令人惊讶的结果。工资差异的标准差非常大。观察到的平均工资差异为 6700 美元，但标准差几乎是其三倍：20,071 美元。工资差异的巨大误差有很多原因。首先，收入是出了名的难以衡量。人们通常不了解自己的收入细节，甚至更常撒谎。其次，数据中可能存在抽样误差，因为只有 642 对母女被用来代表美国女性人口。第三，也是最重要的，人们的收入差异很大。教育水平、职业选择、能力、个性和个人联系的差异都会在收入中产生特定于案例的误差。尽管存在所有这些误差，我们仍然可以对工资差异的平均值的大小如此自信的原因是，平均差异是根据大量的案例（N = 642）计算的。使用大量样本降低了平均值的标准误差。实际上，所有这些误差来源往往相互抵消。结果是，观察到的平均值可能非常接近真实平均值。有多接近？标准误差是对真实平均值可能值的有效指导，但我们真正需要的是一种方法来确定真实平均值不同值的确切概率。在回归模型中，我们想知道斜率不同值的实际概率。为了判断统计模型结果的重要性或显著性，我们需要有关真实均值和斜率分布的更详细的信息。

本章展示了如何对统计模型参数的真实值的可能范围做出正式推断。首先，可以将观察到的参数及其标准误差结合起来计算出一个称为“t”统计量的新度量（第 6.1 节）。t 统计量是衡量观察到的参数相对于其标准误差的大小。其次，t 统计量可用于确定真实均值是否与零显著不同（第 6.2 节）。这在配对样本（如女儿和她们的母亲）的研究中尤其重要。第三，t 统计量也可以应用于回归斜率（第 6.3 节）。回归斜率的 t 统计量可用于推断回归模型与简单平均模型相比是否增加了任何解释力。可选部分（第 6.4 节）展示了如何使用 t 统计量对真实均值如何与特定目标水平不同的进行推断。最后，本章以大量美国县的贫困与犯罪关系的应用案例研究结束（第 6.5 节）。本案例研究说明了如何使用 t 统计量对均值和回归斜率进行推断。本章的所有关键概念都将在此案例研究中使用。在本节结束时，您应该能够对统计模型参数的统计和实质性意义做出正式推断。

6.1. t 统计量标准误差非常类似于标准差。每个变量都有均值和标准差。标准差是有意义的，因为在大多数情况下，变量的值落在其均值方向上的一个标准差内。在几乎所有情况下，变量的值落在其均值方向上的两个标准差内。任何落在线程方向上两个标准差以外的案例都是异常情况，并且可能是异常值。另一方面，诸如均值、斜率和截距之类的参数具有标准误差。大多数情况下，模型的真实参数落在观察到的参数的一个标准误差内。真实参数几乎总是落在观察到的参数的两个标准误差内。然而，标准误差还有一个非常重要的属性。从数学上证明，真实参数以可以从参数的标准误差计算出的确切概率与观察到的参数不同。标准差和标准误差之间的主要区别在于，标准差描述了一组数据点（如变量），而标准误差描述了一个观察到的参数（如均值、斜率或截距）。标准误差表示观察到的参数中的误差量。标准差用于计算标准误差，但标准误差远小于标准差。图 6-3 总结了标准差和标准误差之间的主要区别以及它们的使用方法。

在推论统计中，标准误差用于推断参数的真实值。例如，我们经常想知道真实均值的值。我们知道变量的观测均值，并且我们知道变量的真实均值可能接近它们的观测均值，但我们永远无法确定真实均值到底是什么。变量观测均值的标准误差有助于我们推断其真实均值的可能值。在图 6-2 中，从社会政策的角度来看，了解女儿与母亲工资差异的真实均值是否为零非常重要。如果真实均值为零，则意味着女性在打击工作场所歧视方面没有任何进展。工资的观测均值差异为 6700 美元，标准误差为 792 美元。换句话说，观测均值距 0 有 8.46 个标准误差。如果你从 6700 美元开始减去一个标准误差，你会得到 5908 美元。如果你再减去一个标准误差，你会得到 5116 美元。如果你再减去一个标准误差，你会得到 4324 美元。你必须减去 8.46 个标准误差才能达到 0 美元。如果工资的真实均值差异确实为 0 美元，那么观测均值将偏离 8.46 个标准误差。统计学家将观测参数与其标准误差的比率称为“t”统计量。t 统计量是基于观测参数的度量，用于对真实参数的概率进行具体推断。“t”这个标签实际上并没有代表任何东西。由于历史上的偶然，第一个在 1908 年计算 t 统计量的人使用“s”来表示标准差，而“t”恰好是字母表的下一个字母。t 统计量是衡量参数相对于其标准误差的大小。参数的 t 统计量可以通过将参数除以其标准误差来轻松计算，但通常没有必要自己进行计算。统计软件程序通常会在参数及其标准误差旁边报告 t 统计量。t 统计量测量参数的大小。当观测参数的 t 统计量很大时，我们可以推断真实参数与 0 有显著差异。例如，t 统计量为 10 意味着参数是其标准误差的 10 倍，因此距离 0 有 10 个标准误差。这是一个显著且重要的差异。统计显著性是指统计结果如此之大，以至于不太可能仅仅是偶然发生的。观测参数的 t 统计量大于 2 通常与 0 具有统计学上的显著差异。在 NLSY 女性工资示例（图 6-2）中，观测均值女儿与母亲工资差异的 t 统计量为 8.46。这远大于 2。我们可以推断女儿与母亲工资差异的真实均值与 0 美元有非常显著的差异。统计计算机程序可以准确地告诉我们这个结果的统计显著性有多大。统计软件可以用来计算找到任意大小的 t 统计量的精确概率。该概率基于模型中的自由度数。例如，图 6-2 中女儿与母亲工资差距的平均模型基于 642 个案例。由于平均模型使用 1 个参数，因此模型具有 642 - 1 = 641 个自由度。计算机程序可以告诉我们，当观测均值的 t 统计量为 8.46，自由度为 641 时，真实均值可能是 0 美元或类似值的概率为 0.000000000000018%。换句话说，真实均值肯定不为 0 美元。从技术上讲，t 统计量的概率告诉我们的是“真实均值可能在观测均值 6700 美元的两侧 8.46 个或更多标准误差内的概率为 0.000000000000018%”。因此，从技术上讲，这个概率是真实均值可能为 0 美元、小于 0 美元、13400 美元或大于 13400 美元的概率。一些学科（如心理学）的做法是将这些概率分解成不同的“检验”，并进行“单尾”和“双尾”分析。在社会科学中，通常的做法要简单得多。t 统计量的概率被简单地认为是参数与 0 有显著差异的概率。图 6-4 给出了 t 统计量必须有多大才能被认为具有统计学意义的某种程度上的概念。图 6-4 报告了与自由度为 641 的 t 统计量相关的概率（如女儿与母亲工资示例）。实际观测到的 t 统计量 8.46 超出了图表范围。社会科学家通常认为，如果 t 统计量与 5% 或更低的概率相关联，则该统计量具有统计学意义。因此，当观测均值如此之大（相对于其标准误差），以至于真实均值可能为 0 的概率小于 5% 时，我们宣布真实均值与 0 具有统计学上的显著差异。

对于自由度为 641 的平均模型，任何大于约 1.96 的 t 统计量都表明真实均值与 0 有显著差异。与其他统计量一样，通常没有必要计算这些内容。统计软件程序可以提供所有必要的信息。例如，报告加拿大省份吸烟率与温度回归结果的统计软件输出（图 4-9）通常看起来像图 6-5 中的表格。虽然能够理解标准误差和 t 统计量很有帮助，但你实际上只需要从表格中获取概率。在加拿大省级吸烟率的示例中，温度对吸烟的影响的截距 (37.041) 和斜率 (-.443) 都是统计学上显著的。

6.2. 使用平均模型进行推断在平均模型中，t 统计量用于对真实均值的水平进行推断，但我们通常对真实均值并不太感兴趣。通常观测均值就足够了。例如，NLSY 样本中女儿和母亲工资的观测均值（图 6-2）分别为 23881 美元（女儿）和 17181 美元（母亲）。女儿工资的 t 统计量为 36.1，母亲工资的 t 统计量为 33.2（自由度均为 641）。非常大的 t 统计量告诉我们女儿和母亲工资的真实均值与 0 美元有显著差异。这是正确的，但并不十分有趣。当然，她们的真实工资与 0 美元不同。如果她们的雇主付给她们 0 美元，她们为什么要工作呢？只有当有某种理由证明真实均值不可能为 0 时，t 统计量在平均模型中才真正有用。这种情况通常发生在比较成对的关联案例时，例如比较女儿的收入与母亲的收入时。配对样本是每个案例代表两个关联观测的数据库。对于配对样本，我们通常想知道的是变量的真实均值是否已从一个时间段到另一个时间段发生了显著变化。我们知道观测均值发生了变化。如果我们在 1988 年对 642 名女性进行了调查，然后在 20 年后的 2008 年对她们的女儿进行了调查，那么这两个均值几乎不可能完全相同。仅仅是偶然，其中一个就会更高。我们想知道的是，20 年后的均值是否显著更高。对于配对样本数据，平均模型通常用于对真实均值随时间的变化进行推断。与女儿和母亲的收入一样，通常有重要的社会政策原因需要了解是否发生了变化。例如，许多人认为，今天的学校之所以受到影响，是因为它们在儿童和家庭的社会支持服务方面花费了太多时间和金钱，而在教育方面花费太少。今天社会上普遍存在一种印象，即学校现在将有限的资源更多地用于学生服务，而不是直接的课堂教学。学校真的已经从关注教育转向关注社会工作了吗？这是一个基于配对样本数据的平均模型的理想问题。图 6-6 包含了 1988 年和 2008 年美国 50 个州以及哥伦比亚特区的学校支出数据。除了通常的元数据项外，还有六个变量：EXPENDxxxx——1988 年和 2008 年的学校总支出SUPPORTxxxx——1988 年和 2008 年的学生支持服务支出Sup%xxxx——1988 年和 2008 年学生支持占总支出的比例学生支持服务支出包括学校护理、学校心理学、咨询和社会工作服务的支出。1988 年的数字已根据通货膨胀调整为 2008 年美元。请注意，所有支出都有所上升，部分原因是自 1988 年以来所有州的人口都增加了，部分原因是所有州对每个学生的教育支出都比 1988 年增加了。

图 6-7 总结了学生支持支出占教育总支出的百分比的描述性和推论统计数据。报告了 1988 年和 2008 年学生支持支出的描述性统计数据以及学生支持支出的变化。推论统计数据仅针对学生支持支出随时间的变化进行报告。关于 1988 年和 2008 年学生支持支出水平的推论统计数据将毫无意义，因为这两个变量的真实均值显然远大于 0%。

观察到的学生支持支出平均变化为1.36%。实际上，观察到的各州在学生支持服务方面的支出有所增加。这意味着各州真的比过去更加关注学生支持服务了吗？还是这种增长更有可能仅仅是真实平均值为0%（表示没有变化）的随机波动？t统计量的概率可用于推断随时间推移的真实平均变化。学生支持支出变化的t统计量为2.21，自由度为50（有51个案例，因此自由度为51-1=50）。与该t统计量相关的概率为0.039，即3.9%。换句话说，在1988年至2008年间，学生支持支出的真实平均变化为0%的可能性仅为3.9%。由于真实平均值没有变化的可能性小于5%，因此我们可以推断，1988年至2008年间，学生支持支出的真实平均水平发生了变化。2008年，各州在学生支持服务方面的预算支出比例明显高于1988年。自1988年以来，用于学生支持服务的教育支出的平均比例明显增加。观察到的平均增长率为1.36%，t统计量证实这种增长具有统计学意义。但这是否意味着它很重要？毕竟，学生支持支出的平均水平在二十年的时间里仅从34.04%增长到35.40%。在23个州，实际上有所下降。这些似乎是相当微弱的结果，不足以作为社会政策的依据。这种增长具有统计学意义，但从政策角度来看，它似乎不足以构成意义。实质意义是指统计结果在研究人员和社会大众看来足够大，具有意义。自1988年以来，学生支持支出有所增加，具有统计学意义，但它可能不足以被认为具有实质意义。

6.3. 回归斜率的推断在回归模型中，t统计量用于推断真实斜率。t统计量也可用于推断回归截距，但实际上很少这样做。虽然真实平均值的推断仅在特殊情况下进行（如配对样本），但真实斜率的推断则经常进行。用t统计量处理回归斜率非常常见，以至于统计软件程序通常在使用它们估计回归模型时默认输出t统计量及其相关概率。在社会科学中写出统计结果时，几乎所有回归斜率都伴随着一个记录其统计显著性的注释。回到官方发展援助（ODA）支出占国民收入比例的例子，20个富裕国家的ODA支出平均模型如图6-8左侧所示。20个富裕国家的ODA支出平均水平为0.52%（如图表所示），但各国的偏差很大。瑞典（SWE）的援助金额几乎是平均水平的两倍（占国民收入的1.01%），而美国（USA）的援助金额则远低于平均水平的一半（占国民收入的0.19%）。是什么让一些富裕国家在通过ODA援助帮助贫困国家方面比其他国家更加慷慨呢？

解释平均模型中部分案例特定误差的一种理论可能是，更富裕的国家有更多的钱可以花，因此更有能力变得更加慷慨。富裕国家在财富水平方面存在很大差异。最贫穷的富裕国家是新西兰（NZL），人均国民收入为27,940美元，而最富裕的国家是挪威（NOR），人均国民收入为87,070美元。该理论表明，挪威有能力比新西兰提供更多的援助，而且它确实做到了。从这两个案例推广，我们可以假设国家的ODA支出水平随着国民收入水平的提高而上升。图6-8右侧显示了ODA支出与国民收入水平之间的关系。该假设似乎是正确的：ODA支出中很大一部分的案例特定误差可以归因于国民收入的差异。从描述的角度来看，国民收入的差异解释了ODA支出中“很大一部分”的案例特定误差，但国民收入的影响是否具有统计学意义？图6-9中的模型1报告了ODA支出对国民收入（以千美元计）的回归结果。此模型和图6-9中报告的其他模型的数据均来自图4-1所示的数据库。国民收入的斜率为0.013，表明每增加1000美元的国民收入，ODA支出预计会增加0.13%。根据我们掌握的数据，国民收入真实斜率可能为0的概率非常小。我们可以推断，国民收入的真实斜率几乎肯定不为0。国民收入对ODA支出有高度显著的影响。

还有哪些因素可以解释ODA支出水平中部分案例特定误差？图6-9中报告了另外两个回归模型的结果。在模型2中，ODA支出回归到欧洲身份（如图4-3所示）。观察到的斜率为0.328。这代表了非欧洲国家和欧洲国家之间ODA支出平均水平的观察差异。欧洲国家倾向于比非欧洲国家提供0.328%的ODA。与该斜率相关的t统计量的概率为0.013（即1.3%），表明欧洲身份真实斜率为0的可能性很小。基于真实斜率为0的概率很小，我们可以推断真实斜率不为0。我们可以推断，欧洲国家比非欧洲国家更加慷慨。模型3说明了一个不显著的斜率。在模型3中，ODA支出回归到行政效率（行政成本占官方发展援助总额的百分比）。我们可以假设，一个国家偏离ODA支出平均水平的案例特定偏差的一部分可能是由于行政成本高。如果行政成本高，ODA支出也会高，因为总支出水平等于一个国家在提供援助方面的真实“慷慨程度”加上其在管理援助预算方面的成本。观察到的回归斜率为-.003，表明实际上并非如此。行政成本高实际上与较低的ODA支出相关联，而不是更多。观察到的行政成本影响很小，但绝对是负面的，而不是正面的。观察到的行政成本对ODA支出的影响可能是负面的，但这种影响与0没有显著差异。行政成本斜率的t统计量的概率为0.927，表明真实斜率可能为0（或与观察到的斜率的距离与0一样远）的可能性为92.7%。我们可以由此推断，行政成本对ODA支出没有显著影响。关于不显著斜率的另一种思考方式如图6-10所示。图6-10对比了ODA支出平均模型（左侧）和基于行政成本的ODA支出回归模型（右侧）。尽管回归线确实略微向下倾斜，但图表右侧的散点图并没有特别随着直线移动。这与图6-8右侧的情况大不相同，在图6-8右侧，散点图与直线追踪得更加紧密。图6-10说明了这样一种情况，即ODA支出平均模型中只有一小部分案例特定误差由回归模型解释。当回归模型对因变量的案例特定误差解释很少时，斜率往往很小，而且没有统计学意义。

6.4. 单样本t统计量（可选/高级）与参数相关的t统计量通常用于推断真实参数是否与0显著不同。默认情况下，这是所有统计软件程序使用t统计量的方式。尽管如此，有时社会科学家希望对真实参数进行其他推断。这需要一些额外的工作，但有可能使用t统计量来评估真实参数是否与任何数字（不仅仅是0）显著不同。这在平均模型中最常进行。在回归模型中，我们几乎总是想知道这条线是否真正倾斜，而其他则无关紧要。另一方面，在平均模型中，我们经常想知道真实平均值是否达到某个目标或阈值。这可以用ODA支出水平数据再次说明。图4-1中列出的20个富裕国家ODA支出的观察平均水平为0.52%。如第5章所述，这些国家商定了一个ODA支出目标水平，即占国民收入的0.70%。第5章中使用的ODA支出标准误用来论证真实平均ODA支出水平达到0.70%的目标“非常不可能”。究竟有多不可能？回答这个问题的一种方法是构建一个人工配对样本数据库。每个国家的实际ODA支出水平可以与0.70%的目标水平配对，并计算出差值。这在图6-11中完成。实际ODA支出与目标ODA支出之间平均差值的t统计量为3.03，自由度为19。与该t统计量相关的概率仅为0.007（0.7%）。换句话说，国家真正达到ODA支出占国民收入的0.7%的目标的可能性仅为0.7%（这两个数字都是0.7只是巧合）。真实平均支出水平远低于0.7%的目标。

回答这个问题的另一种更直接的方法是将观察到的平均值与 0.70% 进行比较。观察到的官方发展援助支出平均水平为 0.518%。这比目标水平低 0.182%。该观察到的平均值的标准误为 0.060%。正如第 5 章所讨论的那样，观察到的平均值比 0.70 低 3 个标准误（实际上为 3.03 个标准误，如图 6-11 所示）。由于观察到的平均值距离目标值 3.03 个标准误，因此观察到的平均值与目标值之间差异的 t 统计量为 3.03。具有 19 个自由度的 3.03 的 t 统计量具有 0.007 的概率。这与使用配对样本设计得出的结果相同。官方发展援助支出的真实平均水平显著低于 0.7%。这种 t 统计量的使用称为“单样本”t 统计量。它之所以有效是因为均值与其目标值之间的差异（在单样本场景中使用）与案例与其目标值之间的差异均值相同（在配对样本场景中使用）。单样本 t 统计量可用于评估观察到的均值与真实均值的任何任意目标水平之间的差距。原则上，相同的逻辑也可以用来评估观察到的回归斜率和截距与任意目标之间的差距，但这在实践中很少发生。单样本 t 统计量的常见用途是推断样本误差。例如，根据 2000 年美国人口普查，美国家庭的观察到的平均规模为 2.668 人。该数字是基于对整个人口的实际统计，因此虽然它可能存在测量误差和案例特定误差，但它没有样本误差。2000 年人口普查局当前人口调查 (CPS) 中美国家庭的观察到的平均规模为 2.572 人。CPS 是对美国人口的抽样调查，它使用与人口普查本身相同的测量方法。CPS 的测量误差应该与人口普查的测量误差相同，而 CPS 的案例特定误差应该等同于人口普查的案例特定误差。这意味着 CPS 观察到的家庭规模与人口普查观察到的家庭规模之间的唯一区别应该是 CPS 中的样本误差。人口普查观察到的 2.668 的均值与 CPS 观察到的 2.572 的均值之间的差异为 0.096 人。CPS 均值的标准误为 0.0057，得出的 t 统计量为 16.79。CPS 均值基于 64,944 个家庭。具有 64,943 个自由度的 16.79 的 t 统计量具有非常接近于 0 的微小概率。由此我们可以推断出 CPS 均值与人口普查均值显著不同。换句话说，CPS 中的样本误差水平在统计学上是显著的。另一方面，0.096 人的均值差异表明它可能在实质上并不显著。

6.5。案例研究：贫困与犯罪贫困与犯罪密切相关。贫困通常被衡量为缺乏金钱收入。生活在家庭收入低于一定收入门槛的人被认为生活在贫困中。确切的收入门槛取决于国家、家庭规模和构成，有时还取决于国家内的地区。在美国，过去四十年，全国总体贫困率一直稳定在人口的 12.5% 左右。由于贫困的整个概念与收入过低的想法密切相关，因此人们可能会预期贫困与财产犯罪的关系比与暴力犯罪的关系更为密切。如果贫困从根本上来说是缺乏金钱，那么贫困人口可能会被预期会犯下财产犯罪以获得更多金钱。这是对贫困的唯物主义理论。另一方面，贫困可能并非从根本上来说是一种经济现象。人们可能会争辩说，贫困实际上比仅仅缺乏收入要多得多。在这个贫困理论中，生活在贫困中意味着过着一种缺乏基本人尊严的生活，而这种人尊严来自于拥有一份好工作、良好的教育和安全的家园。如果贫困更多地与个人尊严而不是收入有关，那么贫困可能与暴力犯罪的关系比与财产犯罪的关系更为密切，因为人们会因缺乏自尊而对爱人和周围的人进行暴力报复。这是对贫困的心理社会理论。哪一个正确，是唯物主义的贫困理论还是心理社会的贫困理论？就具体假设而言，贫困与财产犯罪的关系更密切还是与暴力犯罪的关系更密切？在美国，美国人口普查局几乎为每个县提供贫困率数据，而联邦调查局为大多数（但并非全部）县提供犯罪数据（许多农村县的数据缺失）。总而言之，2008 年，在 3140 个美国县中，有 2209 个县同时拥有贫困率和犯罪率统计数据。在这 2209 个美国县中，财产犯罪率远高于暴力犯罪率。考虑到美国县的两种犯罪率为配对样本，观察到的暴力犯罪率平均值为每 100,000 人口 85.9 起，远低于观察到的财产犯罪率平均值为每 100,000 人口 636.7 起。两种犯罪率的平均差为 550.8，标准误为 18.52。与该平均差相关的 t 统计量为 t = 13.937，具有 2208 个自由度，表明在 2209 个县中，财产犯罪和暴力犯罪的真实水平相等的概率为 .000。财产犯罪确实比暴力犯罪普遍得多。这种差异在统计学上是显著的（概率 = 0%）并且在实质上是显著的（平均暴力犯罪率是平均暴力犯罪率的 7.4 倍）。将财产犯罪率和暴力犯罪率回归到 2209 个美国县的贫困率的结果如 6-12 图所示。两个斜率都为正并且在统计学上高度显著。贫困率每上升 1%，财产犯罪率预计会增加每 100,000 人口 13.0 起，暴力犯罪率预计会增加每 100,000 人口 4.5 起。显然，犯罪率随着贫困而上升。相对斜率似乎暗示贫困对财产犯罪的影响比对暴力犯罪的影响更大，但这两个斜率实际上不可比。由于财产犯罪比暴力犯罪普遍得多，因此贫困率的额外增加预计会导致财产犯罪率的变化幅度大于暴力犯罪率的变化幅度。

另一方面，两个 t 统计量是可以比较的。t 统计量代表每种关系的统计显著性。换句话说，t 统计量与回归模型对财产犯罪和暴力犯罪捕捉到的县特定偏离均值犯罪率的程度相关。暴力犯罪的 t 统计量约为财产犯罪的 t 统计量的 2.5 倍。这意味着贫困解释了暴力犯罪率变化的程度远远超过财产犯罪率变化的程度。换句话说，贫困对于理解暴力犯罪比对于理解财产犯罪更重要。这往往更支持心理社会的贫困理论，而不是唯物主义的贫困理论。贫困不仅仅是金钱问题。它也是——或者也许更多地——尊严问题。

第 6 章关键词

配对样本是指每个案例代表两个关联的观察结果的数据库。
统计显著性是指统计结果大到不可能仅仅是偶然发生的。
实质性显著性是指统计结果大到足以在研究人员和整个社会眼中具有意义。
t 统计量是指基于观察到的参数的度量，用于对真实参数的概率进行特定推断。

← 第 5 章 · 第 7 章 →