跳到内容

社会统计学,第 10 章:多个分类预测变量:方差分析模型

来自维基教科书,开放的书籍,开放的世界

多个分类预测变量:方差分析模型

[编辑 | 编辑源代码]

在二十世纪,德国在两次悲惨的毁灭性战争中入侵了其邻国。第一次世界大战(1914-1919 年)以及更甚的第二次世界大战(1939-1945 年)使欧洲沦为废墟。在欧洲七年的第二次世界大战中,大约有 1800 万名士兵和 2500 万名平民丧生,其中包括在大屠杀中被系统性杀害的 600 万名犹太人。这些死亡人数约占当时欧洲总人口的 7%,约每 13 人中就有 1 人。我们今天很难理解这种损失的规模。在第二次世界大战的大屠杀之后,欧洲领导人坚定地认为欧洲再也不应该发生战争。1951 年,六个西欧国家签署了一项条约,成立了欧洲煤钢共同体。在随后的 60 年里,这个有限的国际合作关系发展成为一个拥有 27 个国家、总人口超过 5 亿、经济规模超过美国的欧盟(EU)。今天的欧盟致力于在整个欧洲支持和平、发展、民主和人权。它通过经济合作和集体决策来实现这一点,其中需要 27 个国家全部批准才能做出重大决定。考虑到欧盟 60 年来在防止战争和促进欧洲繁荣方面的良好记录,我们可能期望欧洲公民对欧盟抱有高度的信心。事实上,他们没有。在 2005 年至 2008 年期间,世界价值观调查(WVS)在 11 个欧盟国家进行。另外两个国家(保加利亚和罗马尼亚)在 2006 年参加了 WVS,并在一年后的 2007 年加入欧盟。在这 13 个国家,所有受访者都被问及他们对欧盟的信心程度。在 0 到 3 的范围内,可用的答案是:0 -- 一点也没有 1 -- 很少 2 -- 相当多 3 -- 非常多 在这 13 个国家的总体平均答案是 1.355,更接近“很少”而不是“相当多”。不包括两个在调查进行时尚未加入的国家,平均值为 1.31。在自 1973 年以来一直是欧盟成员国的英国,对欧盟的平均信心水平仅为 1.03。在大多数国家,人们对“电视”的信心比对欧盟的信心更大。

图 10-1。2005-2008 年对欧盟机构的平均信心(N = 13 个国家)

另一方面,所有国家并不一样。一些国家(如意大利和西班牙)的人民确实表示对欧盟有相当高的信心。在英国,对欧盟的平均信心水平为 1.03,标准误为 0.027,因此英国的真实平均水平可能在 0.98 到 1.08 之间(观测平均值加减两个标准误)。同样,意大利的真实平均水平可能在 1.68 到 1.76 之间。意大利的真实平均值几乎肯定高于英国的真实平均值。在第 6 章中,我们学习了如何使用 t 统计量来评估组间平均值差异的统计显着性,事实上,英国和意大利之间的差异高度显着(t = 19.653,自由度为 1850,差异随机产生的概率为 0.000)。跨国对欧盟的信心差异有多大?回答这个问题的一种方法是询问跨国差异是否具有统计学意义。我们可以使用简单回归模型来评估任何两个组之间平均值差异的显着性,但是对于 13 个国家来说,有 78 对不同的国家可以比较。显然,我们不希望将所有这些国家都进行比较。我们可以改为将每个国家与欧洲整体平均值进行比较。这是一种更合理的策略,但它仍然需要 13 次单独的比较,然后必须以某种方式将这些比较组合起来。一种完全不同的策略是选择一个国家(如英国),并将所有其他国家与它进行比较。这种方法不会提供所有可能的国家比较的显着性水平,但它是一个开始。如果将另外 12 个国家在一个单一的多个线性回归模型中与英国进行比较,则 R2 分数将给出一些指示,表明对欧盟的信心方面受访者之间总的个体变异有多少可以归因于国家之间的差异。这种方法将具有额外的优势,因为我们已经知道如何使用其他变量进行多个线性回归。国与国之间的差异可以包含在更大的回归模型中,以使用群体成员资格和普通自变量来解释因变量。

本章介绍了一种新的回归模型设计类型,即方差分析模型。首先,可以使用平均值模型来研究变量值在各组案例中如何不同(第 10.1 节)。平均值模型的主要限制是它只能用于单独检查每个组,而我们真正想要做的是同时考虑所有组差异。其次,可以使用回归模型来确定组间差异的统计显着性(第 10.2 节)。重要的是,它们还告诉我们因变量变异的总百分比,这些变异可以追溯到组差异。第三,方差分析模型可以嵌入到更大的回归模型中,以创建结合了每种模型的方面的模型(第 10.3 节)。这些混合模型的解释与普通回归模型没有区别。可选部分(第 10.4 节)开发了一个新的统计量,即 F 统计量,它可以用来评估方差分析模型或任何其他回归模型的总体统计显着性。最后,本章以美国教育水平种族差异的应用案例研究结束(第 10.5 节)。本案例研究说明了如何使用混合模型来解释因变量值中的组间差异。本章的所有关键概念都将在此案例研究中使用。在本节结束时,您应该了解如何使用回归来研究自变量值中的组间差异。

10.1. 使用平均值模型比较组间差异 思考变量值中组间差异的自然方法是将每个组视为具有其自身的平均值。例如,在图 10-1 中,这 13 个国家中的每一个都有其自身的对欧盟的信心水平的平均值。这 885 名保加利亚人平均值为 1.63,这 1,049 名塞浦路斯人平均值为 1.41,依此类推。这通常是人们查看组平均值的方式,非常直观。这种方法的问题在于,它不一定是现实的准确反映。实际上,欧洲人报告对欧盟的信心程度或多或少的原因有很多。其中一个原因是个人居住的国家。每个国家的对欧盟的信心水平的平均值取决于该国的具体历史和情况。可以使用平均值模型来评估每个国家的真实平均值是否与所有欧洲人对欧盟的总体信心水平显着不同。在第 6 章中,我们学习了如何使用 t 统计量来评估真实平均值可能为零的概率。我们同样可以轻松地评估真实平均值可能为任何数字的概率。在这种情况下,我们想知道每个国家对欧盟的真实平均信心水平可能等于所有欧洲人的总体平均水平的概率。所有欧洲 WVS 受访者(14,154 人,分为 13 个国家)的平均观察值是 1.355。使用每个国家的平均值及其标准误,可以计算出 t 统计量以评估每个国家与欧洲平均值的距离。这些 t 统计量及其相关概率水平报告在图 10-2 中。

图 10-2。2005-2008 年对欧盟机构的信心差异的平均值模型方法(N = 14,154 人,分为 13 个国家)

根据图 10-2 中报告的结果,波兰(平均值为 1.39)和塞浦路斯(平均值为 1.41)的平均信心水平与欧洲整体平均值没有显着差异,而所有其他国家的平均值与欧洲整体平均值高度显着不同。由于有些国家的平均值显着高于欧洲平均值,而其他国家的平均值显着低于欧洲平均值,因此我们可以得出结论,总的来说,欧洲国家之间在对欧盟的信心方面存在重要的跨国差异。在这个例子中,几乎所有 t 统计量都非常显着,因此很容易看出国家之间的差异很重要。在其他情况下,情况可能并不那么清楚。例如,我们可能想知道国家在免疫幼儿免受疾病方面的成功率是否存在区域差异。第 9 章介绍了一个关于白喉-百日咳-破伤风(DPT)免疫率的国际数据库。该数据库包含 100 个贫困国家的数据,这些国家被组织成六个区域。数据库中 100 个国家按世界银行官方区域分布如下:东亚和太平洋(EAP)-- 14 个国家 东欧和中亚(ECA)-- 19 个国家 拉丁美洲和加勒比地区(LAC)-- 9 个国家 中东和北非(MNA)-- 8 个国家 南亚(SAS)-- 8 个国家 撒哈拉以南非洲(SSA)-- 42 个国家 DPT 疫苗用于 12-23 个月大的婴儿。这 100 个国家中这些年龄段婴儿的平均免疫率为 81.2%。在这六个世界银行区域中的五个区域,免疫率高于 81.2%,但在一个区域(撒哈拉以南非洲),免疫率低于 81.2%。图 10-3 中绘制了区域 DPT 免疫率的平均值。100 个国家的平均值也作为参考线放置在图表中。

图 10-3。2005 年 DPT 免疫率区域差异的条形图(N = 100 个贫困国家)

可以使用平均模型方法来研究 DPT 免疫接种率的跨区域差异。在 DPT 的例子中,个案是国家,国家被分组为区域。在图 10-4 中,使用 t 统计量评估区域与整体 100 个国家平均值 81.23% 的偏差。在世界银行的六个区域中,两个区域(ECA 和 LAC)的 DPT 免疫接种率显著高于 100 个国家平均值,一个区域(SSA)的 DPT 免疫接种率显著低于 100 个国家平均值,三个区域(EAP、MNA 和 SAS)的 DPT 免疫接种率与 100 个国家平均值没有显著差异。

图 10-4. 2005 年 DPT 免疫接种率区域差异的平均模型(N = 100 个贫困国家)

有两个较高,一个较低,三个相同,我们可以得出结论,DPT 免疫接种率存在有意义的区域差异吗?这不像欧盟的例子那样清晰。答案可能是肯定的(六个区域中有三个显示出显著差异),但我们没有任何明确的指导方针来支持这一点。

10.2. 方差分析作为回归模型 平均模型对于回答有关变量水平的简单问题可能很有用,但大多数社会科学家很少使用它们。社会科学家通常希望研究自变量如何影响因变量的多个方面,而这只能在回归模型的背景下进行。在回归模型(或一系列回归模型)中,因变量中观察到的总变异性可以以多种不同的方式划分。回归建模的唯一真正局限性是所有变量(因变量和自变量)都必须用数字表示。你不能在回归模型中使用像受访者居住国家这样的变量。大多数时候,当我们谈论变量、统计量和回归模型时,我们想到的是数字。我们有一些关于一个人的数据(如年龄或受教育年限),这些数据通常从零开始并从那里向上运行。数值变量是指取表示个案从最低数字到最高数字的有意义排序的数值的变量。数值变量不必从零开始。例如,它们也可以为负数,如不同国家科学中的性别差距(图 7-1)。一个变量可以将数字用作值,但仍然不是数值变量,但这很少见。例如,DVD 的区域代码将世界划分为六个区域(1-6),但这些数字并没有真正的数字意义。区域 2(欧洲)与区域 1(北美)相比,“区域性”更强,这种说法没有道理。另一方面,像 WVS 受访者居住国家(图 10-1)和世界银行区域(图 10-3)这样的变量根本没有与数字相关联。相反,这些变量的值是描述个案组的名称。像世界银行区域这样的描述用名称而不是数字描述个案组的变量称为分类变量。分类变量是将个案划分为两个或多个组的变量。分类变量包括具有多个组的变量(如世界银行区域和 WVS 国家)和仅具有两个组的变量(如“性别”编码为男性或女性)。由于分类变量不是数字,因此它们不能加、减、乘或除。它们也不能用于回归模型。当我们想在回归模型中使用诸如性别之类的分类变量时,我们必须将其编码为 0/1 变量,其中一个性别取值“0”,另一个性别编码为“1”。即使变量“性别”(男/女)是分类变量,变量“女性”(0=否,1=是)是数值变量。它代表受访者是女性的程度:0(完全不是)或 1(完全是)。由于“女性”是数值变量,因此它可以用于回归模型。例如,在图 9-8 的模型 2 中,“女性”的系数为 -7230,表明(在控制其他因素后)女性的预期工资与非女性相比,变化了 1 x -7230 = -7,230 美元。具有两个以上组的分类变量更加复杂。存在一种特殊的回归模型设计来适应这些变量。这些模型称为“方差分析”模型。方差分析 (ANOVA) 是一种类型的回归模型,它侧重于因变量中由分类变量解释的总变异性的比例。由于所有回归模型都涉及方差分析,因此将“方差分析”这个名字仅用于此类型的回归模型有点奇怪。不幸的是,这个名字在社会科学中至少使用了一个世纪,所以现在改变它为更好的名字已经太晚了。部分作为对这种尴尬的回应,大多数社会科学家今天使用缩写“ANOVA”来指代使用分类自变量而不是拼出完整名称的回归模型。在分类变量可以用于方差分析模型之前,它们必须重新编码为数值变量。这些新的数值变量称为方差分析变量。方差分析变量是回归模型中的数值变量,它们共同描述了分类组成员关系的影响。当分类变量只有两个组(如性别)时,它可以重新编码为单个方差分析变量(如女性 = 男性为 0,女性为 1)。然后,此单个数值变量可以用作回归模型中的自变量。当分类变量有三个组时,需要两个新变量。例如,考虑变量“政党隶属关系”,在大多数美国选举调查中,它必须取三个值之一(民主党、共和党、独立)。这可以重新编码为两个方差分析变量:民主党——对民主党人编码为 1,对其他人编码为 0共和党——对共和党人编码为 1,对其他人编码为 0这两个数值变量然后可以用作回归模型中的自变量。为什么没有为独立人士设置第三个变量?因为如果一个人在“民主党”变量上取值“0”,在“共和党”变量上取值“0”,那么这个人一定是独立人士。不需要额外的变量。更重要的是:如果你试图在回归模型中使用第三个独立人士变量,程序将不允许这样做。具有两个组的分类变量(性别)使用一个方差分析变量,具有三个组的分类变量(政党)使用两个方差分析变量,具有四个组的分类变量使用三个方差分析变量,等等。方差分析变量的数量始终比原始分类变量中的组数少一个。因此,例如,描述一个国家属于哪个世界银行区域的分类变量有六个组:EAP、ECA、LAC、MNA、SAS 和 SSA。在将此分类变量用于回归模型之前,它必须重新编码为五个方差分析变量。一个组被保留,没有被制成新变量。这个组被称为参考组。参考组是在方差分析变量中被保留且未在方差分析模型中显式包含为变量的组。将 SSA(撒哈拉以南非洲)作为参考组,世界银行区域的五个方差分析变量为:东亚及太平洋——对 EAP 国家编码为 1,对其他所有国家编码为 0东欧和中亚——对 ECA 国家编码为 1,对其他所有国家编码为 0拉丁美洲和加勒比地区——对 LAC 国家编码为 1,对其他所有国家编码为 0中东和北非——对 MNA 国家编码为 1,对其他所有国家编码为 0南亚——对 SAS 国家编码为 1,对其他所有国家编码为 0任何在所有五个方差分析变量上编码为“0”的国家,从排除法上看,一定是非洲国家。图 10-5 显示了 DPT 免疫接种率对这五个方差分析变量的回归。该模型的 R2 为 0.297,表明世界银行区域解释了 DPT 免疫接种率在国家间总变异性的 29.7%(几乎 30%)。

图 10-5. 以撒哈拉以南非洲为参考组,2005 年国家 DPT 免疫接种率对区域的回归(N = 100 个贫困国家)

图 10-5 中模型 1 的系数可以像任何其他回归模型的系数一样读取。当所有五个自变量都等于“0”时,DPT 免疫接种率的预期值为 71.7%(常数)。这是什么意思?这意味着 71.7% 是撒哈拉以南非洲 DPT 免疫接种率的条件平均值。在这个简单的方差分析模型中,常数给出了参考组因变量的条件平均值。这与图 4-6 中报告的简单回归模型没有区别,其中常数代表女性的平均收入(因为对于女性来说,变量“男性”的值为 0)。在图 10-5 中,撒哈拉以南非洲国家在所有五个方差分析变量上取值 0。因此,他们的预期 DPT 免疫接种率为:71.7 + 11.3 x 0 + 22.5 x 0 + 15.7 x 0 + 18.1 x 0 + 9.6 x 0 = 71.7%。你可以通过在图 10-4 中查找非洲的 DPT 免疫接种率平均值来确认这一点。五个方差分析变量的系数代表撒哈拉以南非洲与每个区域之间的 DPT 免疫接种率平均值的差异。例如,世界银行区域拉丁美洲和加勒比地区的国家的预期 DPT 免疫接种率为:71.7 + 11.3 x 0 + 22.5 x 0 + 15.7 x 1 + 18.1 x 0 + 9.6 x 0 = 87.4%。同样,你也可以通过在图 10-4 中查找来确认这一点。由于方差分析模型中的实际回归系数代表了与参考组的差异,因此不同的参考组将产生不同的结果。在图 10-5 中,所有系数都是正数,因为每个世界银行区域的 DPT 免疫接种率平均值都高于撒哈拉以南非洲。相比之下,每个世界银行区域的 DPT 免疫接种率平均值都低于东欧和中亚。在使用东欧和中亚作为参考组的相同方差分析中,所有系数都将为负数。图 10-6 说明了这一点。在图 10-6 中,R2 与图 10-5 中相同,但所有系数(包括常数)都发生了变化。

图 10-6. 以东欧和中亚为参考组,2005 年国家 DPT 免疫接种率对区域的回归(N = 100 个贫困国家)

R2 仍然是 0.297,因为无论使用哪个地区作为参考组,世界银行地区都解释了 DPT 免疫接种率跨国差异的 29.7%。现在常数代表东欧和中亚(参考组)DPT 免疫接种的平均水平。各地区的系数现在代表这些地区 DPT 免疫接种的平均水平与东欧和中亚的水平之间的差异。请注意,虽然所有系数都发生了变化,但模型生成的预期值都保持不变。例如,拉丁美洲和加勒比地区世界银行地区的预期 DPT 免疫接种率仍然是:94.3 - 11.3 x 0 - 6.8 x 1 - 4.4 x 0 - 12.9 x 0 - 22.5 x 0 = 87.5%。与早期结果(87.4% 对 87.5%)的细微差异是由于四舍五入造成的。在方差分析中,无论选择哪个组作为参考组,R2 和每个类别(根据其预期值计算)的条件均值都保持不变。图 10-5 和图 10-6 之间的真正区别在于系数的统计显著性。在图 10-5 中,所有组都与撒哈拉以南非洲进行比较,而在图 10-6 中,所有组都与东欧和中亚进行比较。报告的显著性水平与每个组的平均值与参考组的平均值之间的差异有关,不同的参考组将产生不同的显著性水平。因此,在方差分析模型中,每个方差分析变量系数的具体统计显著性通常并不重要。图 10-5 和图 10-6 中报告的方差分析比图 10-4 中报告的六个均值模型更可取,原因有以下几个:首先,方差分析模型告诉我们,免疫接种率跨国差异的总比例是多少,这是由于世界银行地区之间的差异造成的(近 30%)。其次,它告诉我们使用单个模型(而不是六个模型)来做到这一点。第三,它将分类自变量的分析整合到回归模型框架中。最后一点是最重要的,因为它使我们能够将所有回归模型工具应用于分类自变量影响的研究。

10.3. 混合模型方差分析模型只是具有非常特殊的自变量设置的回归模型。一旦创建了适当的方差分析变量来表示分类变量,它们也可以用于其他回归模型。例如,图 9-6 展示了一系列七个回归模型,这些模型使用七个不同的变量来解释 DPT 免疫接种率跨国差异。在图 10-7 中,这些变量与世界银行地区组合成一个单一分析,其中包括将方差分析变量与数值变量混合的模型。混合模型是包括方差分析成分和普通自变量的回归模型。与方差分析模型的系数一样,混合模型的系数只是普通的回归系数,其解释方式与任何其他回归系数相同。

图 10-7. DPT 免疫接种的混合模型,按地区分,2005 年(根据图 9-6;N = 100 个贫困国家)

图 10-7 中的模型 1 是一个基本模型,包括与免疫接种没有直接关系的一般发展变量。模型 2 添加了五个用于地区的方差分析变量。在控制了发展水平后,地区差异比图 10-6(也使用东欧和中亚作为参考组)中的差异要小得多。这表明,地区之间的大部分差异是由于地区发展水平的差异造成的。事实上,模型 1 的 R2 为 0.467,而模型 2 的 R2 为 0.476,提高了 0.009。这意味着,在控制了发展水平(模型 1)之后,由于地区差异(模型 2)造成的额外解释力只有 0.9%。健康和人口变量增加了更多的解释力,将模型解释的免疫接种率跨国差异的最终比例提高到模型 4 中的 54.3%。在图 10-7 中呈现的混合模型中,方差分析变量几乎没有增加解释力,并且在统计上并不显著(至少在使用东欧和中亚作为参考组的情况下)。在其他混合模型中,方差分析变量可能产生更大的影响。图 10-8 建立在图 9-8 的基础上,使用混合模型来提高我们对美国二十多岁人群中工资性别差距的理解。在图 9-8 中,种族是通过简单区分白人和非白人来实现的。在图 10-8 中,种族被定义为一个四组方差分析变量,使用白人作为参考组。图 10-8 还包括模型 5 中的另一个方差分析变量:一个人工作的行业。

图 10-8. 解释美国二十多岁人群工资性别差距的混合模型,2008 年(根据图 9-8;N = 7919 名美国二十多岁人群)

图 10-8 中的行业被定义为一个分类变量,可以取四个可能的值:AMM——农业、采矿业和制造业贸易——批发和零售贸易服务——教育、医疗保健、金融和其他服务政府——联邦、州和地方政府,以及非营利组织薪酬最高的群体 AMM 被用作参考组。模型 5 中报告的系数表明(在控制了所有其他变量之后),从事贸易和服务的人员的收入明显低于从事 AMM 的人员,而从事政府工作的人员的收入略微(不显著)低于从事 AMM 的人员。控制行业对模型的 R2 影响很小(R2 从 0.210 提高到 0.214,或 0.4%),但对性别差距有很大影响。在模型 4 中,性别差距为 5,501 美元。这意味着,即使在控制了年龄、种族、民族、教育、婚姻、子女、就业状况和入学情况之后,发现美国二十多岁的女性的收入仍然比美国二十多岁的男性少 5,501 美元。即使在考虑了所有这些控制因素之后,控制一个人所从事的行业也会使性别差距进一步缩小 791 美元,达到 4,710 美元。考虑到行业仅仅是广义地考虑(例如,教育、医疗保健和金融都被归入“服务”),这是一个相当大的下降。更好地控制行业和职业可能会进一步缩小性别差距。另一方面,性别差距仍然非常大,达到典型工资 20,000 美元左右的 4,000 多美元。即使在控制了许多相互竞争的解释之后,美国二十多岁人群的工资性别差距至少为 20%,并且可能更大。

10.4. 方差分析和 F 统计量(可选/高级)尽管方差分析(在数学上)是一个回归模型,但大多数教科书在教授回归之前就介绍了它,并且没有将两者联系起来。相反,方差分析只是作为评估组差异的工具来教授的。在这种方法中,方差分析中提出的关键问题是:因变量的值在组之间是否存在显著差异?通过将因变量的值在组之间的差异与因变量的值在每个组内的剩余差异进行比较来回答这个问题。如果组间差异相对于组内差异较大,则方差分析模型解释了因变量总体可变性的一个显著部分。如果组间差异非常小,则方差分析模型不显著。这种传统方法如图 10-9 所示。图 10-9 使用与图 10-3 相同的 DPT 免疫接种数据,但与图 10-3 不同,它显示了数据库中 100 个贫困国家中的每个国家的免疫接种率。图表上标注了一些示例国家。每个国家都以不同的数量和不同的原因偏离 81.2% 的总体平均免疫接种率。例如,几内亚的 DPT 免疫接种率仅为 51.0%,远低于 81.2% 的总体平均水平。几内亚 DPT 免疫接种率如此低的部分原因是它位于非洲,部分原因是特定于几内亚的模型误差。每个国家都可以进行相同的划分:每个国家对总体平均免疫接种率的偏差部分是由于其所在地区造成的,而部分是由于模型误差造成的。

图 10-9. 传统的方差分析方法对区域差异建模国家 DPT 免疫接种率的图形说明,2005 年(根据图 10-3;N = 100 个贫困国家)

在传统的方差分析模型中,区域平均值与总体平均值的偏差都被平方并加起来,形成一个平方偏差和。国家对区域平均值的剩余偏差也被平方并加起来。然后比较这两个和,以确定由区域造成的偏差是否构成了总平方偏差的统计显著比例。图 10-10 对 DPT 数据总结了此过程。区域的平方偏差和为 8000.93,而误差偏差的平方偏差和为 18944.78。然后将每个平方偏差和除以其自由度。由于六个区域可以使用五个方差分析变量完全描述,因此区域整体(作为分类变量)只有五个自由度。与 t 统计量(第 6 章)一样,估计均值也占用了 1 个自由度。由于有 100 个案例,这意味着模型误差还有 100 - 5 - 1 = 94 个自由度。

图 10-10. 区域差异国家 DPT 免疫接种率的传统方差分析模型,2005 年(根据图 10-5;N = 100 个贫困国家)

归因于组效应的均方偏差与归因于误差的均方偏差之比称为“F”统计量(以统计学家罗纳尔德·费舍尔的名字命名)。F 统计量有两个不同的自由度,一个是用于分子,一个是用于分母。在图 10-10 中,地区解释力的 F 统计量为 7.94,自由度为 5 和 94。使用参考书或统计软件程序来检查其显著性,这个 F 统计量与 0.000 的概率相关联。世界银行地区显著预测 DPT 免疫接种率。F 统计量通常是针对方差分析教授的,但实际上它适用于所有回归模型。统计软件程序中的回归输出几乎总是包含 F 统计量。它并不经常使用,因为它几乎总是具有统计学意义。很少有回归(或方差分析)模型无法解释因变量总体可变性的显著部分。F 统计量在比较嵌套回归模型(模型集,其中一个模型包含另一个模型中使用的所有变量,以及一些额外的变量)的解释力方面有一些有用的高级应用,但它对于描述方差分析模型的结果并不十分有用。R2 统计量通常在诊断组差异是否有实质性意义方面更有用。

10.5. 案例研究:美国教育中的种族差异 不同种族的美国人一直面临着不同的教育机会。在20世纪60年代之前,许多学校和大学完全拒绝黑人学生入学,一些学校和大学也歧视亚裔和其他种族背景的学生。除了学校的直接歧视外,不同种族的人还面临着基于收入、地理位置、机会意识以及许多其他因素的各种教育障碍。图 10-11 报告了 2008 年收入与计划参与调查 (SIPP) 第二次调查中,30 岁及以上美国成年人教育水平的种族差异。之所以关注 30 岁及以上人群,是因为大多数人在 30 岁之前已经完成了学业。

图 10-11. 2008 年 30 岁及以上美国成年人教育水平的种族差异(SIPP 数据)

图 10-11 中报告的数据表明,种族之间教育水平存在明显差异。亚裔美国人的教育水平最高,而非洲裔美国人和“其他”种族(主要是原住民)的教育水平最低。方差分析模型证实,这三个种族的平均教育水平均与白人显著不同。在图 10-12 的模型 1 中,分类变量“种族”被操作化为三个方差分析变量。白人群体用作参考组。亚裔、黑人和“其他”种族的教育水平与白人显著不同,其中亚裔的教育水平更高,黑人和“其他”种族的教育水平更低。另一方面,尽管这些差异在统计学上非常显著,但它们仅解释了教育总个体变异的不到 1%。教育水平的大部分个体差异显然与种族无关。有可能,美国种族之间教育水平的差异至少部分是由于美国人口按种族划分的年龄和性别构成差异:年龄和性别可能是模型 1 中的混杂变量。可以使用混合模型来检验这一命题,该模型控制了数值变量年龄和分类变量种族。模型 2 展示了仅使用年龄和性别来预测教育的基线模型,模型 3 包括种族。模型 3 中方差分析变量的系数表明,在控制年龄和性别后,白人和黑人以及白人和“其他”种族之间的差距实际上更大,而不是更小。在控制年龄和性别后,黑人平均接受的教育年限比白人少 0.581 年,而“其他”种族平均接受的教育年限比白人少 0.714 年。

图 10-12. 解释 2008 年 30 岁及以上美国成年人教育水平种族差异的混合模型 (N = 53,560 人)

显然,美国存在着教育上的种族差异。鉴于我们对美国社会种族歧视和劣势的悠久历史的了解,这一点并不令人意外。更有趣的是,教育中的种族差距如何随着时间的推移而变化。SIPP 样本中年龄较大的美国人成长在一个种族隔离的美国,该国家通常不允许非白人进入大学,而 SIPP 样本中年龄较小的美国人成长在一个社会中,该社会正式上是种族平等的,甚至鼓励少数民族入学。希望这意味着种族差距正在随着时间的推移而缩小。对于在 1980 年代和 1990 年代成年期的年轻美国人来说,教育中的种族差距是否比对于在 1950 年代和 1960 年代成年期的年长美国人来说更小?回答这个问题需要一种新型模型,即交互模型,这是第 11 章的重点。

第 10 章 关键词

[edit | edit source]
  • 方差分析 (ANOVA) 是指 _一种回归模型,其重点在于解释因变量总变异中由分类变量解释的比例_。
  • 方差分析变量 是指 _回归模型中一起描述分类组成员资格效应的数值变量_。
  • 分类变量 是指 _将案例划分为两个或更多组的变量_。
  • 混合模型 是指 _包含方差分析成分和普通自变量的回归模型_。
  • 数值变量 是指 _取数值值的变量,这些数值代表案例从低到高的有意义排序_。
  • 参考组 是指 _在方差分析变量中被设置一旁且在方差分析模型中未明确包含为变量的组_。


第 9 章 · 第 11 章


华夏公益教科书