跳转至内容

社会统计学,第 11 章:交互模型

来自维基教科书,开放的书本,开放的世界

交互模型

[编辑 | 编辑源代码]

人们常说教育是通往美好生活的关键。教育使人更聪明,更明智。教育打开了人们的心灵,让他们接触到新的思想、新的体验和新的机遇。教育甚至能带来更好的健康状况。教育之所以能产生所有这些影响,是因为教育改变了人们的本质。因为你追求了高等教育,所以你成为了一个与过去不同的你。你可能不愿意承认上大学正在改变你,但无论好坏,它确实在改变你。在学术环境中学习和社交几年而不受任何影响是不可能的。对大多数人来说,教育带来更充实、更快乐、更长久的生命。教育也与收入密切相关。人们早年完成的教育程度与其多年后的收入高度相关。这在全世界都是如此,无论是在富裕国家还是贫穷国家。受教育程度更高的人比受教育程度更低的人获得更高收入的原因有很多。首先,拥有富有和受过高等教育的父母的人往往会接受更多教育,因此受教育程度更高的人往往比受教育程度更低的人起步时就拥有更多优势。更重要的是,许多职业都需要教育证书才能入职,从按摩师到癌症医生,所有职业都是如此。教育还赋予人们知识和社会联系,帮助他们在职业生涯中取得成功。无论是什么原因,事实都很清楚:受教育程度更高的人比受教育程度更低的人获得更高收入。我们在图 10-8 中看到了这一点。尽管图 10-8 主要关注性别工资差距,但也表明,在美国,每多接受一年的教育,20 多岁的美国人预计的工资就会增加 3000 多美元。这个数字在所有五个估计模型中都得到了证实。图 10-8 中教育的系数从模型 1 的 3065 到模型 2 的 3262,其他模型的系数介于这两个数字之间。系数超过 3000 表示,对于典型的 20 多岁美国人来说,四年制大学学位意味着每年可以获得超过 12000 美元的额外工资(3000 美元/年 x 4 年)。不幸的是,正如我们在图 10-10 和图 10-11 中学到的那样,美国的教育在很大程度上取决于种族。这在其他国家也是如此,但美国比任何其他国家都有更详细的数据。在美国 30 岁及以上的人中,亚裔受教育程度最高,其次是白人,然后是黑人,最后是其他人。图 10-11 的模型 1 显示,与白人相比,亚裔平均多接受了 0.632 年的教育,而黑人平均少接受了 0.556 年的教育。种族差异总体上解释了个人之间教育差异的不到 1%(R2 = .008),但种族的影響仍然具有统计学意义,而且具有实质性意义。图 11-1 探讨了教育在解释美国 30 岁及以上人群种族收入差异中所起的作用。数据来自 2008 年收入和计划参与调查(SIPP)第 2 阶段。图 11-1 的模型 1 是一个简单的方差分析模型,其中工资回归到种族。分类变量“种族”已使用三个方差分析变量操作化:亚裔、黑人和其他人。参考组为白人。亚裔、黑人和其他人的系数代表这些种族的人与白人之间的平均工资差异。黑人的差异尤其大。平均而言,30 岁及以上的黑人美国人比白人美国人少赚 8746 美元。亚裔美国人比白人多赚(平均)5991 美元。将这两个数字结合起来,亚裔美国人比黑人美国人多赚(平均)5991 + 8746 = 14737 美元。

图 11-1. 美国 30 岁及以上人群工资的方差分析和混合模型,2008 年(N=53,402)

这些种族之间的差异具有高度显著性,但它们加起来只解释了美国人工资总变异性的很小一部分(只有 0.5%)。这并不意味着种族不重要。大约 80% 的美国人口将自己归类为白人(包括白人西班牙裔,如大多数墨西哥裔美国人)。由于大多数人口是白人,因此人们工资的大部分变异性是白人之间的变异性。换句话说,只有 20% 的非白人人口才能感受到种族的影響(将白人视为参考组)。即使对这些人来说,其他因素(如年龄、教育程度、职业、行业、居住地和就业状况)可能更重要。因此,种族本身只解释了人们工资总变异性的 0.5% 并不奇怪。模型 1 中的系数大且显著,表明种族很重要。由于我们从图 10-11 中知道,在美国,不同种族的教育程度存在显著差异,因此我们可能假设图 11-1 模型 1 中观察到的种族工资差异是由于种族教育差异造成的。毕竟,如果黑人比白人接受的教育明显少,那么发现他们(平均而言)收入更低也不足为奇。为了调查这种可能性,图 11-1 的模型 2 控制了教育程度。由于种族是一个分类变量,而教育是一个数值变量,因此模型 2 是一个混合模型。在模型 2 中,控制教育程度会缩小工资收入的种族差距,但剩余差距仍然高度显著。模型 2 表明,30 岁及以上的黑人美国人比教育程度相似的白人美国人(平均)少赚 5810 美元。模型 2 中额外一年的教育影响(5269 美元)几乎与黑人和白人之间的工资差距(5810 美元)一样大。这表明,解决种族工资差异的一种方法可能是鼓励黑人接受更高水平的教育。目前,黑人平均比白人少接受 0.556 年的教育(图 10-11 的模型 1)。提高黑人教育水平是否也能提高黑人的工资?根据图 11-1 的模型 2,答案似乎是肯定的。另一方面,额外一年教育对黑人可能比对白人提高工资更少。如果发生这种情况,就很难用教育来解决种族工资差距。图 11-2 说明了种族之间额外一年教育影响的差异。对于白人来说,每多接受一年教育,工资收入就会增加 5393 美元。对于亚裔来说,这种影响类似,但略小(5298 美元)。对于黑人和其他人来说,每多接受一年教育的经济影响要小得多。黑人美国人平均每多接受一年教育,工资收入就会增加 4394 美元,而其他人平均每多接受一年教育,工资收入就会增加 4422 美元。

图 11-2. 美国 30 岁及以上人群工资对教育的回归,按种族细分,2008 年

图 11-2 中报告的结果令人担忧。首先,黑人和其他人平均受教育程度本来就低于白人和亚裔。然后,即使黑人和其他人确实接受了高等教育,他们从高等教育中获得的收益(就工资而言)也比白人或亚裔少。例如,图 11-2 中报告的结果表明,四年制大学学位使 30 岁及以上成人的白人收入增加了 5393 x 4 = 21572 美元,而同一大学学位使黑人收入仅增加了 4394 x 4 = 17576 美元。这是一个很大的差距。另一方面,我们无法确定图 11-2 中报告的种族差异是否具有统计学意义。所有系数与零显著不同,但这并不意味着它们彼此之间也显著不同。可能是白人模型(5393)和黑人模型(4394)中教育系数之间的差异只是由于 SIPP 数据中的随机误差造成的。看起来它们很明显地不同,但理想情况下,我们希望确定这种差异在统计学上是否显著。

本章解释了如何设计回归模型来评估回归系数大小的组间差异的显著性。首先,必须构建称为“交互变量”的特殊变量(第 11.1 节)。当这些变量用于回归模型时,它们会揭示与自变量相关的斜率的组间差异。其次,在回归模型中包含交互变量会改变模型的斜率和截距的含义(第 11.2 节)。这些变化最容易使用图形来绘制模型的回归线来理解。第三,包含交互变量的模型可以像所有其他回归模型一样包含其他控制变量(第 11.3 节)。事实上,交互效应通常嵌入到更大的回归模型中。可选部分(第 11.4 节)演示了如何使用方差分析变量计算交互变量,并将其同时应用于多个组。最后,本章以美国和法国教育经济价值差异的应用案例研究结束(第 11.5 节)。这个案例研究说明了自变量的影响如何在不同案例组中存在显著差异。本章的所有关键概念都将在这个案例研究中使用。学完本章后,你应该了解如何评估和解释回归模型中的组间差异。

11.1. 交互变量 金钱能让你自由吗?也就是说,拥有更多金钱能让人们在生活中感受到更大的自由感吗?不出所料,确实如此。在所有有数据可查的国家,人们的个人自由感与收入水平之间都存在正相关关系,尽管在一些国家这种关系在统计上并不显著。在世界价值观调查 (WVS) 中,个人自由的衡量指标是使用问题“你感觉有多自由?”,受访者在一个范围从 1“一点也没有”到 10“非常多”的数字上圈出。各国个人自由的平均水平通常在 1 到 10 的范围内约为 7-8,每个国家最贫穷的人报告的分数比最富裕的人低 1-3 分。显然,收入对人们的自由感很重要,但对所有人的重要程度都一样吗?特别是,收入对男性比对女性(或反之)更重要吗?波兰是收入对自由感影响很大的一个国家。波兰在收入与自由感之间存在世界上最强的相关性之一 (r = 0.239)。图 11-3 的前两列报告了波兰男性和女性收入对自由感的影响的回归模型。收入的衡量标准是将人口分成 10 个等级,从 1(最低收入)到 10(最高收入)。收入每增加一分,波兰男性的自由评分就会上升 0.384 分,而收入相同增加一分,波兰女性的自由评分只上升 0.206 分。在波兰,金钱对男性的重要性大于女性。

图 11-3. 收入如何影响人们的自由感,波兰 2005 年的交互模型

图 11-4 展示了波兰男性和女性的回归线。女性的预期自由值用实线表示,而男性的预期自由值用虚线表示。在低收入水平(图的左侧),女性比男性感觉更自由,而在高收入水平,男性比女性感觉更自由。两条线在收入水平 4 和 5 之间的某个地方交叉。对于中等收入的波兰人,男性和女性报告的个人自由水平大致相同。

图 11-4. 男性与女性预期自由感,根据收入,波兰 2005 年(根据图 11-3)

由于男性的斜率为 0.384,而女性的斜率仅为 0.206 分,因此两个斜率之差为 0.384 - 0.206 = 0.178。收入每增加一分,女性的自由度就会比男性减少 0.178 分。收入对男性的重要性大于女性,但这种差异 (0.178) 在统计学上是否显著?换句话说,真正的差异有可能为零吗?观察到的差异 (0.178) 是否仅仅代表随机误差?毕竟,如果男性和女性的两条线在图 11-4 上纯粹随机绘制,它们不太可能完全匹配。一条线的斜率几乎肯定会比另一条线更陡峭。我们想知道的是,观察到的斜率差异是否可能纯粹是随机产生的。为了回答这个问题,有必要建立一个回归模型,使得其中一个系数代表男性和女性之间斜率的差异。然后,如果该系数与零有显著差异,我们可以得出结论,斜率的差异在统计学上是显著的。在这样的模型中,收入的影响可以与一个人的性别相互作用,从而根据一个人的性别产生不同的收入斜率。这种模型称为交互模型。交互模型是允许一些变量的斜率对于不同的类别组不同的回归模型。交互模型至少包括三个变量:一个感兴趣的独立变量(认为对不同组具有不同斜率的变量)一个方差分析变量(可以是任何 0/1 变量)一个交互变量(等于感兴趣的独立变量乘以方差分析变量)交互变量是交互模型的核心。交互变量是通过将方差分析变量乘以感兴趣的独立变量来创建的变量。在波兰自由度模型中,交互项是通过将性别(女性为 0,男性为 1)乘以收入(范围从 1 到 10)计算出来的。由于所有女性的性别都是零,所以所有女性的交互变量都是零(任何数乘以零都为零)。由于所有男性的性别都是一,所以所有男性的交互变量都与收入相同(任何数乘以一都等于自身)。具体来说,图 11-3 最后列中报告的波兰自由度交互模型为:Freedom = 5.770 + 0.206 x Income - 0.805 x Gender + 0.178 x Gender x Income对于女性 (gender = 0),这与以下公式相同:Freedom = 5.770 + 0.206 x Income - 0.805 x 0 + 0.178 x 0 x IncomeFreedom = 5.770 + 0.206 x Income - 0 + 0Freedom = 5.770 + 0.206 x Income这与图 11-3 中报告的女性模型相同。交互模型对男性来说稍微复杂一些,但并没有复杂多少。对于男性 (gender = 1),交互模型为:Freedom = 5.770 + 0.206 x Income - 0.805 x 1 + 0.178 x 1 x IncomeFreedom = 5.770 + 0.206 x Income - 0.805 + 0.178 x IncomeFreedom = 5.770 - 0.805 + 0.206 x Income + 0.178 x IncomeFreedom = 4.965 + 0.384 x Income这与图 11-3 中报告的男性模型相同。如果交互模型只是给出了我们一开始的两个相同模型,为什么还要运行交互模型呢?一个原因是,交互模型使用所有数据 (N = 903 个案例) 全部在一个模型中,而不是将数据分成男性和女性模型。另一个更重要的原因是,交互模型告诉我们交互变量的统计显著性。交互变量的系数代表模型中两组之间斜率的差异,在本例中是男性和女性之间的差异。注意,图 11-3 中交互模型中交互变量的系数为 0.178,正好等于男性模型中收入斜率与女性模型中收入斜率之差。交互模型告诉我们,该系数在统计学上是显著的。因此,我们可以得出结论,收入与自由度之间关系的斜率对男性来说明显高于女性。收入对波兰男性的重要性明显高于波兰女性,以促进个人自由的感觉。

11.2. 交互模型中的斜率和截距 在图 11-3 中,男性和女性模型的结果可以从交互模型中计算出来,这并非巧合。交互模型基于与其他模型相同的数据和变量。交互模型与男性和女性的两个独立模型之间唯一的真正区别在于它们的用途。男性模型用于评估收入与男性自由度之间关系的斜率。女性模型用于评估收入与女性自由度之间关系的斜率。交互模型用于评估男性斜率与女性斜率之间的差异。方便的是,交互模型也可以用来找出男性的斜率和女性的斜率,因此最终只需要一个模型。交互模型中报告的收入斜率是参考组的收入斜率。在图 11-3 的交互模型中,参考组是女性 (gender = 0)。女性的收入斜率是交互模型中报告的主要效应。主要效应是交互模型中参考组的感兴趣独立变量的系数。图 11-3 中女性与男性之间的斜率差异为 0.178(男性的斜率比女性的斜率高 0.178 分)。这是图 11-3 中交互变量 (gender x income) 的系数。交互模型中交互变量的系数称为交互效应。交互效应是交互模型中交互变量的系数。当交互效应在统计学上是显著的时,意味着两组之间的斜率存在显著差异。图 11-3 中的交互模型还包括一个变量,即性别。交互模型中性别的系数代表男性回归线的截距与女性回归线的截距之间的差异。这被称为截距效应。截距效应是交互模型中方差分析变量的系数。在男性自由度对收入的回归中,截距为 4.965,这意味着收入为零的男性预计会在 1 到 10 的范围内报告个人自由度为 4.965。在女性自由度对收入的回归中,截距为 5.770,这意味着收入为零的女性预计会在 1 到 10 的范围内报告个人自由度为 5.770。截距效应 (-0.805) 是男性截距与女性截距之间的差异:4.965 - 5.770 = -0.805。在解释交互模型时,我们通常不感兴趣的是截距效应,它们通常会被忽略。但是,必须将方差分析变量包含在模型中(例如图 11-3 中的性别)。如果没有它,交互模型将产生毫无意义的结果。在波兰,我们发现收入在决定个人自由感方面对男性的重要性远大于女性。在其他国家,情况可能有所不同。图 11-5 报告了一组与图 11-3 中估计的模型相同的模型的结果,但这次模型是使用来自澳大利亚的数据估计的。对于澳大利亚男性(男性模型),收入规模每上升一分,与之相关的个人自由感就会上升 0.061 分。对于澳大利亚女性(女性模型),与之相关的上升为 0.143 分,是男性模型的两倍多。对男性和女性来说,收入与自由度之间的关联在统计学上都是显著的,但对女性来说比对男性更加显著。

图 11-5. 收入如何影响人们的自由感,澳大利亚 2005 年的交互模型

图 11-5 中报告的第三个模型是交互模型。该模型包括感兴趣的自变量(收入)、一个分类方差分析变量(性别)和一个交互变量(性别 x 收入)。在交互模型中,收入的主效应为 0.143,与女性模型中收入的系数相同。该主效应表示收入增加一个单位对女性预期个人自由感的影响。交互效应为 -0.083。这是男性和女性在收入与自由关系中的斜率之差:0.061 - 0.143 = -0.083。交互效应在统计上显著,表明男性的斜率明显小于女性的斜率。图 11-5 中报告的截距效应为 0.393,但这没有任何特别的理论意义。图 11-5 中报告的统计结果在图 11-6 中以图形形式表示。交互模型的结果可能难以可视化,但将它们绘制出来通常会使它们非常清晰。图 11-6 显示,收入与自由之间的关系对澳大利亚男性来说比对澳大利亚女性来说弱。两条线都随着收入的增加而上升,但女性的线上升得更快。贫困女性的个人自由感比贫困男性低,但富裕女性的个人自由感比富裕男性高。

图 11-6. 男性和女性的自由感预期值,取决于收入,澳大利亚 2005 年(根据图 11-5)

交互效应并不总是显著的。事实上,可能很难找到显著的交互效应。例如,在美国,收入重要性方面的性别差异在统计上并不显著。图 11-7 报告了美国自由与收入回归的结果。男性和女性的斜率都高度显著,但检查斜率差异的交互效应则不显著。

图 11-7. 收入对人们自由感的影响的交互模型,美国 2006 年

图 11-8 以图形方式表示美国的结果。两条回归线(女性和男性)几乎平行。该图表似乎显示了截距效应(女性的线高于男性的线),但模型结果表明,这种差异也不显著,尽管在任何情况下它都没有理论意义。在美国,富人比穷人感觉更自由,但没有证据表明女性和男性之间在收入对自由重要性方面存在差异。对于女性和男性来说,更高的收入都让美国人感觉更自由,程度相同。

图 11-8. 男性和女性的自由感预期值,取决于收入,美国 2006 年(根据图 11-7)

11.3. 混合模型中包含控制变量的交互效应 图 11-2 中报告的结果表明,对于白人来说,每多一年的教育都会提高工资,而对于亚裔、黑人和其他人来说,工资提高的幅度则较小。如果教育对不同种族的人的工资有不同的影响,那么它对不同性别的人的工资也会有不同的影响吗?图 10-8 显示,对于二十多岁的美国人来说,每多一年的教育都会导致预期工资增加 3000 美元以上。图 10-8 的主要结果在图 11-9 的模型 1 中重新打印。图 11-9 使用相同 2008 年 SIPP 第二波数据,将工资收入回归到许多预测因子,包括性别(对男性编码为 0,对女性编码为 1)。图 11-9 的模型 1 显示,二十多岁的美国女性平均比二十多岁的美国男性少挣 6591 美元(在控制年龄、种族、西班牙裔身份和教育之后)。

图 11-9. 解释美国二十多岁人群工资性别差距的混合交互模型,2008 年(N=7919;根据图 10-8)

图 11-9 的模型 2 引入了一个交互变量,Education x Female。在这个新模型中,教育的主效应现在是 3114,表明对于男性(Female = 0),每多一年的教育都会使预期工资增加 3114 美元。交互变量(Education x Female)的系数为 312,表明对于每多一年的教育,女性预计会比男性多获得 312 美元。由于男性每年的教育(平均)会获得 3114 美元,这意味着女性(平均)会获得 3114 + 312 = 3326 美元的工资。312 的正交互效应意味着教育实际上对女性的帮助比对男性的帮助更大。这表明教育可能有助于缩小工资性别差距。另一方面,模型 2 中的交互效应在统计上并不显著。这意味着正面结果可能是随机发生的。在模型 2 中,截距效应(变量 Female 的系数)为 -10857。与模型 1 不同,该系数不能直接说明女性和男性之间工资差异的任何情况。交互模型中的截距效应对于解释结果而言意义不大(尽管它必须包含在模型中)。为了对女性和男性之间工资的总体差异做出结论,您需要查看模型 1 中 Female 的系数,该模型不包含任何交互效应。由于教育和性别之间的交互不显著,图 11-9 中的模型 3 检查了另一个交互变量:性别和年龄之间的交互(Age x Female)。这种交互非常显著。随着女性年龄的增长,她们的收入远远落后于男性。模型 3 中年龄的主效应(2430)表明,美国男性预计在他们二十多岁的整个过程中每年都会多挣 2430 美元。年龄的交互效应(Age x Female)为 -786,这意味着女性的收入比男性每老一岁少增加 786 美元。换句话说,虽然男性的预期工资每年增长 2430 美元,但女性的预期工资每年增长 2430 - 786 = 1644 美元。这是一个巨大且在统计上显著的差异(概率 <.001)。老龄化对男性的回报远高于女性。没有理由不能将这两个交互变量都包含在同一个模型中。这是在模型 4 中完成的。在模型 4 中,两个交互效应都显著,但年龄的交互效应更为显著。在模型 5 中,额外的控制变量与交互变量一起包含。即使在控制了婚姻、子女、全职工作状态、上学状态和就业行业之后,年龄的交互效应仍然高度显著。另一方面,教育的交互效应减少到一个非常小且不显著的数字(每年不到 100 美元)。模型 5 中报告的结果表明,额外的教育不会对美国女性和男性之间的工资性别差距产生太大影响。相反,这种差距往往随着男性和女性的年龄增长而不断扩大,至少在他们二十多岁的过程中是这样。正如图 11-9 所示,交互效应可用于包含其他数值和分类自变量的混合模型。甚至可以在单个模型中估计多个交互效应。这些模型的解释与普通回归和交互模型的解释没有什么不同。任何包含数值和方差分析变量的模型都可以包含一个或多个交互。

11.4. 多个分类交互(可选/高级) 如果回归模型可以包含多个针对同一个方差分析变量的交互(图 11-9 中的教育和年龄按性别),那么可以推断,回归模型可以包含多个方差分析变量的相同交互。图 11-2 显示,教育对工资的预期影响对于不同种族的美国人来说是不同的。影响范围从 30 岁及以上的美国黑人每年的额外工资 4394 美元到白人每年的额外工资 5993 美元。图 11-10 显示了如何使用交互模型来检查这些种族间差异的统计显著性。图 11-10 的模型 1 包括三个用于种族的方差分析变量(白人是参考组)、感兴趣的自变量(教育)以及三个用于种族 x 教育的交互变量。

图 11-10. 30 岁及以上的美国人的工资对教育的回归,包含按种族划分的交互,2008 年(N=53,402;根据图 11-2)

模型 1 中教育的主效应为 5393,证实了每多一年的教育与 30 岁及以上的美国白人年收入增加 5393 美元相关。三个交互效应都是负数,证实了对于所有其他种族来说,教育提高工资的幅度都低于白人。对于亚裔来说,交互效应很小,在统计上并不显著:教育以与白人大致相同的速率提高了亚裔的工资。虽然每多一年的教育对白人的影响是 5393 美元,但对亚裔来说,影响是 5393 - 96 = 5297 美元(此结果与图 11-2 中报告的结果之间的差异是由于四舍五入)。对于黑人和其他人来说,交互效应是负数且在统计上显著(在黑人的情况下,高度显著)。这意味着每多一年的教育对工资的影响对于黑人和其他人来说明显低于白人。模型 1 的一个缺点是(与任何方差分析模型一样),所有组差异都是相对于参考组(在本例中为白人)进行检查的。因此,例如,模型 1 告诉我们其他人斜率与白人斜率是否显著不同(确实不同),但它没有告诉我们其他人斜率与黑人斜率是否显著不同。为了找到黑人和另外三个种族之间斜率差异的统计显著性,必须估计一个新模型,该模型使用黑人作为参考组。这是在模型 2 中完成的,在该模型中,相同的变量被组织起来,以便突出显示从黑人(而不是白人)作为参考组考虑的差异的显著性。由于模型 2 包含与模型 1 相同的信息,因此 R2 不会从模型 1 更改,但系数(及其显著性水平)会更改。在图 11-10 的模型 2 中,教育的主效应现在是 4394,这与黑人是现在的参考组这一事实一致,并且每多一年的教育与 30 岁及以上的美国黑人预期年收入增加 4394 美元相关。白人交互的系数为 999,表明白人预计每多一年的教育会多挣 4394 + 999 = 5395 美元,与模型 1 中的情况相同。模型 2 告诉我们模型 1 没有告诉我们的信息是,其他人与黑人之间的教育影响差异(每年 28 美元)在统计上并不显著。它还告诉我们,亚裔与黑人之间教育回报的差异(每年 904 美元)在统计上显著。模型 1 和模型 2 表示相同的信息,但通过使用不同的参考组,它们允许检查不同种族差异的显著性。根据所有四个种族的教育水平绘制了工资的预期值,如图 11-11 所示。这个图表中绘制的值可以从这两个回归模型中的任何一个(或从图 11-2 中报告的模型)计算得出。注意白人的斜率如何比其他三个种族的斜率更陡。在高中辍学者中,白人预计将比其他人多挣一点,但在具有研究生教育的人中,白人预计将与亚裔几乎一样多。一方面是亚裔和白人之间的斜率差异,另一方面是黑人和其他人之间的斜率差异,这意味着美国工资中的种族不平等随着教育水平的提高而加剧。社会中教育水平的提高不太可能使美国社会更加平等。恰恰相反:它们似乎更有可能使现有的种族不平等更加严重。

图 11-11. 2008 年美国 30 岁及以上人群不同种族工资预期值,按受教育程度分类(根据图 11-10 改编)

11.5. 案例研究:民主评分的跨国比较 在第 5 章中,我们认为台湾的老人可能对台湾民主质量的评分更高,因为他们经历过 1991 年之前的独裁统治时期。这可以被称为民主评分的“独裁理论”。第 5 章建议,在民主时代成长起来的年轻人可能要求更高,因此可能对台湾的民主满意度低于老人。回归模型证实了这一推理。发现台湾人民对其政府民主质量的评分随年龄增长而上升。台湾人民对台湾民主的评分随年龄增长而上升这一事实,似乎支持了独裁理论,但不能证明该理论。另一种理论,“青年理论”,可能是指世界各地的年轻人对民主的要求更高,而老年人对民主的要求更低。要阐明这两种理论的相对优劣,一种方法是将台湾的年龄与民主评分之间的关系与另一个国家的相关关系进行比较。为此,我们选择了美国作为参考国家,因为美国从未经历过独裁统治时期。作为提醒,人们对民主的评分采用 0 到 100 的等级,其中:评分 = 0 表示受访者认为他们国家民主程度不够评分 = 50 表示受访者认为他们国家民主程度恰到好处评分 = 100 表示受访者认为他们国家民主程度过高台湾和美国的平均民主评分(所有年龄段)分别为 38.7 和 37.2。图 11-12 显示了美国和台湾的年龄与民主评分之间关系的回归模型。台湾模型与图 5-7 中报告的模型相同,只是现在除了系数之外,我们还有显著性水平和 R2 可供使用。实际上,民主评分随年龄的增长非常显著。另一方面,美国模型显示,在美国,民主评分随年龄的增长而下降。美国随年龄的下降甚至比台湾随年龄的上升更强。这似乎支持了独裁理论,而不是青年理论的民主评分。

图 11-12. 2006 年美国和台湾年龄如何影响人们对民主评分的交互模型

图 11-12 的最后一列报告了年龄与民主评分之间关系斜率差异的正式交互模型。该模型包括感兴趣的自变量(年龄)、区分两组的方差分析变量(国家)和交互变量(国家 x 年龄)。交互模型中年龄的主要效应为 -0.117,这是年龄对美国民主评分的影响。年龄的交互效应为 0.222,表明台湾年龄的系数比美国年龄的系数高 0.222 个点。年龄与民主评分之间关系斜率的这种差异非常显著(概率 < .001)。截距效应 (-8.680) 在此模型中没有理论意义,尽管它在计算预期值时使用。台湾和美国不同年龄人群的民主评分预期值绘制在图 11-13 中。显然,台湾的民主评分随年龄增长而上升,而美国的民主评分随年龄增长而下降。这倾向于证实独裁理论,即台湾老年人可能对台湾的民主评价较低,因为他们没有亲身经历过独裁统治下的生活。无论台湾和美国之间的差异是由于这个原因还是其他原因,很明显,年龄与民主评分之间的关系在两国是不同的。国家与年龄对人们民主评分的影响之间存在显著的交互作用。

图 11-13. 2006 年台湾和美国民主评分预期值,按年龄分类(根据图 11-12 改编)

第 11 章 关键术语

[编辑 | 编辑源代码]
  • 交互效应交互模型中交互变量的系数
  • 交互模型允许某些变量的斜率在不同的分类组中不同的回归模型
  • 交互变量通过将方差分析变量乘以感兴趣的自变量而创建的变量
  • 截距效应交互模型中方差分析变量的系数
  • 主要效应交互模型中参考组感兴趣的自变量的系数

第 10 章 · 关键术语


华夏公益教科书