跳转到内容

社会统计学,第 9 章:回归模型设计

来自维基教科书,开放的书籍,开放的世界

回归模型设计

[编辑 | 编辑源代码]

许多人担心现代社会正在让人变得疏远。疏远意味着人们感到与更广阔的社会脱节。疏远是 19 世纪后期创立该学科的社会学家研究的第一个问题之一,并且至今仍是一个主要问题。疏远的一个主要症状是对社会缺乏信任。在人人都认识彼此的小型封闭社区中,人们有机会在多年的相互交往中发展信任关系。在现代社会中,人们最终成为了商店和餐馆周围的人、他们的邻居,甚至他们大家庭的陌生人。人们仍然有朋友,但他们的朋友分散在广泛的网络中。在村庄社会时代,你很可能嫁给你隔壁的邻居,这个时代早已消失。然而,信任对于现代社会的运作至关重要,尤其是在民主国家。如果人们不信任社会,他们就不会在需要时帮助他们的邻居,也不会签订长期合同(如大学学位课程),也不会参与民主选举。在最基本的层面上,信任社会对于社会正常运作至关重要。没有信任,我们都只能靠自己。世界价值观调查(WVS)在 80 多个国家进行,包括六个关于社会信任的问题。它们是:你有多信任你的家人?你有多信任你邻居的人?你有多信任你认识的人?你有多信任你第一次遇到的人?你有多信任不同宗教的人?你有多信任不同国籍的人?每个问题都可以用四个等级来回答,范围从 0 =“一点也不信任”到 3 =“完全信任”。可以通过将每个受访者对所有六个问题的答案加起来来计算社会整体信任指数。这个指数,“对社会的信任”,然后从可能的最低分数 0(受访者对所有六个问题都回答“一点也不信任”)到 18(受访者对所有六个问题都回答“完全信任”)。当然,大多数人介于两者之间。使用 2006 年世界价值观调查(WVS)英国版的數據,对社会信任的平均水平为 12.5,标准差为 2.4。大多数英国人对社会有很高的信任度。图 9-1 中绘制了英国社会信任的完整分布情况。

图 9-1。英国社会信任度(0-18 量表),2006 年

虽然大多数英国人对社会有很高的信任度,但仍然有很多人不信任。回归模型可以用来帮助我们了解原因。首先,我们可能预期人们在对社会信任水平方面的许多差异将由基本的人口统计因素决定:他们是谁,他们住在哪里以及他们是如何被抚养长大的。这些因素当然应该被包含在任何模型中作为控制变量。由于对社会的信任包括对家庭和对其他宗教人士的信任,我们也可能控制家庭和宗教因素。人们对社会的信任水平也可能部分取决于不同社会地位的人们体验社会方式的差异。对社会地位进行的社会信任回归应该表明社会地位的积极且统计上显著的影响。社会地位高的人应该显示出对社会的信任度更高,因为总的来说,社会对他们很好,而社会地位低的人应该显示出对社会的信任度更低。使用 WVS 数据,选择了十个变量用于研究社会信任方面的差异。其中七个是背景变量,三个是社会地位的替代操作化。这十个变量是:性别——受访者的性别,编码为女性 = 0 和男性 = 1 年龄——受访者的年龄(岁)城市或城镇规模——受访者居住城市的规模,范围从 1 = 少于 2000 人到 8 = 超过 800,000 人 婚姻状况——受访者是否已婚(已婚 = 1)父母状况——受访者是否为父母(是 = 1)宗教信仰——在 1 =“宗教在我的生活中一点也不重要”到 10 =“宗教在我的生活中非常重要”的十点量表上编码 种族——白人(1)与非白人(0) 教育程度——受访者的受教育年限 收入——受访者的收入十分位数(最低十分之一,第二十分之一,第三十分之一,等等) 监管职位——受访者在工作中监督他人(是 = 1)图 9-2 中报告了一系列回归模型的结果,这些模型使用这十个自变量来预测社会信任。图 9-2 中的第一列报告了每个变量与社会信任的相关性。其余列报告了回归结果。所有系数都是标准化的,因此可以比较三个不同社会地位指标的影响。教育、收入和监管职位的原始非标准化变量都是以不同的量表测量的,因此它们的非标准化系数将无法直接比较。每个系数的显著性水平都用相应的符号标记,每个模型的 R2 都报告在每列的底部。R2 分数表明,这些模型解释了英国社会信任中总变异量的 5.5% 到 9.3%。

图 9-2。英国 2007 年社会信任的标准化回归模型 (N=567)

模型 1 将所有背景因素一起包含在一个单一的回归模型中。有趣的是,婚姻和育儿似乎相互补充。婚姻状况和父母状况都没有与社会信任显着相关,但在回归模型中,当控制其他因素时,这两个变量都具有显著性。模型 2 也包括所有背景因素,但增加了教育程度,它与社会信任高度显着相关。在模型 3 中,发现收入与社会信任高度显着相关,但在模型 4 中,在工作中担任监管职位的效应并不显著。在最后的模型,模型 5 中,唯一具有高度显著系数的社会地位变量是教育程度。所有三个社会地位变量的系数在模型 5 中都小于其他模型中的系数这一事实表明,这三个变量在解释社会信任方面相互竞争。这是可以预期的,因为它们都是对同一概念进行操作化的不同方式。受教育程度高的人往往收入高,并监督他人工作,而受教育程度低的人往往收入低,不监督他人工作。由于模型 5 中教育的(标准化)系数远大于收入和监管职位的(标准化)系数,我们可以得出结论,教育是三种社会地位决定因素中对社会信任影响最大的因素。哪五个模型中最适合解释社会地位如何影响社会信任?这取决于研究人员想要了解社会地位影响的具体内容。所有模型都添加了可能会有用的信息。使用所有五个模型可以比单独使用任何一个模型更全面地了解社会信任的决定因素。

本章更详细地探讨了如何在多元回归模型中选择自变量。首先,在分析中不是特别具有理论意义的背景控制变量通常在一个初始基础模型中被归并在一起(第 9.1 节)。选择包含在基础模型中的变量取决于所使用的案例类型:个人、整个国家,或者介于两者之间。其次,回归分析中变量的适当选择和布局取决于模型结果将用于的目的(第 9.2 节)。主要区别在于模型是用于预测还是用于解释。第三,竞争控制和补充控制的概念可以帮助理解在模型中包含控制变量的许多原因中的一些(第 9.3 节)。突出了六个原因,但还可能存在其他原因。可选部分(第 9.4 节)侧重于当单个模型包含两个或多个对同一概念进行操作化的变量时可能出现的​​问题。最后,本章以美国工资差距的应用案例研究结束(第 9.5 节)。本案例研究说明了如何设计回归模型以帮助阐明社会政策中的重要主题。本章的所有关键概念都将在本案例研究中使用。在学完本章后,你应该对如何在回归模型中选择自变量以及如何使用自变量有更深刻的理解。

9.1。基础模型 与本书中迄今为止使用的模型相比,如图 8-16 和 9-2 中报告的模型具有大量的自变量。大多数社会科学家使用的回归模型包括许多自变量,从 6 或 8 个到有时 20 个甚至更多。当模型包含如此多的变量时,有必要用某种方法来组织它们。一个好的起点是基础模型。基础模型是初始模型,它包括分析中所有不是回归分析的特定理论兴趣的背景自变量。例如,在研究社会地位与社会信任之间的关系时,诸如性别、年龄、城镇规模以及图 9-2 中模型 1 中包含的所有其他变量之类的变量不是特定的理论兴趣。它们仅被包含在其中是为了控制研究中人员的背景。模型 1 将被认为是图 9.2 的基础模型。通常在不同类型数据的基础模型中使用哪种类型的变量,如表 9-3 所示。要包含在基础模型中的变量通常仅仅取决于哪些数据可用。对于案例是单个人的数据库,通常可以使用许多不同的变量。当您向上移动链条到越来越大的单元时,可用数据越来越少,因此包含的基础模型变量也越来越少。对于比较国家之间的模型,几乎总是包含的一个变量是人均国民收入。在回归分析中包含国民收入有助于调整这一事实,即像美国和日本这样的富裕国家在几乎所有方面都不同于柬埔寨和海地这样的贫穷国家。如果使用跨国数据的​​研究人员没有控制国民收入,那些不同意研究人员观点的人几乎肯定会将此作为对研究人员回归模型的主要批评。

图 9-3。使用不同类型案例的回归分析的典型基础模型变量

基础模型的主要目的是使案例在比较时等效。在图 9.2 的基础数据中,受访者的年龄在 16 到 89 岁之间。有些人是世世代代的英国人,而有些人则是最近从牙买加或巴基斯坦移民而来。当然,有些是男性,有些是女性。他们是一个极其多样化的人群,有着截然不同的社会经历。控制这些背景因素可以让我们进行同类比较。由于年龄被纳入分析中的控制变量,我们可以对模型 2 做出以下陈述:在年龄保持不变的情况下,教育与社会信任之间的关系是显著的。对于任何给定的年龄,教育对社会信任都有显著的影响。调整年龄后的教育与社会信任之间的关系是显著的。教育与社会信任之间的关系在剔除年龄后仍然是显著的。这些都是用不同方式表达我们已经控制了年龄的事实。从数学角度来说,年龄差异导致的信任水平差异的一部分归因于年龄,而另一部分则归因于教育(以及其他变量)。基础模型的一个重要功能是控制可能与分析中感兴趣的解释变量混淆的基本背景变量。混淆变量是指可能影响因变量和感兴趣的自变量的变量。例如,年龄会影响社会信任(在图 9.2 中,10 个变量中,r = 0.162 的相关性最强),但也会影响社会地位。你的受教育程度随着年龄的增长而提高,但就整个社会而言,老年人的受教育程度较低,因为过去人们在学校学习的时间比现在少。事实证明,在图 9-2 中使用的 567 名英国世界价值观调查受访者中,年龄与教育之间的相关性为 r = -0.218。由于老年人的受教育程度较低,对社会的信任度较高,因此年龄是教育与信任关系分析中的混淆变量。如果回归分析通常从基础模型开始,则通常以饱和模型结束。饱和模型是最终模型,它包含分析中一系列模型中使用的所有变量。图 9-2 中的模型 5 是饱和模型的一个例子。饱和模型有时难以解释,因为使用了大量的变量,但它们几乎总是为了完整性而包含。

9.2. 解释性模型与预测性模型 在基础模型和饱和模型之间,没有关于回归模型中应该包含哪些变量或以何种顺序包含的硬性规定。一种常见的做法是按照图 9-2 中的做法:从基础模型开始,然后在单独的模型中一次添加一个感兴趣的自变量,然后报告一个所有自变量同时使用的饱和模型。当模型旨在评估不同解释因变量的相对强度时,自变量必须在单独的模型中一次输入一个。这使得比较它们各自解释因变量的效果成为可能。解释性模型是回归模型,其主要目的是用于评估不同理论,以解释案例在因变量值方面的差异。另一方面,有时回归分析的目标仅仅是预测因变量的值,而对模型的理论意义不感兴趣。预测性模型是回归模型,其主要目的是用于对因变量作为结果进行预测。例如,在图 3-9 中,一个非常简单的预测模型被用来预测美国阿拉斯加州和夏威夷州的软饮料消费量。在预测模型中,了解变量系数在模型之间如何变化或控制潜在的混淆变量并不那么重要。真正重要的是获得高 R2 分数,因为 R2 表示模型解释因变量总变异性的比例。一般来说,R2 分数越高的模型对因变量的预测越准确。图 9-4 列出了解释性模型和预测性模型之间的一些关键差异。一个主要的区别是选择包含在每个模型类型中的自变量的方式。解释性模型的主要目标是推断不同自变量对因变量的影响。自变量是根据特定的理论原因仔细选择包含的,而不重要的或无关的变量永远不会被包含。将自变量的数量保持在最小限度也有助于更好地理解每个自变量在解释因变量中所起的作用。换句话说,解释性模型重视简约性。简约性是在使用简单易懂的模型方面的优点。一个好的解释性模型是能够阐明具有理论意义的关系的模型。相比之下,预测性模型通常采取更加自由放任的“百无禁忌”的做法。只要自变量与因变量相关,它们就能帮助做出预测。一个奇怪的例子是在所谓的“厕所冲水模型”中使用污水处理流量来预测酒店入住率。在海滨度假区,城市管理者想知道在主要的假日周末有多少游客,但没有一个单一的数据库包含了所有在城市酒店、私人出租房或拜访朋友和亲戚的人员名单。相反,城市管理者使用周末通过污水处理厂的污水量来估计一定数量的人员必须在城市中。从理论上来说,污水不会导致人们访问城市,但污水是实际访问人数的很好预测指标。

图 9-4. 用于预测的模型与用于解释的模型

9.3. 在解释性模型中控制的原因 在设计回归模型时,一个主要的挑战是决定要控制哪些因素。在预测模型中,决定很简单:如果一个变量可用,并且它有助于预测因变量,就使用它。在解释性模型中,决定要困难得多。在解释性模型中,使用控制变量至少有六个原因,但也有其他可能的原因。它们是: A. 消除替代解释 B. 比较不同解释的力量 C. 保持竞争解释不变 D. 使案例在比较时等效 E. 减少模型误差 F. 突出因误差而隐藏的影响 前三个原因 (A-C) 主要适用于控制变量倾向于在解释因变量方面与其他自变量竞争的情况。在这种情况下,使用控制变量往往会降低其他自变量的影响大小和统计显著性。最后三个原因 (D-F) 主要适用于控制变量倾向于补充其他自变量的情况。在这种情况下,使用控制变量实际上可以增加其他自变量的影响大小和显著性。图 9-5 总结了这六个原因以及在使用它们的各种情况下的解释。

图 9-5. 使用竞争控制和补充控制的六个常见原因

使用控制变量的所有六个原因都可以通过一系列回归模型来说明,这些模型旨在阐明为什么有些国家在给儿童接种常见的感染疫苗方面比其他国家更成功。虽然在使用方面存在一些争议,但联合白喉-百日咳-破伤风 (DPT) 疫苗在世界范围内被广泛用于为 12 到 23 个月大的婴儿接种三种潜在的致命儿童疾病的疫苗。世界卫生组织和大多数国家卫生当局都有正式的 DPT 免疫计划。尽管如此,DPT 免疫率在一些非洲最贫困国家低于 40%,而在中东和东欧许多中等收入国家则超过 98%。在富裕国家,DPT 免疫率不是一个主要的政策问题,原因有两个:一是免疫率通常超过 90%,二是这三种疾病——白喉、百日咳和破伤风——在医疗系统良好的国家通常不会危及生命。另一方面,在贫困国家,DPT 免疫对于幼童来说可能是生死攸关的事情。从政策角度来看,我们希望了解为什么一些国家的 DPT 免疫计划比其他国家更成功,尤其是在贫困国家。可能有几种解释。首先,在许多富裕国家,由于家长担心疫苗的安全性,以及这些疾病现在已经很少见,以至于大多数人不再害怕它们,因此 DPT 免疫率远低于其潜力。家长对疫苗的恐惧难以衡量,但(除了一些例外)在大多数贫困国家似乎不是一个主要因素。研究家长对疫苗的恐惧在不同国家的影响是有益的,但数据不可用。其他解释包括国家的经济发展水平、接触需要免疫的婴儿的难易程度、国家在健康方面的支出、国家可以进行免疫的训练有素的医务人员数量以及需要免疫的儿童数量。可能用于具体化每个解释的特定变量是: 经济发展水平 国民收入——人均国民收入(以千美元计) 改善水质——拥有“改善”供水的人口比例(例如,一口井) 改善卫生条件——拥有“改善”卫生设施的人口比例(例如,一个户外厕所) 易于接触 城市化——城市人口(占总人口的百分比) 卫生支出 医疗支出——国家医疗支出占国民收入的百分比 训练有素的人员 医生——每千人拥有的医生数量 儿童数量 生育率——妇女平均一生生育的子女数量 可以包括其他变量,但 DPT 免疫率和所有这七个解释性变量的数据都可以在世界发展指标中获得,这些数据来自 100 个国家,这些国家代表了世界贫困人口的 85% 以上。从社会政策的角度来看,我们特别想知道可以采取哪些措施来提高免疫率。我们不能轻易使一个国家变得更富裕或更发达,我们也不能做太多事情来使儿童更容易接触或减少儿童数量。另一方面,我们可以向各国提供外国援助,帮助他们增加在医疗保健方面的支出。我们还可以寻求志愿医生帮助进行免疫接种。因此,一个重要的政策问题是:提供资金还是寻找志愿者更有用?图 9-6 中针对 DPT 免疫的一系列回归模型有助于回答这个问题。它们还说明了使用控制变量的六个原因。每个原因的字母都已附加到回归表中的相应说明中。

图 9-6. 2000 年代贫困国家 DPT 免疫率的标准化回归模型(N=100)

从模型左侧移动到右侧,将人均国民收入作为自变量(模型 1)的加入是一个控制变量的例子,它使案例在比较时等效(D)。分析中包含的 100 个国家在财富水平上差异巨大。控制人均国民收入有助于调整这些差异,以便我们可以进行类似比较。包含对改善用水和改善卫生设施的控制(模型 2)是对使用控制变量来减少模型误差(E)的示例。注意 R2 得分如何从模型 1 的 15.5% 跃升到模型 2 的 46.0%。差异(30.5%)意味着在模型 2 中添加的两个变量共同解释了免疫接种率总变异的近三分之一。水和卫生设施并不是免疫接种率的直接原因——你不需要厕所就能进行免疫接种——但它们是更发达国家的一般属性。城市化(模型 3)的加入控制了潜在的竞争性解释(C)。尽管与 DPT 免疫接种显着相关,但在控制人均国民收入、水和卫生设施后,城市化的系数在回归模型中并不显着。这不是问题。城市化并不是因为它的重要性而被包含在内。之所以包含它,是因为它可能会与我们感兴趣的两个变量——医疗支出和医生数量——竞争。在模型 4 和模型 5(B)中比较了医疗支出的系数和医生数量。尽管医生数量的影响更大,但医疗支出的影响在统计学上是显著的,而医生数量的影响则不然。这是一个矛盾的结果,其原因尚不清楚。我们可以尝试通过将医疗支出和医生都包含在一个模型中来消除一个或另一个理论,看看在控制另一个变量时,一个或另一个是否变得明显不重要(A)。这在模型 6 中完成。不幸的是,在模型 6 中,两个系数几乎相同,而且都没有很强的显著性。医疗支出和医生的系数的奇怪和模棱两可的行为可能是由于某些其他因素掩盖了每个因素的真实影响。一个可能揭示这些真实影响的控制变量是生育率(F)。生育率高的国家与成年人相比,儿童数量众多。这对他们的医疗系统造成了巨大的负担,因为儿童往往比成年人需要更多的医疗保健。当然,这对免疫接种计划造成了特别的负担,因为接受 DPT 疫苗的是儿童。相同数量的医疗支出或相同数量的人均医生,在生育率高的国家比在生育率低的国家影响要小得多。控制生育率(模型 7)会增加医疗支出的系数,使其在统计学上具有明显的显著性。另一方面,它会大幅降低医生的系数。从模型 7 看,很明显,在控制其他补充和竞争因素后,更高的医疗支出对于促进免疫接种比拥有更多医生更重要。根据图 9-6 中报告的结果,最佳政策是富裕国家增加对贫困国家的援助,而不是招募志愿医生。如果在保持医生数量(和其他因素)不变的情况下增加支出,我们预计免疫接种率会上升。如果在保持支出(和其他因素)不变的情况下增加医生数量,我们预计免疫接种率不会出现明显变化。

9.4. 部分化和部分化谬误(可选/高级)在图 9.2 的模型 5 中,社会地位的三个不同操作化(教育、收入和监督地位)在同一模型中被用于解释对社会的信任。在这个模型中,事实证明,即使在控制收入和监督地位后,教育也与信任显着相关,而收入的系数只有边际显著,监督地位的系数根本不显著。监督职位与信任从未密切相关,但在模型 3 中,收入与对社会的信任非常显着相关。事实上,模型 3 中收入的系数的概率小于 0.01,表明这种强关系完全随机产生的可能性小于 1/100。为什么收入的系数在模型 3 中非常显著,但在模型 5 中却小得多,而且只有边际显著?答案当然是因为教育和收入是竞争性的控制因素。与收入的系数一样,教育的系数在模型 5 中也有所下降,只是没有下降那么多。它可能下降更多吗?由于所有三个变量都衡量社会地位,我们可能预期它们都没有显著系数。毕竟,通过在同一模型中包含社会地位的三个操作化,我们实际上是在衡量社会地位的影响,同时控制社会地位,然后再次控制社会地位。我们可能合理地预期这三个变量会在解释对社会的信任方面更充分地相互竞争。我们可能预期,在以一种方式控制社会地位后,其他社会地位指标对社会信任不会产生额外的影响。这在图 9-2 中没有发生,但它在回归建模中经常发生。当同一概念的两个或多个操作化被包含在回归模型中,并且它们相互竞争以至于它们的系数最终变得不显著时,它们被称为“部分化”彼此。部分化是变量之间的一种特定形式的竞争,其中两个(或更多)变量是同一概念的替代操作化。部分化的一个例子如图 9-7 所示。图 9-7 报告了一系列关于 37 个美国大县(人口在 500,000 到 1,000,000 人之间)的县谋杀率的回归模型,这些模型基于县收入的两种操作化。县谋杀率(每 100,000 人口)来自 FBI 统一犯罪报告数据库。县收入以两种方式操作化。县贫困率是每个县中生活在联邦贫困线以下收入的人口百分比。县中位收入是每个县平均人的收入。县贫困率和中位收入来自美国人口普查局。县贫困率和县中位收入的相关系数为 r = -0.780。随着收入的增加,贫困率下降。

图 9-7. 2008 年人口在 500,000 到 1,000,000 人之间的美国县的谋杀率对贫困和收入的回归(N=37)

正如预期的那样,贫困率较高的县也往往有较高的谋杀率(模型 1)。贫困率每增加 1%,每 100,000 人口被谋杀的人数就会增加 0.082 人。这不算多,但在统计学上是显著的(概率 = 0.021,小于 5%)。同样符合预期的是,中位收入较高的县往往有较低的谋杀率(模型 2)。中位收入每增加 1000 美元,每 100,000 人口被谋杀的人数就会减少 0.031 人。同样,这种关系很小,但(正好)在统计学上是显著的(概率 - 0.050,或 5%)。然而,在模型 3 中,贫困和收入都与谋杀率没有显著相关性。两个变量的系数都不显著。一位只看模型 3,而没有运行像模型 1 和模型 2 那样单独考察每个变量影响的模型的研究人员可能会得出结论,贫困和收入都与谋杀率没有显著相关性。这种错误被称为“部分化谬误”。部分化谬误是指一个错误的结论,即自变量与因变量无关,而实际上它们是相关的。部分化谬误标签只适用于那些部分化彼此的变量旨在操作化同一概念的情况。至少有三种方法可以避免部分化谬误。最简单的方法是只选择概念的一个操作化,忽略任何其他操作化。更好的方法是将概念的多个操作化合并成一个单一变量。在最复杂的层面上,概念的多个操作化可以一起用在一个模型中,并通过它们对模型 R2 得分的集体影响来研究它们共同解释因变量的能力。注意模型 3 中的 R2 得分略高于模型 1 中的 R2 得分(0.146 对 0.144)。这表明贫困和收入共同解释了城市间谋杀率变异的比例略高于单独的贫困。R2 得分的联合分析的优点是,它允许研究人员使用所有可用的数据及其所有复杂性。另一方面,复杂性也是其主要缺点。有时联合分析会增加价值,但大多数时候保持简单更有意义。模型 1 解释了几乎与模型 3 相同的谋杀率变异性,而没有管理多个变量的干扰。研究基于城市贫困水平的城市谋杀率,而不必担心中位收入,这将是一个合理的折衷方案。

9.5. 案例研究:美国工资中的性别差距在所有曾经被研究过的国家中,妇女的工资都明显低于男性。这并不一定意味着雇主歧视妇女,但证据表明他们确实如此。然而,并非所有年龄差距都是由于歧视造成的。关于性别差距的两个竞争性解释是,妇女接受工资较低的职位是为了在家庭生活中获得更大的灵活性,以及妇女的工资较低是因为她们的工作时间较少。在第 10 章中,还将研究其他潜在的竞争性解释。控制变量可以用来帮助我们评估这些竞争性解释的有效性。原始性别差距在图 4-6 中有所体现,图 7-8 中介绍了性别差距的原始回归模型,但图 9-8 中介绍了一系列更详细的性别与工资之间关系的解释模型。使用解释模型而不是预测模型是因为分析的目标是了解一般意义上的性别差距,而不是预测任何特定妇女的工资。与前几章一样,分析仅限于自认为是非洲裔美国人或白人的美国二十多岁的人。使用了 2008 年收入和计划参与调查(SIPP)第一波数据。在图 9-8 中,个体工资在一系列四个回归模型中回归到 8 个自变量(包括性别)上。

图 9-8. 解释 2008 年美国二十多岁工资中的性别差距的模型(N=6796)

模型 1 是一个基础模型,包含四个背景变量:受访者的年龄、种族、西班牙裔身份和受教育年限。不出所料,人们在年龄较大、白人而非黑人、非西班牙裔和受教育程度更高时收入更高。在模型 2 中,-7230 的系数表明,平均而言,二十多岁的女性比二十多岁的男性每年少赚 7230 美元,即使在控制了年龄、种族、西班牙裔身份和受教育年限之后。模型 3 添加了两个家庭变量:婚姻和子女。已婚人士比单身人士收入更高,有子女的人比没有子女的人收入更低。这两个变量消除了模型中的一些误差,但对性别差距的影响微乎其微。女性因家庭责任而收入低于男性,这种可能性可以安全地排除,作为女性收入较低的竞争性解释。最终的饱和模型(模型 4)添加了两个劳动力市场变量:人们是否全职工作以及他们是否在学校学习(这可能意味着他们没有充分发挥自己的潜力)。控制这些竞争性解释确实缩小了性别差距,但仅缩小了 803 美元,从 7149 美元降至 6346 美元。这些竞争性解释都具有高度显著的系数,似乎是工资的重要决定因素,但它们并没有解释女性和男性之间工资差异的大部分。尽管性别差距可能不是由于歧视造成的,但我们可以从图 9-8 中的模型得出结论,它可能不是由家庭因素或劳动力市场因素造成的。顺便说一下,图 9-8 中的任何变量都不可能与性别混淆,因为性别是在受孕时随机决定的,但可能存在其他混淆效应。例如,老年人可能受教育程度更高(因为样本中最年轻的人在研究进行时可能尚未完成学业),并且收入更高,因此教育可能与年龄混淆。如果分析的目的是了解教育与收入之间的关系,这可能是个问题,但这里仅使用年龄和教育,目的是使案例等效以进行比较。同样,婚姻和子女可能会混淆,但这从性别差距的角度来看不是问题。图 9-8 中的模型相当简约。包含的变量很少,并且所有变量都具有统计学意义。一个更完整的二十多岁工资模型可能会控制更多的变量,但仍然不会被认为过于复杂。例如,解释工资性别差距的重要替代解释是,它可能是由于女性选择在哪个行业工作。这将在第 10 章中进一步研究。

第 9 章 关键术语

[编辑 | 编辑源代码]
  • 基础模型包括回归分析中所有非特定理论兴趣的背景自变量的初始模型。
  • 混淆变量可能影响因变量和感兴趣的自变量的变量。
  • 解释模型主要用于评估不同理论,以解释案例在因变量值方面的差异的回归模型。
  • 简约性使用简单易懂的模型的优点
  • 预测模型主要用于预测因变量作为结果的回归模型。
  • 饱和模型包含分析中一系列模型中使用的所有变量的最终模型。

第 8 章 · 第 10 章


华夏公益教科书