标准化系数

我们都知道，当我们开车时，我们的汽车会污染大气。我们可以直观地看到、感觉到、听到和闻到从排气管中排出的污染。当然，汽车并不是唯一污染空气的来源。我们现代社会中所做的一切几乎都会造成空气污染，尤其是二氧化碳（CO2）排放到大气中，导致全球变暖。购物会导致 CO2 排放，因为产品最初要进入商店需要消耗大量能源。发送电子邮件会导致 CO2 排放，因为我们的计算机使用了电力。吃饭会导致 CO2 排放，因为我们的厨房电器使用了电力和天然气。即使睡觉也会导致 CO2 排放，如果我们在卧室使用空调或暖气，听音乐或设置闹钟。这无法避免：仅仅生活在现代社会就会污染空气并加剧全球变暖。在第 3 章中，我们将各国的 CO2 排放量与汽车数量进行回归，建立了一个简单的线性回归模型，用于预测 CO2 排放量。鉴于 CO2 排放来自多个来源，而不仅仅是汽车，多因果模型似乎更合适。理想情况下，CO2 排放的多因果模型将包括各种变量，例如电力使用量、空中、铁路和卡车运输、农业 CO2 排放量以及其他污染源。在多元线性回归模型中包含所有这些变量将有助于建立一个可能非常准确地预测 CO2 排放量的模型，因为所有导致 CO2 排放的因素都将被考虑在内。图 8-1 展示了一个更简单的 CO2 排放多因果模型。使用图 3-1 中的数据，将 51 个国家的人均 CO2 排放量与三个预测因子进行回归：每 1000 人拥有的汽车数量、人均国民收入和西欧国家地位。从理论上讲，更多汽车数量和更高的人均国民收入应与更高水平的 CO2 排放量相关。西欧国家地位应与较低的 CO2 排放量相关，因为西欧国家近年来一直在积极推动气候变化行动。图 8-1 展示了三个模型：一个基于汽车数量的简单线性回归模型（模型 1）、一个添加国民收入的多元线性回归模型（模型 2）以及一个额外添加欧洲国家地位的多元线性回归模型（模型 3）。

从汽车数量作为感兴趣的独立变量的角度来看，国民收入是一个控制变量。模型 1 中与汽车数量相关的斜率为 0.013，但在控制国民收入后，斜率下降至 0.008。这种下降意味着国民收入从汽车数量的角度来看是一个竞争性控制：它与汽车数量竞争，解释关于 CO2 排放量的相同事实。这并不奇怪。毕竟，开车是富裕国家生活中不可或缺的一部分。当国家的人均国民收入水平较高时，他们拥有的汽车也更多。因此，这两个变量在解释一个国家的 CO2 排放量方面存在竞争。为了使国民收入补充汽车数量，它必须解释一个国家其他可能掩盖汽车数量与 CO2 排放量之间真实关系的事实。补充汽车数量和国民收入的是欧洲国家地位。欧洲国家地位有助于揭示汽车数量与 CO2 排放量之间以及国民收入与 CO2 排放量之间的真实关系，因为欧洲国家的 CO2 排放量与其汽车数量和国民收入水平相比相对较低。在西欧，汽车往往较小且燃油效率高，因此西欧国家在拥有相同数量的汽车情况下，CO2 排放量更低。同样，西欧严重依赖核能和风能，导致在相同国民收入水平的情况下 CO2 排放量更低。因此，从汽车数量和国民收入的角度来看，欧洲国家地位是一个补充性控制。它特别强烈地补充了国民收入。哪个变量对 CO2 排放量的总体影响更大，是汽车数量还是更广泛的国民收入水平？很难说定，因为这些变量以截然不同的单位表示。每 1000 人增加一辆汽车的影响小于国民收入增加 1000 美元，但这不是一个公平的比较。毕竟，每 1000 人增加 100 辆汽车的影响远大于国民收入增加 1000 美元。我们可以比较汽车数量和国民收入的 t 统计量，以确定哪一个在统计学上更显著，但我们还没有一种机制来比较不同变量在相同尺度上的效应的绝对大小。没有这个，我们就无法确定哪个变量对 CO2 排放量的影响更大。更进一步，这两种变量加在一起能解释国际 CO2 排放量变异的多少，或者这两种变量加上欧洲国家地位能解释多少？毕竟，统计建模的最终目标是解释世界上的事物。图 8-1 中提出的模型部分解释了国家间 CO2 排放量的差异，但我们不知道它们解释了多少 CO2 排放量。这无疑是一个非常好的信息，从科学的角度来看是如此，从社会政策的角度来看也是如此。政治家和公众有权了解我们的统计模型能解释现实世界中广泛变异的多少。如果我们能解释观察到的变异的 90%，那就太好了。如果我们能解释 50%，还不错，至少说明了一些问题。如果我们只能解释观察到的变异的 10%，而其余现实世界本质上是随机的，那么世界就有权无视我们以及我们的统计结果。

本章展示了如何在多元回归模型的背景下直接比较不同变量的相对解释力。首先，为了比较变量，必须通过称为标准化的过程将它们放在相同的尺度上（第 8.1 节）。使用标准化变量估计的回归斜率可用于直接比较每个变量的相对解释力。其次，当使用标准化变量进行简单线性回归时，结果会得到一个相关系数，该系数衡量变量之间关系的强度（第 8.2 节）。相关性方便地衡量两个变量之间关系的强度，范围从 -1 到 +1。相关系数也可以用于评估任何回归模型的总体预测能力（第 8.3 节）。可以衡量因变量中由自变量解释的总变异量。一个可选部分（第 8.4 节）说明了如何使用相关系数同时探索连接大量变量的关系结构。最后，本章以台湾人民对民主的满意度为案例研究（第 8.5 节）。该案例研究说明了如何使用标准化回归系数来评估和比较多元回归模型中不同变量的性能。它还说明了如何比较不同回归模型的相对解释力。本章的所有关键概念都在这个案例研究中得到应用。在本节结束时，你应该能够使用多元回归来对多个自变量对单个因变量的影响做出基本推断。

8.1. 使用标准化变量比较相同事物线性回归涉及比较具有非常不同含义的变量的值。在图 8-1 的模型 2 中，报告了在一个国家中，每增加 1 辆汽车（每 1000 人），人均 CO2 排放量就会增加 0.008 吨，而国民收入每增加 1000 美元，人均 CO2 排放量就会增加 0.074 吨。变量汽车以每 1000 人的数量表示，变量国民收入以千美元表示，变量 CO2 排放量以人均每年吨表示。使用如此多的不同单位使得跨变量比较不同国家变得困难。例如，澳大利亚有 542 辆汽车（每 1000 人）、29,480 美元（人均国民收入）和 18.1 吨（人均 CO2 排放量）。这些数据是高、低还是平均水平？它们彼此之间以及与其他国家相比如何？判断变量值是高还是低的一种方法是使用均值和标准差。图 8-2 报告了图 8-1 中使用的 51 个国家 CO2 排放量、汽车数量和国民收入的均值和标准差。澳大利亚的 CO2 排放量（18.1 吨）远远高于 51 个国家 CO2 排放量的平均水平。事实上，澳大利亚的 CO2 排放量比平均水平高出两个标准差以上。平均值为 6.15 吨。平均值加一个标准差为 6.15 + 4.34 = 10.49 吨。平均值加两个标准差为 6.15 + 4.34 + 4.34 = 14.83 吨。澳大利亚的排放量为 18.1 吨，远远高于这一水平。

澳大利亚每千人拥有的汽车数量也很多，为 542 辆，而跨国平均值为 242 辆。澳大利亚的水平比平均水平高出 1 个标准差，但不到 2 个标准差。澳大利亚的国民收入水平为 29,480 美元，远高于平均水平，但不到 1 个标准差。实际上，它只比平均水平高出 0.83 个标准差。因此，虽然澳大利亚在乘用车和国民收入方面比平均水平高出约 1 个标准差，但在二氧化碳排放方面却比平均水平高出 2 个标准差以上。这表明澳大利亚的二氧化碳排放特别高。回顾图 3-2，情况似乎确实如此：澳大利亚的实际二氧化碳排放量远高于回归线所示的预期水平。澳大利亚是一个明显的异常值。另一方面，墨西哥的二氧化碳排放量比平均水平低 0.47 个标准差，乘用车比平均水平低 0.51 个标准差，收入比平均水平低 0.42 个标准差。它在所有三个变量上的低于平均水平的程度大致相同。它在所有三个变量上的接近平均水平的程度也比澳大利亚高，至少在标准差方面是如此。例如，在二氧化碳排放方面，墨西哥比平均水平低 0.47 个标准差，而澳大利亚则比平均水平高出 2.75 个标准差。用标准差来讨论变量的多少高于或低于平均水平实际上是一种非常有用的技术。与计算特定情况下的标准差高于或低于平均水平相比，在称为“标准化”的过程中，将变量的所有值同时转换为高于或低于平均水平的标准差更有意义。标准化变量是指通过从每个观测值中减去平均值，然后除以标准差而得到的变量。由于它们的构造方式，标准化变量的平均值始终为 0，标准差始终为 1。由于它们的构造方式，标准化变量没有单位。例如，墨西哥的国民收入比平均水平低 0.42 个标准差。它不是低于平均水平 0.42 美元，也不是低于平均水平 0.42%。它只是低于平均水平 0.42 个标准差。这是标准化变量的唯一缺点：它们没有单位。当社会统计学家有兴趣做一些需要原始单位的事情时，比如使用回归模型进行预测，他们需要原始单位。非标准化变量是指以其原始单位表示的变量。所有变量最初都是非标准化变量，以美元、英镑、百分比、每千人拥有的汽车数量或其他单位表示。一般来说，“非标准化变量”就是“变量”。“非标准化变量”一词只在需要将非标准化变量与标准化变量区分开来时使用。标准化变量最重要的应用是在线性回归模型中。在图 7-13 中，加拿大的 13 个省和地区的吸烟率与平均日气温和重度饮酒率进行了回归。温度和重度饮酒都是吸烟率的统计学显著预测指标，但由于它们以不同的单位记录（度数与百分比），因此很难比较它们的影响。将所有三个变量（吸烟、温度和饮酒）标准化，可以对温度和饮酒对吸烟率的影响进行有意义的比较。标准化变量的第一步是找到它们的均值和标准差。图 8-3 报告了所有三个变量的均值和标准差。第二步是使用这些均值和标准差将每个变量的每个值转换为标准化值。

通常，标准化由统计计算机软件自动执行，但图 8-4 以“重度饮酒”变量为例说明了标准化过程中的步骤。加拿大的所有 13 个省和地区都列在第 1 列，它们的重度饮酒率列在第 2 列。重度饮酒的平均值记录在第 3 列。每个值与平均值的差值在第 4 列中计算。重度饮酒的标准差记录在第 5 列。每个省的重度饮酒的标准化值在第 6 列中计算。第 6 列中的值表示每个省比所有省的重度饮酒平均水平高出多少个标准差。

标准化将变量中每个案例的值更改为标准化值，但不会以任何方式更改变量的分布。高案例仍然是高案例，低案例仍然是低案例。只有单位会发生变化。图 8-5 说明了这一点。图 8-5 的左侧是使用原始的非标准化变量绘制的加拿大的 13 个省和地区的吸烟率与重度饮酒率的散点图。图 8-5 的右侧使用标准化变量描述了相同的关系。点的布局相同，但轴的刻度发生了变化。标准化图以 0 为中心，每个方向的范围从 -3 到 +3。还要注意，标准化图上绘制的回归线如何穿过中心点。使用标准化变量估计的任何回归都会发生这种情况。

图 8-6 报告了将省级吸烟率对平均气温和重度饮酒率进行回归的多元线性回归模型的系数。报告了两个系数集，一个使用非标准化变量，另一个使用标准化变量。非标准化系数是指使用原始非标准化变量估计的回归模型的系数。标准化系数是指使用标准化变量估计的回归模型的系数。非标准化系数只是使用三个变量的原始单位找到的常规系数。它们与图 7-13 模型 2 中报告的系数相同。另一方面，标准化系数是使用新的标准化变量版本时得到的模型的系数。

由于标准化系数都以标准化单位（以标准差表示，而不是度数或百分比）表示，因此它们可以直接比较。温度与吸烟之间的关系是重度饮酒与吸烟之间关系的两倍多。温度每增加一个标准差，吸烟率就会下降 0.832 个标准差，而重度饮酒每增加一个标准差，吸烟率就会上升 0.398 个标准差。标准化模型没有报告截距，因为标准化模型的截距始终为 0。报告 0 作为截距并不错误，但习惯上将标准化模型的截距留空。由于这种习惯，很容易一眼看出模型是使用非标准化变量还是标准化变量。无论何时报告截距，模型都是非标准化的。当没有报告截距时，模型一定是标准化的。非标准化系数和标准化系数的 t 统计量和概率水平相同。由于标准化不会改变分析中点的布局或误差量，因此它不会对显著性水平产生任何影响。图 8-7 报告了二氧化碳排放回归模型的标准化系数。在模型 2 中，乘用车的标准化系数大于国民收入的标准化系数。这表明乘用车的数量比国民收入水平更能预测二氧化碳排放量。两个标准化系数之间的差异很小，但很明显。在模型 3 中控制西欧状态会改变这种情况。在模型 3 中，国民收入的标准化系数比乘用车的系数强。这是因为控制西欧状态消除了国民收入与二氧化碳排放之间关系的大部分误差（西欧状态强烈补充了国民收入）。

那么，哪个变量最能预测二氧化碳排放量？答案是它们的影响大致相同。哪个更强取决于我们是否控制了西欧状态。西欧状态本身对二氧化碳排放量的影响要弱得多，略高于其他两个变量的一半。使用标准化变量生成标准化系数使所有这些比较成为可能。

8.2. 相关性在图 8-6 和图 8-7 中，使用标准化系数比较模型内关系的相对强度。在加拿大各省，温度与吸烟率之间的关系远强于大量饮酒与吸烟率之间的关系。在各国，乘用车与二氧化碳排放量之间的关系与国民收入与二氧化碳排放量之间的关系强度大致相同。在所有这些情况下，不同关系的强度是在单个回归模型中进行比较的。标准化系数也可用于比较不同模型中关系的强度。例如，在第 1 章中，我们推测低收入会导致更高的垃圾食品消费。这个理论被转化为两个具体的假设。首先，假设中位收入较高的美国州的汽水消费量较低。其次，假设收入较高的州的含糖零食消费量较低。结果证明，第一个假设是正确的，但第二个假设是错误的。与预期相反，收入较高的州的含糖零食消费量实际上更多，而不是更少。我们可能想知道哪种关系更强，收入与汽水之间的（预期）关系，还是收入与含糖零食之间的（意外）关系。图 8-8 和图 8-9 报告了每个因变量对州中位收入的回归结果。每个模型中的非标准化系数与第 1 章中报告的系数相同。非标准化系数表明，州中位收入每增加 1000 美元，人均汽水消费量每年减少 0.603 加仑，人均含糖零食消费量每年增加 0.611 磅。标准化系数表明，收入与汽水消费量之间关系的强度实际上略强于收入与含糖零食消费量之间关系的强度。

图 8-8. 2008 年 48 个美国州的汽水消费量对州中位收入的回归的度量和标准化系数比较（数据来自图 1-2）

图 8-9. 2008 年 48 个美国州的含糖零食消费量对州中位收入的回归的度量和标准化系数比较（数据来自图 1-2）

简单线性回归模型中的标准化系数通常以这种方式用于衡量变量之间关系的强度。标准化系数是两个变量之间关系的简便速记，原因有几个。首先，由于它们基于标准化变量，因此它们始终具有可比性，无论原始变量是用什么单位测量的。其次，事实证明，在只有一个预测变量的简单线性回归模型中，哪个变量是因变量，哪个变量是自变量并不重要。无论哪种方式，标准化系数都将相同。第三，同样仅在只有一个预测变量的简单线性回归模型中，事实证明标准化系数将始终介于 -1 和 +1 之间。斜率在任何方向上都不大于 1。这种使用来自简单回归模型的标准化系数的做法非常普遍，以至于它有自己的名称和符号：相关性，用符号“r”表示。相关性 (r) 是衡量两个变量之间关系强度的指标，范围从 r = -1（完全负相关）到 r = 0（无相关性）再到 r = +1（完全正相关）。两个变量之间的相关性与一个变量对另一个变量的回归的标准化系数完全相同。图 8-10 演示了如何比较州收入与汽水和含糖零食的相关性。请注意，相关系数与图 8-8 和图 8-9 中报告的简单线性回归系数相同。同样，它们的概率对应于图 8-8 和图 8-9 中报告的 t 统计量的概率。

图 8-10. 2008 年 48 个美国州的州中位收入与汽水和含糖零食消费量的相关性

8.3. R 和 R2 除了普遍衡量变量之间关系的强度之外，相关性还有另一个非常具体的用途。相关性可用于评估任何回归模型的整体预测强度。例如，图 8-11 中的表格重复了图 7-6 中对三个自变量（国民收入、教育支出和教师人数）进行的科学成绩性别差距回归的结果。在图 8-11 中，报告了非标准化系数和标准化系数。标准化系数表明，教师和国民收入的影响强于教育支出的影响，但它们并没有告诉我们该模型作为一个整体在预测科学成绩性别差距方面的表现如何。

相关性可用于帮助阐明这一点。评估模型性能的关键问题是：模型预测的因变量的值与实际观察到的因变量的值之间的对应程度如何？换句话说，因变量的预期值与其实际值之间的关系强度是多少？相关性非常适合衡量两个变量之间关系的强度。当将两个变量相关联时，这两个变量是来自回归模型的因变量的实际值和预期值，则相关性用大写字母 R 表示（将其区分为一种特定类型的相关性）。对于图 8-11 的模型 1，R 为 0.446。这意味着在图 8-11 的模型 1 中，科学成绩性别差距的实际值与回归模型生成的预期值的 r = 0.446 相关。这不是理想的（完美的相关性将是 r = 1），但这是有意义的。图 8-12 绘制了科学成绩性别差距的实际值与图 8-11 中模型 1 生成的预期值。两者之间存在明确的正相关关系，但并不十分强。作为比较，对于预测加拿大各省吸烟率的回归（图 8-6），该模型的预测性能为 R = 0.928，而对于预测各国二氧化碳排放量的回归（图 8-7 中的模型 3），该模型的预测性能为 R = 0.632。图 8-11 中的回归模型确实预测了科学成绩的性别差距，但并不特别好。

除了总结回归模型的预测强度之外，回归模型 R 统计量还有另一个非常重要的用途。R 统计量在将回归模型链接回平均模型方面发挥作用。在第 4 章中，图 4-10 展示了如何将加拿大各省吸烟率的平均模型映射到吸烟的回归模型中。每个省份与平均吸烟率的偏差（图 4-10 的左侧）分散在吸烟回归模型的平均温度范围内（图 4-10 的右侧）。在图 8-13 中，对吸烟率与大量饮酒率之间的关系进行了相同类型的映射。同样，每个省份与平均吸烟率的偏差（左侧）分散在自变量范围内，在本例中为大量饮酒（右侧）。

从这个角度来看，回归模型只不过是对为什么某些案例比其他案例更偏离平均值的解释。从这个角度来看，安大略省的吸烟率较低，至少部分原因是其饮酒率较低，而西北地区的吸烟率较高，至少部分原因是其饮酒率较高。这些省份的吸烟率也部分由其温度（图 4-10）解释。总体而言，温度和大量饮酒率解释了吸烟率的跨省总变异性的很大一部分，但究竟占多少呢？正确回答这个问题需要大量的代数，但所有这些代数的最终结果是，回归模型中自变量解释的因变量总变异性的比例等于 R x R，或 R2（“R 平方”）。R2 是衡量回归模型解释的因变量总变异性比例的指标。与其他回归相关统计量一样，无需计算 R2。任何估计回归模型的软件程序都将自动报告模型的 R2 统计量。图 8-11 中用于预测科学成绩性别差距的模型的 R2 为 0.199 或 19.9%，表明一个国家的国民收入、教育支出和教师人数共同解释了科学成绩性别差距的国际变异性的近 20%。预测加拿大省级吸烟率的模型的 R2（图 8-6）为 0.861，表明 86% 以上的跨省吸烟率差异可以用温度和大量饮酒率的差异来解释。预测各国二氧化碳排放量的完整模型的 R2（图 8-7 中的模型 3）为 0.399，表明近 40% 的国际二氧化碳排放量差异可以用国民收入、乘用车和西欧国家地位的差异来解释。由于 R2 具有如此重要的直观意义（解释的变异性比例），因此大多数回归结果表都报告 R2，而不是 R。由于根据定义，R2 等于 R 平方，因此可以使用计算器轻松地从一个计算另一个（如果需要）。实际上，R 很少使用，但几乎每个回归模型都会报告和讨论 R2。

8.4. 相关矩阵（可选/高级）相关性是衡量变量之间关系强度的总结指标。因此，即使在回归模型之外，它们也很有用。有时我们只想了解一组变量之间存在哪些关系。连接一组变量的所有相关性的表格称为相关矩阵。例如，图 8-6（二氧化碳排放回归模型）中包含的四个变量的相关矩阵如图 8-14 所示。回归模型的因变量首先列在图 8-14 中，然后列出所有自变量，但相关矩阵中变量的顺序对相关性没有任何影响。该表或矩阵只是组织所有变量之间所有相关性的便捷方式。

如图 8-14 所示的相关矩阵，其行数和列数总是相等，因为每个变量既作为行也作为列出现。当一个变量在表格中与自身匹配时，其相关性始终为 1（每个变量与其自身完全相关）。因此，相关矩阵中总是有一条对角线穿过中间，其元素均为 1。相关矩阵的另一个特征是，右上角报告的相关性是左下角报告的相关性的镜像。这是因为相关性是对称的：收入与汽车的相关性与汽车与收入的相关性相同。由于右上角的条目重复了左下角的条目，因此相关矩阵中右上角有时会留空。这些去除了冗余相关性的半空白矩阵被称为三角矩阵。图 8-15 展示了一个包含七个变量的三角相关矩阵。这些相关性基于 2006 年世界价值观调查中 1145 名台湾受访者的特征（将在 8.5 节中讨论）。由于一些变量的名称很长，每个变量都列在一个编号的行上，这些编号被用作列标题。为了便于参考，还包括所有变量的平均值和标准差。包含平均值和标准差的相关矩阵，在紧凑的空间内总结了一组变量的所有重要特征。尽管许多作者确实使用类似于图 8-15 所示的三角矩阵，但完整的（正方形）矩阵更加方便。在三角矩阵中找到你正在寻找的相关性可能需要几分钟，而在正方形矩阵中，你总是可以沿着一行读取以找到你想要的任何相关性。

相关矩阵可以用来挑选出哪些自变量可能与因变量显著相关。例如，在图 8-15 中，与民主评级最密切相关的变量是年龄、教育和对制度的信心。相关矩阵还可以用来挑选出哪些自变量可能基于相互之间的相关性而相互竞争或相互补充。像年龄、教育和收入，或者信任和信心这样的高度相关的变量组，很可能相互竞争或相互补充。在回归模型中使用时，彼此不相关的变量不太可能相互竞争或相互补充。然而，根据相关矩阵区分竞争性控制和补充性控制是困难或不可能的。

8.5. 案例研究：对台湾民主的满意度在第五章中，来自 2006 年世界价值观调查（WVS）台湾版的资料被用来研究人们的年龄与他们对台湾民主质量的评级之间的关系。人们对台湾民主的评级是在 0 到 100 的量表上评分，其中：评级 = 0 表示受访者认为台湾没有足够的民主评级 = 50 表示受访者认为台湾的民主程度恰到好处评级 = 100 表示受访者认为台湾的民主程度过高图 5-7 报告的回归模型发现，年龄与人们对台湾民主的评级呈正相关，每增加一岁，民主评级预测会增加 0.105 分（老年人认为台湾比年轻人更民主）。在 1216 名受调查者中，平均民主评级为 38.7，表明大多数人对台湾的民主程度不太满意。图 8-16 报告了关于台湾民主评级的两个更广泛的多元回归模型的结果。这些模型仅基于 1145 个调查回答，因为有些人没有回答模型中使用的所有问题。图 8-16 中报告的模型包括六个自变量：年龄 -- 受访者的年龄（以年为单位）性别 -- 受访者的性别，编码为女性 = 0，男性 = 1 教育 -- 受访者的受教育年限收入 -- 受访者的收入十分位（最低十分位、第二十分位、第三十分位等）对社会的信任 -- 一个衡量受访者对社会信任程度的变量，范围从 0 到 18 对制度的信心 -- 一个衡量受访者对社会制度（如政府、企业和教会）的信心程度的变量，范围从 0 到 45 预计教育和收入会与人们对民主的评级呈正相关，因为在社会中更成功的人通常对社会有更高的评价。同样，那些对社会制度有更高信任和信心的人，预计会对他们社会的民主程度有更高的评价。性别也被纳入作为控制变量，但没有对其影响的特定预期。

图 8-16 中的第一列结果报告了民主评级与六个自变量中每个变量的相关性。这些相关性中只有三个具有统计学意义：年龄、教育和对制度的信心。图 8-16 还报告了两个回归模型的结果。对于每个模型，都报告了非标准化系数和标准化系数。非标准化系数只是基于模型中每个变量的非标准化变量的普通回归系数。标准化系数是在使用标准化变量估计的相同回归模型中产生的回归系数。模型 1 中的标准化系数表明，在模型中包含的四个变量中，年龄对民主评级的影響最大。在模型 2 中，对社会制度（包括政府）的信心与人们对国家民主的评级呈正相关。这是有道理的，因为对政府没有信心的人不太可能认为他们的政府非常民主。令人惊讶的是，对社会的信任对人们对台湾政府民主程度的评价没有显著影响。这两个模型的 R2 统计量都出奇地低。模型 1 的 R2 为 0.019，表明模型 1 中的变量加起来只解释了人们对台湾民主评级总变异量的 1.9%。随着模型 2 中变量的增加，R2 上升，但在 0.026（2.6%）时仍然非常低。这些低的 R2 分数对这两个模型的实质意义提出了质疑。这两个模型的系数都具有统计学意义，但一个模型解释了因变量总变异量不到 3%，从政策的角度来看可能不是很有用。人们对他们自己的政府的民主程度的评级的真正原因仍然是一个谜，至少在台湾是这样。

第八章关键词

相关性 (r) 是 _衡量两个变量之间关系强度的指标，其范围从 r = −1（完全负相关）到 r = 0（无相关性）到 r = +1（完全正相关）_。
R2 是 _衡量回归模型解释因变量总变异量比例的指标_。
标准化系数 是 _使用标准化变量估计的回归模型的系数_。
标准化变量 是 _通过从每个观测值中减去均值，然后除以标准差而变换的变量_。
非标准化系数 是 _使用原始非标准化变量估计的回归模型的系数_。
非标准化变量 是 _以其原始单位表示的变量_。

← 第七章 · 第九章 →

标准化系数

第八章 关键词

第八章关键词