跳转到内容

使用 SPSS 和 PASW/理解缺失值对话框

来自维基教科书,开放的书,为开放的世界

缺失值的编码

[编辑 | 编辑源代码]

关于缺失数据的处理有很多文献(例如,参见 Allison (2001) 以获取参考文献[1]),我不想在这里处理方法论问题。相反,我想更详细地解释缺失值对话框。以下是对话框

请注意,您可以指定最多三个离散整数或字符串值,或一个范围,来代表缺失数据。如果您想分析数据中存在的缺失值,您可能希望使用多个指标(例如,您可能有“随机缺失”、“完全随机缺失”和“非随机缺失”的选择),但如果您只对消除这些情况(数据点)感兴趣,那么一个指标就足够了。

请注意,如果您的变量是数值型,那么您用于指示缺失数据的代码也必须是数值型。

在可能的情况下,选择一个缺失值代码,该代码作为该变量的测量值在逻辑上不可能。例如,年龄为 -1。您可能考虑使用 999 作为年龄的缺失代码,因为它是不可能的年龄,但最好指定不可能的而不是不太可能的。对于字符串变量,您可以使用任何字符串,例如,NA 代表不适用,或简单的缺失

在您在变量视图中完成缺失值对话框后,您仍然需要输入数据,因为变量的默认缺失值不会是您的缺失值。相反,它将是数值变量的系统缺失(用句号表示),以及字符串变量的空格。

如果您只有几个缺失实例,您可以手动执行此操作。首先,按相关变量对数据进行排序,以便空单元格首先出现,从而方便任务执行。

但是,如果您有大量的缺失数据点,那么使用转换 → 重新编码为同一变量对话框重新编码系统缺失数据会更容易。对于数值变量,在对话框的左侧,选择系统缺失作为旧值,在右侧,选择您的缺失代码作为新值。对于字符串数据,您将输入空格,而不是系统缺失作为旧值。

  1. Allison, P. D. ((2001).). 缺失数据. Thousand Oaks, CA: Sage Publications. {{引用书籍}}: 检查日期值:|date= (帮助)
华夏公益教科书