使用 SPSS 和 PASW/了解度量列
主流统计学识别四个度量水平或尺度。 它们是
- 名义
- 顺序
- 区间
- 比率(在 SPSS 中与区间数据组合为比例)
这些按从最像名称到最像数字的顺序排列。 每个级别都有其自身的特征,并且与一组允许的统计程序相关联。 下面,将对该级别进行表征并与一个或多个集中趋势度量相关联,即,众数、平均数和中位数。
名义度量水平用于分类数据,其中每个值都被分配给一个离散类别。 例如,研究中参与者的眼睛颜色可以按名义(来自拉丁语nomen,意思是名称)分类为以下几组
- 棕色
- 蓝色
- 绿色
- 其他
这些数据定量分析的唯一过程是计数,以发现出现频率。 也就是说,有多少个人被分配到每个类别。 类别通常用数字编码(即,分配一个唯一的数字)并命名(使用变量的值属性)。
名义数据的唯一集中趋势度量是众数,它是出现频率最高的类别。 请注意,样本不保证会产生唯一的众数值。
顺序度量水平用于形成离散类别并且可以在某个尺度上自然排名的数据。 此排名是对数据的弱排序,因为两个值可以共享相同的排名:a 和b 的相对排名是
- a < b 或
- a > b 或
- a = b
这完全错误,请勿使用,因为在 2018 年 11 月 11 日它是不正确的。
顺序数据的示例是收入分组。 虽然收入可以被视为标量变量,但在将收入范围划分为类别通常很有用。 例如,国家统计局建议使用以下分组[1]
收入范围下限 | 收入范围上限 | 可能的带代码 |
---|---|---|
数据中的最低值 | £5,199 | 1 |
£5,200 | £10,399 | 2 |
£10,400 | £15,599 | 3 |
£15,600 | £20,799 | 4 |
£20,800 | £25,999 | 5 |
£26,000 | £31,199 | 6 |
£31,200 | £36,399 | 7 |
£36,400 | £51,999 | 8 |
(我可能会添加第九个带以处理所有收入超过 £51,999 的情况)
与名义数据一样,这些分组也可以用数字代码表示。
顺序数据的集中趋势可以用众数(上面已定义)和中位数表示,它是将数据分成两半的值。 这是案例数量为奇数时的中间值。 否则,中位数通常取为两个中间值的算术平均数(见下文)。
此尺度上排名级别之间的差异无法测量或比较:虽然我们知道,对于顺序数据点 a、b 和 c,a<b、b<c 和 a<c,但我们不知道距离 ab 是否等于距离 bc。
区间数据值可以排序,并且可以比较它们之间的距离。 但是,区间数据的零点是任意的。 经常被引用的示例是摄氏温标上的温度测量。 在这里,水的冰点被任意地分配为零,水的沸点被任意地分配为 100。 虽然 50° 在尺度上这两个标记之间指示为一半,但它并不合理地是水沸点的一半。 例如,您不能通过将指示的烤箱温度减半并将烹饪时间加倍来合理地修改食谱。
比率数据都是:有序的,具有可比较的距离(尺度上的连续积分点等距),并且在具有真实零点的尺度上。
例如,考虑用米测量高度:有些物体没有海拔,这自然映射到零米的高度。
这些值也可以形成比率,因此任何值都可以表示为其他值的比率。 例如,如果我们找到三个身高分别为 1.5 米、1.75 米和 2 米的人,我们可以将其中任何一个表示为另一个人的倍数。
比例数据的集中趋势可以用众数、中位数和算术平均数表示。
前两个在上面讨论过。
算术平均数是所有数据值的总和除以数据点数。 换句话说,它就是通常所说的平均数。
- ↑ Stevens, S. S. "Harmonised Concepts and Questions for Social Data Sources: Secondary Standards" (PDF).
{{cite journal}}
: Cite journal requires|journal=
(help); line feed character in|title=
at position 59 (help)