跳转到内容

统计学基础/自由度

来自维基教科书,开放的书籍,开放的世界

自由度

[编辑 | 编辑源代码]

这是一个介绍自由度(df)概念的好时机。这个概念可能会引起一些焦虑,但在实际情况下,好的统计软件会为您计算自由度,所以没有必要担心。

让我们考虑一个例子:为了计算方差,我首先将平方偏差从均值加起来。均值是一个参数:它是所考察变量的整体特征,是描述总体值分布的一部分。如果您知道所有参数,就可以准确地描述数据。您知道的参数越多,也就是说您固定的参数越多,符合这种数据模型的样本就越少。如果您只知道均值,那么将会有很多可能的数据集与这种模型一致;但是,如果您知道均值和标准差,那么符合这种模型的可能数据集就会更少。

所以在计算方差时,我首先要计算均值。当我计算出均值后,我就可以改变数据中的任何分数,除了一个。如果我保留一个分数不检查,它就可以始终根据其余数据和均值本身准确计算出来。也许一个例子可以更清楚地说明这一点。

我取一班学生的年龄,然后找出均值。如果我固定均值,那么其他分数中还有多少个分数(总共有N个分数,请记住)可以变化?答案是N-1。有 N-1 个独立的信息可以变化,而均值是已知的。这些就是自由度。一个信息不能变化,因为它的值完全由参数(在本例中为均值)和其他分数决定。在我们的计算过程中固定的每个参数都会导致失去一个自由度。

如果我们想象从少量数据点开始,然后在计算某些统计数据时固定相对较多的参数,我们就会发现,随着更多自由度的丢失,我们的模型所解释的情况就越来越少,因为越来越少的信息可以原则上与实际观察到的不同。

所以,通俗地说,我们对数据的兴趣是由自由度决定的:如果一旦我们的参数被固定,就没有任何东西可以变化(因为我们的数据点非常少,也许只有一个),那么就没有什么可以调查的。自由度可以看作是将样本量与解释力联系起来。


1 简介

2 统计量

3 参数方法和非参数方法

4 描述性统计

5 推断统计:假设检验

6 自由度

7 显著性

8 关联

9 比较组或变量

10 回归

华夏公益教科书