统计学入门

介绍

本书旨在为那些需要使用标准统计技术进行数据分析但没有统计学训练的读者提供帮助。特别是，它可能对使用 SPSS 和 PASW的华夏公益教科书的读者有所帮助。

在应用统计学中，即使没有任何真正的数学理解，也可以勉强应付，但并不推荐这样做。本书假设，即使是凭感觉行事，了解如何测量风速也是有价值的。

内容是通过列举一个非专业统计学或应用统计学课程中本科社会科学学生需要学习的内容，然后将其简化到最基本的程度，并特别避免过多的数学细节来确定的。

本书没有涵盖概率，而概率是现代统计思维的基石之一，原因是作者认为，如果真的需要，你可以几乎完全依靠直观的概率概念来应付。概率会时常出现，但本书只依赖于对概率的朴素、直观的理解。

我想强调的是，我认为任何人都不能完全不了解统计方法，但如果你发现自己必须分析数据或进行检验，却不知道从何入手，这本书可能会对你有所帮助。

我假设读者会使用合适的计算机应用程序（SPSS、Minitab、Stata 都是例子），所以虽然我会简要解释一些计算，但我不会讲解如何使用统计表格查找显著性值。

统计学的两种用途

描述世界

描述性统计学是一种将世界的可测量特征形式化的方式。从科学研究的角度来看，我们通常会将经验世界的一部分隔离并简化，以便于观察和测量。在描述性统计学中，我们关注所研究对象的量化方面，并试图以有用的方式对其进行描述。我们的目标是区分在相关方面不相同的事物，并清楚地表明表面上看起来非常不同的事物之间的相似之处。

检验关于世界的理论

科学旨在通过提供一种解释经验的理论来解释我们的经验。理论是解释性说明，包括（除其他外）关于经验要素的一个或多个假设。例如，这些假设可能是：x 与 y 非常相似; p 与 q 经常相关; t 通常是 r 乘以 s 的一半。也许所有 x, y 和 z 都没有帮助，但我们可以找到一个可能帮助的例子。假设我们认为足球运动员产生的汗液量（以服装上汗斑的面积来衡量）取决于她持球的时间和环境温度。我们可以尝试将此建模为

汗斑面积 = 环境温度 + 持球时间

现在，这是一个非常不可能的模型。稍微更可能的是，在这个等式中需要一些系数才能让它起作用。但我们可以问，是否存在这样的系数，使得

汗斑面积 = (环境温度 * a) + (持球时间 * c) ± 噪声

事实证明，世界中许多现象之间的关系都由类似这样的等式控制。统计分析可以告诉我们是否存在这样的等式，以及它的预测有多可靠。

显著性检验的工作原理

想象一下，我有一个抽屉，里面装满了袜子 - 六只不配对的袜子，每只袜子颜色不同，分别是红色、蓝色、绿色、橙色、黄色、灰色。如果我随机抽出两只袜子，我抽出红袜子和蓝袜子在一起的可能性有多大？可能的组合如下

红蓝

红绿

红橙

红黄

红灰

蓝绿

蓝橙

蓝黄

蓝灰

绿橙

绿黄

绿灰

橙黄

橙灰

黄灰

（如果你还记得关于排列组合的知识，那就是 n!/(p! (n-p)!)）

简而言之，抽出红袜子和蓝袜子在一起的概率是 1/15。实际上，你可以算出从抽屉中抽出任意数量的袜子时，任意组合的概率。我们可以知道一种组合的可能性——反之，也知道它的不可能程度。现在，想象一下，抽屉里每种颜色的袜子都有十只。我们可以像以前一样计算出任意抽出任意数量袜子的概率。现在，想象一下，我们不知道抽屉里每种颜色的袜子有多少只，但我们知道有六种可能的颜色，总共六十只袜子。我抽出一组袜子，比如每次抽五只。假设我抽出了以下袜子：

绿绿蓝红橙

如果实际上抽屉里每种颜色的袜子数量相等，我们可以计算出这种组合的可能性有多小。在袜子颜色分布均匀的情况下，一些组合会比较容易出现，而另一些则非常不可能出现。

因此，如果我们想赌一下抽屉里是否真的每种颜色的袜子数量相等，我们可以这样做

做出零假设，即抽屉里每种颜色的袜子数量相等
设定我们需要的置信水平——例如，我们希望犯错（输钱！）的次数不超过 5%
进行抽取
计算在零假设下，本次抽取结果的可能性有多小

如果我们得到的结果与零假设下可能出现的差异很大，我们会对拒绝零假设充满信心，否则我们会谨慎行事，说我们没有理由拒绝零假设。

许多统计检验都涉及计算一个统计量，该统计量被认为是从特定分布的值中抽取的。这个分布就是我们的袜子抽屉。对于这个统计量的一个给定值，在零假设下，它或多或少可能出现，这种可能性被称为p 值。我们决定我们对什么程度的置信度感到满意（也就是说，我们允许自己可能被误导的次数），然后计算在我们面前的数字是否应该拒绝零假设——我们问自己，在这种情况下，数据有多极端？。如果p 值在本次场合小于置信水平，那么它就过于极端，无法接受零假设。

统计学入门

介绍

统计学的两种用途

描述世界

检验关于世界的理论

显著性检验的工作原理

注释

目录