跳转到内容

社会统计学:导论

来自维基教科书,开放的书籍,开放的世界

社会统计学是将统计学方法应用于社会科学数据。社会统计学使用与任何其他形式的统计分析相同的数学工具,但它以不同的方式使用这些工具,这些方式考虑了社会科学数据的独特特征。社会科学中使用的大多数数据都是观察性的,而不是实验性的,这意味着社会科学家必须使用统计方法来控制对感兴趣关系的外部影响,因为实验控制不可用。社会科学数据的观察性质也使得在大多数情况下难以执行正式的假设检验,因为假设几乎总是以对用于检验它们的数据的先验知识为条件。这些以及其他挑战使社会统计学的实践不同于物理生物学心理学科学中统计学的实践。

本书介绍并解释了社会科学中传统统计技术的应用。本书没有遵循社会统计学教科书中使用的标准方法,而是将重点放在社会科学中实际使用的统计概念和技术上。因此,例如,非常常用的线性回归模型在早期就被介绍,而数学上更简单但不太常用的均值和标准差则在之后作为回归的逻辑推论而被介绍。整本书都采用概念性方法。对数学的使用降至最低。本书中使用的所有技术的数学定义都可以在互联网上轻松找到,包括维基百科。

本书的第 1-4 章阐述了几乎所有当代社会统计学的基础模型:线性回归模型。线性回归模型将因变量 (Y) 表示为自变量 (X) 的线性函数加上误差。线性回归在社会科学中尤其重要,因为社会科学文献中使用的几乎所有高级模型都是简单线性回归模型的扩展。即使是像均值和标准差这样的单变量描述性统计也可以理解为源于没有自变量的线性回归的特例退化情况。虽然对于没有矩阵代数知识的学生来说,回归在数学上很难解释,但它在图形上很容易解释。因此,本书采用图形方法来理解线性回归,并通过扩展,理解单变量统计。

本书的第 5-8 章将具有单个自变量的简单线性回归模型扩展为具有多个自变量的多元线性回归模型。多元线性回归被引入作为一种方法,用于在社会科学环境中包含统计控制,在这些环境中,不可能实施实验控制。因此,多元回归与统计模型中的推断问题相关联:希望推断关于正在分析的数据之外的世界的一些事情。统计推断的关键工具是 t 统计量,为此专门设立了一章。t 统计量用于确定给定回归系数的统计显著性。在多元回归框架中,t 统计量也可以用来比较不同自变量的相对显著性。另一个用于这些比较的工具,标准化回归系数,也有一章专门介绍。

本书的第 9-11 章重点关注可以使用相同的基本多元线性回归工具估算的不同模型配置。这些章节将第 1-8 章中介绍的统计量应用于特定且非常常用的回归模型类型,包括ANOVA 和交互模型。本书的未来章节可能会介绍其他模型类型。

第 1 章

华夏公益教科书