跳转到内容

社会研究方法/定量研究

来自维基教科书,开放的书籍,开放的世界

定量研究和数据分析

[编辑 | 编辑源代码]

在研究人员进行实验和/或调查后,他/她所获得的信息被称为定量数据。这种信息是可衡量的,并侧重于数值,与描述性更强的定性数据不同。收集到定量数据后,研究人员会对研究结果进行分析。

定量分析
对观察结果进行数值表示和处理,以便描述和解释这些观察结果所反映的现象。

数据的量化

[编辑 | 编辑源代码]

研究人员使用编码过程来分析他们的发现。在进行调查时,一些数据是数值的,而其他数据必须从定性转换为定量。

开发代码类别

[编辑 | 编辑源代码]
编码
将原始数据转换为适合机器处理和分析的标准化形式的过程。

编码是指将一组数据分配数值,以简化分析,并可用于量化显性内容和隐性内容。在调查研究中,显性内容和隐性内容之间的区别非常重要。
显性内容是指有形的或具体的表面内容(数据),与隐性内容相区别,隐性内容是指这些信息背后的潜在含义。
显性内容的优点是易于测试和可靠,缺点是有效性。隐性内容是交流的潜在含义,与显性内容相区别。隐性内容的优点是它被设计为完美地挖掘交流的潜在含义,其缺点是可靠性和特异性。

代码簿构建

[编辑 | 编辑源代码]

为了使编码数据易于理解和管理,需要创建一个代码簿。这本书解释了编码过程,并充当数据集中定位变量的指南。代码簿还描述了每个代码的含义。这些代码簿有两个目的,首先,它们是编码过程的指南。其次,代码簿充当研究中定位变量的指南。

数据输入

[编辑 | 编辑源代码]

定量编码的例子

  • 一项调查在 1-9 的范围内对回复进行排名,并让受访者选择九个选项中的一个。
  • 其他变量,例如性别或政治倾向,必须分配一个数值才能进行定量分析
    • 例如:男性=1;女性=2 或者 民主党=1;共和党=2;无党派=3
  • 由于年龄已经用数字表示,研究人员可以选择不为这些数据开发编码系统。

编码在分析数据中是必要的,因为必须能够将原始数据转换为有意义的信息。

单变量分析

[编辑 | 编辑源代码]

一旦数据被正确编码,它就可以被分析。一种分析类型是单变量数据分析,其中一个变量(例如性别、种族或社会经济地位)被单独分析,以便更好地描述。
有许多不同的方法可以分析这些数据,包括

  • 频率分布:计算样本中数据收集的次数。
  • 平均值:表示数据总体趋势的术语。
    • 均值:数据总和除以数据点数。
    • 中位数:如果数据按降序或升序排列,则是数据中的“中间数”。
    • 众数:出现频率最高的数据点。
  • 离散度或方差:衡量数据围绕中心值(例如均值)的范围。
  • 标准差:也衡量围绕均值的离散度;但是以一种样本的 68% 将落在均值正负一个标准差范围内的形式。

技术先进的程序(如 Microsoft Excel)能够从一组数据中计算均值、中位数、众数、方差和标准差。这是分析一组数据非常方便且简单的方法。

理解分布和离散度

[编辑 | 编辑源代码]
正态分布图通常用作图表来显示标准差和方差。

如果很大一部分值的紧密聚集在均值附近,则表示标准差低;而如果值在所有可能值的范围内广泛分布,则表示标准差高。简而言之,低离散度和标准差表明值彼此相当接近,变化量相对较小。

连续变量和离散变量

[编辑 | 编辑源代码]
  • 连续变量是指其属性形成稳定进展的变量。
  • 离散变量是指其属性彼此分离的变量。

因此,连续变量(如高度)可以具有无限个可能的值,而离散变量(如年份)只能具有特定的值(2010 或 2011,但不能为 2010.5)。Microsoft Excel 也可以轻松计算这两个值。

单变量分析可以用图表或图形直观地描述。在构建图表或图形时,最好保持简单,以便更好地理解。

双变量分析

[编辑 | 编辑源代码]
双变量分析
同时分析两个变量,目的是确定它们之间的经验关系。

双变量分析侧重于变量之间的关系,而不是组的比较。双变量分析探讨了自变量和因变量之间的统计关联。它的目的是通常是解释性的,而不仅仅是描述性的。

构建列联表

[编辑 | 编辑源代码]

双变量分析的结果通常以列联表的形式呈现,列联表是为了揭示自变量对因变量的影响而构建的。

列联表
一种以百分比分布形式展示变量之间关系的格式

如何构建和解读双变量表

  1. 根据自变量的属性将个案分为不同的组别
  2. 用因变量的属性描述子组
  3. 通过比较自变量子组在因变量特定属性上的差异来解读表格

多元分析简介

[编辑 | 编辑源代码]
多元分析
对多个变量之间同时关系的分析。它使用自变量、中介变量和先导变量来检验和解释因变量的变异。
  • 中介变量在时间顺序上或作为因果机制位于自变量和因变量之间。
  • 先导变量位于自变量之前。


多元表可以根据更复杂的子组描述创建,遵循与双变量表类似的框架。这是由于使用了多个自变量,并且因变量依赖于这些自变量来显示任何关系。

例如参加宾果比赛。假设之前认为老年人通常会参加这种游戏,我们可以根据年龄将参与者分成几组。当年龄差异被分解成不同的子组时,年龄差异将成为我们的自变量,并会显示出与因变量(参加宾果比赛)的关系。

信息传播和其他问题

[编辑 | 编辑源代码]

为了展示数据,通常使用表格而不是条形图等,因为展示多个自变量会很复杂。这些表格也有助于排除意见,找到真实的事实和数据。
定量数据分析的一个问题是存在偏差的可能性。研究人员倾向于偏爱某个发现是很常见的。为了帮助消除这种偏差,在研究之前制定详细的假设是有益的。通过记录可能无法证明你的假设正确的结论,对于研究类似主题的其他研究人员来说,了解你的结果是有益的,因为它可以帮助他们进行研究。如果研究过程正确,并且在表格中适当展示,则可以在研究有争议的主题时收集和展示数据,而不会有任何偏差。

研究技巧

[编辑 | 编辑源代码]

在进行定量分析时,需要记住一些有用的研究技巧

  • 使用百分比进行比较是一个好主意,并为因变量的每个类别创建这些百分比
  • 应重新编码变量,以便进行想要进行的比较,并且可以以不同的方式进行这种重新编码。
  • 选择一个具有足够解释力的自变量,以使其有意义。
华夏公益教科书