社会统计学:关键术语
外观
< 社会统计学
这是一个包含每章关键术语的列表,方便参考。
- 第一章
- 概念化是对社会世界某些方面的理论发展过程。
- 案例是指收集了数据的个人或实体。
- 数据库是指将数据按变量和案例进行排列。
- 因变量是指在模型中被认为取决于其他变量的变量。
- 概括是指将关于特定情况的理论转化为适用于多种情况的理论的过程。
- 自变量是指在模型中被认为会导致因变量的变量。
- 元数据是指不打算包含在分析中的案例的附加属性。
- 操作化是指将社会理论转化为关于真实数据的具体假设的过程。
- 散点图是指非常简单的统计模型,它以图形方式显示数据。
- 统计模型是指对现实世界的数学简化。
- 变量是指案例的分析意义上的属性。
- 第二章
- 预期值是指仅根据自变量的值,因变量预期具有的值。
- 线性回归模型是指统计模型,其中因变量的预期值被认为根据自变量的值以直线方式上升或下降。
- 离群值是指统计模型中远离大多数其他数据点的点。
- 回归误差是指线性回归模型中因变量的预期值与其实际值之间的差异程度。
- 稳健性是指统计模型在操作化发生变化时仍能给出类似结果的程度。
- 斜率是指因变量预期值的变化量除以自变量的值的变化量。
- 第三章
- 外推法是指使用回归模型来计算观测数据范围内的预测值的过程。
- 截距是指回归线在散点图中与因变量轴交叉的位置。
- 内插法是指使用回归模型来计算观测数据范围内的预测值的过程。
- 预测值是指对应于选定自变量值的因变量的预期值。
- 回归系数是指定义回归线的斜率和截距。
- 第四章
- 条件均值是指特定案例组的因变量的预期值。
- 自由度是指模型中实际可以自由变化的误差数量。
- 均值模型是指非常简单的统计模型,其中一个变量只有一个预期值,即其均值。
- 均值是指变量的预期值。
- 参数是指与统计模型相关的数字,例如均值和回归系数。
- 回归误差标准差是指衡量回归模型中误差传播程度的指标。
- 标准差是指衡量变量传播程度的指标,它与均值模型中误差的传播程度相同。
- 第五章
- 案例特定误差是指由于数百万种影响和经历导致特定案例的值与其预期值不同而产生的误差。
- 描述性统计是指使用统计方法来描述我们实际掌握的数据。
- 推论统计是指使用统计方法来对我们数据所代表的现实世界特征进行推断。
- 测量误差是指由于变量测量中的意外、错误或误解而产生的误差。
- 观察参数是指根据我们实际掌握的数据,对均值、截距和斜率等参数进行实际观察得到的值。
- 抽样误差是指由于研究对象被随机包含在样本中的可能性而产生的误差。
- 标准误差是指衡量与观察参数相关的误差程度的指标。
- 真实参数是指根据世界真实(但未观察到)的特征,对均值、截距和斜率等参数进行真实评估得到的值。
- 第六章
- 配对样本是指每个案例代表两个相关观察值的数据库。
- 统计显著性是指统计结果如此之大,以至于不太可能仅仅是随机发生的。
- 实质性显著性是指统计结果足够大,以至于在研究人员和整个社会看来具有意义。
- t 统计量是指基于观察参数的指标,用于对真实参数的可能性进行特定推断。
- 第七章
- 补充控制变量是指在多元回归模型中,通过揭示感兴趣自变量的解释力来补充感兴趣自变量的控制变量。
- 竞争控制变量是指在多元回归模型中,通过分割感兴趣自变量的解释力来与感兴趣自变量竞争的控制变量。
- 控制变量是指在多元回归分析中“保持不变”的变量,目的是突出显示特定感兴趣自变量的影响。
- 多因模型是指具有一个因变量但有两个或更多自变量的统计模型。
- 多元线性回归模型是指统计模型,其中因变量的预期值被认为根据两个或更多自变量的值以直线方式上升或下降。
- 预测变量是指回归模型中的自变量。
- 第八章
- 相关性 (r)是指衡量两个变量之间关系强度的指标,取值范围从 r = −1(完全负相关)到 r = 0(无相关性)再到 r = +1(完全正相关)。
- R2是指衡量回归模型解释因变量总变异比例的指标。
- 标准化系数是指使用标准化变量估计的回归模型的系数。
- 标准化变量是指通过从每个观测值中减去均值,然后除以标准差来进行变换的变量。
- 非标准化系数是指使用原始非标准化变量估计的回归模型的系数。
- 非标准化变量是指以其原始单位表示的变量。
- 第九章
- 基本模型是指初始模型,其中包含分析中所有非特定理论兴趣的背景自变量,用于回归分析。
- 混杂变量是指可能同时影响因变量和感兴趣自变量的变量。
- 解释模型是指主要用于评估不同理论以解释案例之间因变量值差异的回归模型。
- 简约性是指使用简单易懂和解释的模型的优点。
- 预测模型是指主要用于对因变量作为结果进行预测的回归模型。
- 饱和模型是指最终模型,其中包含分析中一系列模型中使用过的所有变量。
- 第十章
- 方差分析 (ANOVA)是指一种回归模型,它关注的是由分类变量解释的因变量总变异的比例。
- ANOVA 变量是指回归模型中的数值变量,它们一起描述了分类组成员的影响。
- 分类变量是指将案例划分为两个或更多组的变量。
- 混合模型是指包含 ANOVA 组件和普通自变量的回归模型。
- 数值变量是指取数值变量的变量,这些数值变量代表案例从较小数字到较大数字的有意义排序。
- 参考组是指在 ANOVA 变量中被隔离,并且没有明确包含在 ANOVA 模型中的组。
- 第十一章
- 交互作用是指交互模型中交互变量的系数。
- 交互模型是指允许某些变量的斜率对于不同的分类组有所不同的回归模型。
- 交互变量是指通过将 ANOVA 变量乘以感兴趣的自变量来创建的变量。
- 截距效应是指交互模型中 ANOVA 变量的系数。
- 主效应是指交互模型中感兴趣自变量在参考组的系数。