跳转到内容

统计/测试数据/FtestANOVA

来自维基教科书,开放世界中的开放书籍

单因素方差分析F检验用于识别受试者效应之间是否存在差异。例如,为了调查某种新药对白细胞数量的影响,在实验中将该药给予三个不同的组,一组是健康人,一组是轻度患病者,一组是重度患病者。一般来说,方差分析可以识别该药对白细胞数量的影响在各组之间是否存在显著差异。显著指的是各组之间以及各组内部都将存在差异,但目的是调查各组之间的差异是否比各组内部的差异大。为了建立这样的实验,在计算F统计量之前,必须验证三个假设:独立样本、方差齐性和正态性。第一个假设表明,不同受试者的测量结果之间没有关系。方差齐性指的是实验中不同组(例如,药物与安慰剂)之间的方差相等。此外,正态性假设表明,这些组中的每一个的分布都应该近似于正态分布。

这种情况以如下方式建模。第个受试者在第组中的测量结果表示为

.

这意味着:第个受试者在第组中的测量结果受一般效应(由表示)、组效应(由表示)和个体贡献(由表示)的影响。

个体或随机贡献,通常称为扰动,被认为是独立的,正态分布的,都具有期望值为0和标准差为

为了使模型明确,组效应受以下条件约束

.

现在。一个符号说明:通常的做法是,通过在索引或索引的位置写一个点来表示一个或多个索引的平均值。例如

方差分析现在将总“方差”(以总“平方和”的形式)分为两部分,一部分是组内变异造成的,另一部分是组间变异造成的

.

我们看到误差平方和这一项

表示组内变异的总平方差,即每个测量值与其组平均值之间的平方差的总和,而因子平方和项

表示组间变异的总平方差,即每个组的平均值与其总体平均值之间的平方差的总和。

在无效应的零假设下

我们发现

服从自由度为 a(m-1) 的卡方分布,并且
服从自由度为 a-1 的卡方分布,

其中 是组数,而 是每组的人数。

因此,所谓的均方和的商

可以用作检验统计量

在零假设下,其服从自由度为 的 F 分布(分子)和 的 F 分布(分母),因为未知参数 在商中被抵消,因此不发挥作用。

华夏公益教科书