费希尔精确检验 (2x2)
- 在较小的医学研究中非常常见
- 适用于二元数据
- 评估两个二元分类之间的关联
- 特征
- "组 1" 与 "组 2"
- 例如:男性/女性、给予治疗/未给予治疗、治疗类型 1/治疗类型 2、高剂量/低剂量等。
- 结果
- "成功" 与 "失败"
- 例如:活着/死亡、响应/无响应、复发/无复发等。
- 这定义了一个 2x2 矩阵
费希尔的 2x2 矩阵
|
结果 1 |
结果 2 |
组 1 |
|
|
组 2 |
|
|
|
|
|
- 用于小样本量(通常少于 50),因为计算能力有限。有关近似值的更多信息,请参见Χ2 检验
- 检验的假设 (H0) 是两个分类之间没有关联
- 费希尔检验确定该假设与数据的吻合程度
- 组 1 与结果 1(例如,男性 - 生存)相关的概率为 p1
- 组 2 与结果 2(例如,女性 - 生存)相关的概率为 p2
- 检验假设 (H0) 是没有相关性,并且 p1 = p2
- 因此,总体 "成功" 率(结果 1)p0 = p1 = p2,可以计算为(组 1 结果 1 + 组 2 结果 1)/(总体)。
- 观察:我们观察到研究中给定的结果 1 的总数
- 问题是,结果 1 在组 1 和组 2 之间的划分是否满足 p1 = p2,或者它们是否划分成不可能满足 p1 = p2?
- 为了客观地评估这个问题,我们建立了表格,显示了在给定组 1 和组 2 中固定数量的案例,以及结果 1 和结果 2 中固定数量的事件的情况下,我们可能看到的所有可能结果。
- 检验统计量 (T) 是组 1 中结果 1("成功")的数量。
- 鉴于组 1 和组 2 中的案例数量是已知的,并且结果 1 和结果 2 事件的数量是已知的,因此知道 T 就能确定矩阵中的所有其他点。
费希尔检验
|
结果 1 |
结果 2 |
总计 |
组 1 |
T |
R1-T |
R1 |
组 2 |
C1-T |
C2+T-R1 |
R2 |
总计 |
C1 |
C2 |
N |
- 然后,我们评估每个可能结果(包括实际观察到的结果)在随机抽样中由于偶然发生而出现的概率
- 二项式系数计算用于找到表格 T(t 的范围)在随机抽样中偶然出现的概率
- 但是,由于这些计算量很大,通常使用统计表或软件来评估 T 的概率
- 实际结果的概率加上由于偶然随机抽样而发生的更不可能结果的概率定义了显著性水平 (p)
- 如果这些结果的概率小于 5%(p<0.05),通常会拒绝关于两组之间没有差异的检验假设
- 假设
- 给定组中每个成员的结果概率相同;它不会因成员而异。随机抽样确保了这一点
- 一个成员的结果不会影响另一个成员的结果
- 改编自PMID 6092550,如使用和理解医学统计中所示。
- 在我们上面的例子中,观察到 4 次复发。问题是,复发率是否与治疗类型(大区域放疗与小区域放疗)相关?
- 如果 H0 假设为真,并且两个失败率可比,并且也与整个接受放疗人群的失败率可比,那么 p0 = 4/259 = 0.015
- 因此,在小区域放疗组中观察到的预期失败次数为 23 个病人 x 0.015 = 0.4 次失败。
- 但是,观察到 2 次失败。这可能是由于偶然因素,还是不是?
- 在随机抽样中观察到 4 次失败有 5 种可能性(可能性 2 是实际观察到的结果)。
可能性 0
|
复发 |
无复发 |
小区域放疗 |
0 |
23
|
大区域放疗 |
4 |
232
|
|
|
可能性 1
|
复发 |
无复发 |
小区域放疗 |
1 |
22
|
大区域放疗 |
3 |
233
|
|
|
可能性 2
|
复发 |
无复发 |
小区域放疗 |
2 |
21
|
大区域放疗 |
2 |
232
|
|
|
可能性 3
|
复发 |
无复发 |
小区域放疗 |
3 |
20
|
大区域放疗 |
1 |
235
|
|
|
可能性 4
|
复发 |
无复发 |
小区域放疗 |
4 |
19
|
大区域放疗 |
0 |
236
|
|
复发率
|
可能性 0 |
可能性 1 |
可能性 2 (观察到的) |
可能性 3 |
可能性 4 |
(预期的)
|
小区域放疗 |
0.000 |
0.044 |
0.087 |
0.130 |
0.174 |
0.015
|
- 然后,我们需要计算每个可能性发生的概率(通常由专业统计学家完成,有关更多详细信息,请参见下文)。
发生的概率
|
可能性 0 |
可能性 1 |
可能性 2 (观察到的) |
可能性 3 |
可能性 4 |
总计
|
小区域放疗 |
0.687 |
0.271 |
0.039 |
0.002 |
0.0001 |
1.000
|
- 我们最初的假设是,小区域放疗的失败概率与大区域放疗的失败概率相同,与接受放疗的整个潜在人群的失败概率相同。可能性 0(68.7%)和可能性 1(27.1%)与该假设相当一致。
- 实际观察结果(可能性 2)作为随机抽样过程的结果而发生的概率为 0.039(3.9%),这并不合理。可能性 3-5 比实际观察到的结果更不可能合理(0.2%,0.01%)。
- 显著性水平是观察到的结果概率之和(3.9%)以及更不可能的可能性概率之和(0.2%,0.01%)= 4.11%;表示为 p=0.04
- 在此示例中,拒绝了关于两组在两个结果方面没有差异的假设。结论:小区域放疗导致的失败明显更多。