跳转至内容

放射肿瘤学/医学统计/卡方检验

来自维基教科书,开放的书籍,开放的世界


Χ2 (卡方)


  • 用于比较两种分类方案,每种方案可能有多个类别
  • 目的是确定观察到的数据是否(或不)与假设 H0 一致:不同组中结果的概率相同
  • 用于近似 费舍尔精确检验 (2x2) 用于大量数据
    • 估计的准确性取决于每个单元格中的总观察次数
    • 预期观察值(根据实际观察值计算;见下文)在每个单元格中至少应为 5
  • 用于扩展 费舍尔精确检验 用于比较具有 >2 个类别的分类方案

Χ2 用于 2x2 表格

[编辑 | 编辑源代码]
  • 用于表格,这些表格对于 费舍尔精确检验 太大
  • 该过程是并行的;请参阅该页面以了解初始设置的详细信息
2x2 表格
  结果 1 结果 2 总数
组 1 O11 O12 R1
组 2 O21 O22 R2
总数 C1 C2 N
 
2x2 表格示例
  篮球 垒球/棒球 总数
男生 12 14.7 27
女生 13 15.3 28
总数 25 30 55
  • 首先假设 H0 为真,并且 p0 = p1 = p2
  • 根据观察到的总数计算预期的 2x2 表格
    • 预期总体“成功率”为 p0 = C1 / N
    • 使用 p0 和观察到的组 1/2、结果 1/2 数,计算预期的 2x2 表格
  • 通过计算检验统计量 T 将预期表格与观察到的表格进行比较
  • 计算 T 的一种方法是评估每个单元格中观察值和预期值之间的比例差异,然后将它们全部加起来
    • T = ((O11-E11)2/E12) + ((O12-E12)2/E12) + ((O21-E21)2/E21) + ((O22-E22)2/E22)
  • 经过一些巧妙的数学运算,可以从原始观察到的表格中更简单地计算出来
    • T = N * (|O11 * O22 - O12 * O21| - 1/2*N)2 / R1 * R2 * C1 * C2
  • 由于 T 是从观察值与预期值之差推导出来的,因此 T 越大,表格的差异就越大,H0 的可能性就越小
  • 为了计算显著性水平,我们需要评估观察到的表格是由于随机抽样造成的可能性,这与 T 的大小有关。我们还需要评估所有可能观察到的其他表格的可能性(同样,与费舍尔检验相同)
  • 当 H0 为真时,T 的概率分布近似于 Χ2 函数的概率分布
  • 因此,我们可以通过在 T 水平上评估 Χ2 函数(通过在表格中查找它)来近似地确定观察到的 T 的概率
  • 由于这些是近似值,因此该表通常给出临界值
Χ2 用于 2x2 表格
概率 0.25 0.10 0.05 0.01 0.005 0.001
T 1.323 2.706 3.841 6.635 7.879 10.83
  • 这是观察到的结果(以及任何可能的结果比这不太可能)仅仅是由于随机抽样而发生的概率

Χ2 用于 2x2 表格示例

[编辑 | 编辑源代码]
观察到的
  移植物排斥 植入
低细胞剂量 17 19
高细胞剂量 4 28
 
预期 (计算)
  移植物排斥 植入
低细胞剂量 11 25
高细胞剂量 10 22
  • T = 8.01
  • 从上面的 Χ2 表格中,p 在 0.005 和 0.001 之间。
  • 因此我们可以得出结论 p < 0.005 并且高细胞剂量与植入密切相关
华夏公益教科书