配对检验导论
欢迎来到配对检验 (paired tests) 的世界!如果你曾经好奇一种新的能量饮品是否真的能让人跑得更快,或者补习班是否真的能提升学生的成绩,那你来对地方了。这些检验是 Paper 2: Statistical Inference(统计推论) 的一部分。
在统计学中,我们经常需要比较两组数据。有时候这两组数据是完全独立的(例如比较伦敦学生与曼彻斯特学生的身高)。但数据通常以配对 (pairs) 的形式出现。这发生在我们对同一个人进行两次测量(例如“之前”与“之后”)或使用“匹配对”(matched pairs)(例如同卵双胞胎)的情况下。
为什么要使用配对检验? 它们非常强大,因为它们能“抵消”个体差异。如果我们对你进行药物测试,我们是将你的结果与你自己的基准线进行比较,而不是与一个可能拥有完全不同新陈代谢能力的陌生人进行比较!
1. 核心概念:处理差值
所有配对检验的“秘密武器”在于,我们实际上不会分开看待两组原始数据,而是建立一个名为差值 (Differences) (\(d\)) 的新数据集。
例子: 如果一名学生在课程前的分数是 60 分,课程后是 65 分,那么他们的差值就是 \(65 - 60 = 5\)。我们对研究中的每一对数据执行此操作,然后对这些数字进行检验。
快速回顾:
1. 从两列相关数据开始。
2. 计算每一对的差值:\(d = x_1 - x_2\)。
3. 对这些差值 (\(d\)) 进行假设检验。
2. 符号检验 (Sign Test)(非参数)
符号检验是最简单的配对检验。它不在乎某人改善了多少;它只关心变化的方向。
何时使用: 当你拥有配对数据,但不想对分布形态做任何假设时,请使用此检验。它非常适合小样本或数据较“乱”的情况。
运作方式(步骤说明):
1. 计算每一对的差值。
2. 如果差值为正,则赋予加号 (+);如果为负,则赋予减号 (-)。
3. 忽略任何差值为零的对(它们会从样本大小 \(n\) 中剔除)。
4. 你的检验统计量通常是出现次数较少的符号数量。
5. 将此值与二项分布表中的临界值进行比较,其中 \(n\) 是你非零对的数量,\(p = 0.5\)。
比喻: 想象一个“赞 / 倒赞”系统。我们不在乎某人是稍微喜欢还是非常喜欢这部电影;我们只统计有多少人给它“赞”。
重点总结: 符号检验比较“弱”(不太容易找到显著结果),因为它舍弃了关于差值大小的信息,但它非常稳健 (robust),因为它适用于任何数据。
3. 威尔科克森符号秩检验 (Wilcoxon Signed-Rank Test)(非参数)
威尔科克森符号秩检验比符号检验进阶了一步。它不仅看方向 (+) 或 (-),还透过排序来考虑差值的相对大小。
假设: 为了使此检验有效,你必须假设差值的分布是对称的。
运作方式(步骤说明):
1. 计算所有对的差值。
2. 暂时忽略符号,将差值按绝对值从小到大排序(1 为最小差值)。
3. 如果出现平手(数值相同),则给予它们排名平均值。
4. 现在,将符号放回排名中(例如,如果 +5 的差值排在第 3 名,则保持为 3;如果 -5 的差值排在第 3 名,则变成“负秩”)。
5. 将正秩 (\(W_+\)) 和负秩 (\(W_-\)) 分别求和。
6. 你的检验统计量 \(T\) 是这两个总和中的较小者。
常见错误: 学生经常忘记忽略差值为零的数据。如果“之前”和“之后”相同,那么在开始排名之前,该对数据必须被删除!
你知道吗? 此检验比符号检验强大得多,因为它认可巨大的改善应比微小的改善更具权重。
4. 配对 t 检验 (Paired t-test)(参数)
当你的数据“表现良好”时,配对 t 检验是“黄金标准”。它使用差值的实际数值,而不仅仅是排名。
假设: 此检验仅在差值的总体呈常态分布时有效:\(d \sim N(\mu_d, \sigma_d^2)\)。
假设:
通常我们检验是否存在任何变化。
\(H_0: \mu_d = 0\)(平均差值为零)
\(H_1: \mu_d \neq 0\)(双尾)或 \(\mu_d > 0 / \mu_d < 0\)(单尾)
公式:
检验统计量计算如下:\(t = \frac{\bar{d} - \mu_d}{s_d / \sqrt{n}}\)
其中:
- \(\bar{d}\) 是样本差值的平均值。
- \(s_d\) 是这些差值的标准差。
- \(n\) 是配对的数量。
记忆小撇步: 将 t 检验中的 "t" 想象成代表 "Typical"(典型) 或 "Top-tier"(顶级)。它是最精确的检验,但要求数据必须呈常态分布。
5. 选择正确的检验
考试中最大的挑战之一是决定使用哪种检验。别担心,如果这看起来很棘手,只需遵循这个逻辑路径:
第 1 步:它是配对的吗?
是否对一个人有两次测量?或者是匹配对(如双胞胎)?如果是,那就是配对检验。
第 2 步:检查差值的分布
- 它是常态的吗? 使用 配对 t 检验 (Paired t-test)。
- 它不是常态,但对称吗? 使用 威尔科克森符号秩检验 (Wilcoxon Signed-Rank Test)。
- 两者皆非,或者信息极少? 使用 符号检验 (Sign Test)。
快速回顾表:
符号检验: 无假设。仅使用符号 (+/-)。检验力较低。
威尔科克森: 假设对称性。使用排名。检验力中等至高。
配对 t 检验: 假设常态性。使用实际数值。检验力最高。
6. 在情境中解释结果
一旦你得到 \(p\)-value 或将检验统计量与临界值进行比较,就必须写出结论。Pearson Edexcel 的考官非常看重情境!
好的结论范例:
“在 5% 的显著性水平下,有足够的证据显示运动员在冥想练习后,平均心率有所下降 (\(p = 0.032 < 0.05\))。我们拒绝虚无假设。”
糟糕的结论范例:
“拒绝 H0。结果是显著的。”(这会因为缺乏情境描述而失分!)
重点提示:
- 始终说明你所使用的显著性水平。
- 始终回顾题目中的现实世界对象(例如:“药物”、“学生”、“反应时间”)。
- 永远不要说结果是“确定的”——使用如“显示出”、“有证据表明”等措辞。
总结检查清单
在你继续之前,请确保你能:
1. 从两列数据中计算出一组差值。
2. 辨识数据何时为“配对”与“独立”。
3. 说明威尔科克森(对称性)和配对 t 检验(常态性)的具体假设。
4. 正确地对数据进行排名,并透过平均处理平手情况。
5. 为符号检验使用二项分布表。