Paired tests

配对检验导论

欢迎来到配对检验 (paired tests) 的世界！如果你曾经好奇一种新的能量饮品是否真的能让人跑得更快，或者补习班是否真的能提升学生的成绩，那你来对地方了。这些检验是 Paper 2: Statistical Inference（统计推论） 的一部分。

在统计学中，我们经常需要比较两组数据。有时候这两组数据是完全独立的（例如比较伦敦学生与曼彻斯特学生的身高）。但数据通常以配对 (pairs) 的形式出现。这发生在我们对同一个人进行两次测量（例如“之前”与“之后”）或使用“匹配对”(matched pairs)（例如同卵双胞胎）的情况下。

为什么要使用配对检验？ 它们非常强大，因为它们能“抵消”个体差异。如果我们对你进行药物测试，我们是将你的结果与你自己的基准线进行比较，而不是与一个可能拥有完全不同新陈代谢能力的陌生人进行比较！

1. 核心概念：处理差值

所有配对检验的“秘密武器”在于，我们实际上不会分开看待两组原始数据，而是建立一个名为差值 (Differences) (\(d\)) 的新数据集。

例子： 如果一名学生在课程前的分数是 60 分，课程后是 65 分，那么他们的差值就是 \(65 - 60 = 5\)。我们对研究中的每一对数据执行此操作，然后对这些数字进行检验。

快速回顾：
1. 从两列相关数据开始。
2. 计算每一对的差值：\(d = x_1 - x_2\)。
3. 对这些差值 (\(d\)) 进行假设检验。

2. 符号检验 (Sign Test)（非参数）

符号检验是最简单的配对检验。它不在乎某人改善了多少；它只关心变化的方向。

何时使用： 当你拥有配对数据，但不想对分布形态做任何假设时，请使用此检验。它非常适合小样本或数据较“乱”的情况。

运作方式（步骤说明）：

1. 计算每一对的差值。
2. 如果差值为正，则赋予加号 (+)；如果为负，则赋予减号 (-)。
3. 忽略任何差值为零的对（它们会从样本大小 \(n\) 中剔除）。
4. 你的检验统计量通常是出现次数较少的符号数量。
5. 将此值与二项分布表中的临界值进行比较，其中 \(n\) 是你非零对的数量，\(p = 0.5\)。

比喻： 想象一个“赞 / 倒赞”系统。我们不在乎某人是稍微喜欢还是非常喜欢这部电影；我们只统计有多少人给它“赞”。

重点总结： 符号检验比较“弱”（不太容易找到显著结果），因为它舍弃了关于差值大小的信息，但它非常稳健 (robust)，因为它适用于任何数据。

3. 威尔科克森符号秩检验 (Wilcoxon Signed-Rank Test)（非参数）

威尔科克森符号秩检验比符号检验进阶了一步。它不仅看方向 (+) 或 (-)，还透过排序来考虑差值的相对大小。

假设： 为了使此检验有效，你必须假设差值的分布是对称的。

运作方式（步骤说明）：

1. 计算所有对的差值。
2. 暂时忽略符号，将差值按绝对值从小到大排序（1 为最小差值）。
3. 如果出现平手（数值相同），则给予它们排名平均值。
4. 现在，将符号放回排名中（例如，如果 +5 的差值排在第 3 名，则保持为 3；如果 -5 的差值排在第 3 名，则变成“负秩”）。
5. 将正秩 (\(W_+\)) 和负秩 (\(W_-\)) 分别求和。
6. 你的检验统计量 \(T\) 是这两个总和中的较小者。

常见错误： 学生经常忘记忽略差值为零的数据。如果“之前”和“之后”相同，那么在开始排名之前，该对数据必须被删除！

你知道吗？ 此检验比符号检验强大得多，因为它认可巨大的改善应比微小的改善更具权重。

4. 配对 t 检验 (Paired t-test)（参数）

当你的数据“表现良好”时，配对 t 检验是“黄金标准”。它使用差值的实际数值，而不仅仅是排名。

假设： 此检验仅在差值的总体呈常态分布时有效：\(d \sim N(\mu_d, \sigma_d^2)\)。

假设：

通常我们检验是否存在任何变化。
\(H_0: \mu_d = 0\)（平均差值为零）
\(H_1: \mu_d \neq 0\)（双尾）或 \(\mu_d > 0 / \mu_d < 0\)（单尾）

公式：

检验统计量计算如下：\(t = \frac{\bar{d} - \mu_d}{s_d / \sqrt{n}}\)
其中：
- \(\bar{d}\) 是样本差值的平均值。
- \(s_d\) 是这些差值的标准差。
- \(n\) 是配对的数量。

记忆小撇步： 将 t 检验中的 "t" 想象成代表 "Typical"（典型） 或 "Top-tier"（顶级）。它是最精确的检验，但要求数据必须呈常态分布。

5. 选择正确的检验

考试中最大的挑战之一是决定使用哪种检验。别担心，如果这看起来很棘手，只需遵循这个逻辑路径：

第 1 步：它是配对的吗？

是否对一个人有两次测量？或者是匹配对（如双胞胎）？如果是，那就是配对检验。

第 2 步：检查差值的分布

它是常态的吗？ 使用 配对 t 检验 (Paired t-test)。
它不是常态，但对称吗？ 使用 威尔科克森符号秩检验 (Wilcoxon Signed-Rank Test)。
两者皆非，或者信息极少？ 使用 符号检验 (Sign Test)。

快速回顾表：
符号检验： 无假设。仅使用符号 (+/-)。检验力较低。
威尔科克森： 假设对称性。使用排名。检验力中等至高。
配对 t 检验： 假设常态性。使用实际数值。检验力最高。

6. 在情境中解释结果

一旦你得到 \(p\)-value 或将检验统计量与临界值进行比较，就必须写出结论。Pearson Edexcel 的考官非常看重情境！

好的结论范例：
“在 5% 的显著性水平下，有足够的证据显示运动员在冥想练习后，平均心率有所下降 (\(p = 0.032 < 0.05\))。我们拒绝虚无假设。”

糟糕的结论范例：
“拒绝 H0。结果是显著的。”（这会因为缺乏情境描述而失分！）

重点提示：
- 始终说明你所使用的显著性水平。
- 始终回顾题目中的现实世界对象（例如：“药物”、“学生”、“反应时间”）。
- 永远不要说结果是“确定的”——使用如“显示出”、“有证据表明”等措辞。

总结检查清单

在你继续之前，请确保你能：
1. 从两列数据中计算出一组差值。
2. 辨识数据何时为“配对”与“独立”。
3. 说明威尔科克森（对称性）和配对 t 检验（常态性）的具体假设。
4. 正确地对数据进行排名，并透过平均处理平手情况。
5. 为符号检验使用二项分布表。

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。

配对检验导论

1. 核心概念：处理差值

2. 符号检验 (Sign Test)（非参数）

运作方式（步骤说明）：

3. 威尔科克森符号秩检验 (Wilcoxon Signed-Rank Test)（非参数）

运作方式（步骤说明）：

4. 配对 t 检验 (Paired t-test)（参数）

假设：

公式：

5. 选择正确的检验

第 1 步：它是配对的吗？

第 2 步：检查差值的分布

6. 在情境中解释结果

总结检查清单

准备好测试自己了吗？

更多Statistics (9ST0)章节

立即实践所学