Non-parametric tests - Further Mathematics (9649) - GCE A-Level - Higher 2 (H2)

欢迎来到无参数检验（Non-parametric Tests）的世界！

在你的 H2 数学旅程中，你可能已经花了很多时间与“正态分布”打交道。它是一条漂亮的钟形曲线，但现实世界的数据并不总是那么整齐！有时候，数据会出现偏态（skewed），或者我们的样本数太小，导致无法确定其背后的总体分布。

这就是无参数检验（Non-parametric tests）派上用场的时候了。你可以把它们想象成统计学界的“全地形车”。虽然参数检验（如 t-检验）需要一条平坦的“柏油路”（正态分布）才能顺畅运作，但无参数检验却能应付“崎岖地形”（任何形状的数据）。在本章中，我们将学习如何在不假设数据遵循特定分布的情况下进行假设检验。

1. 理解无参数检验

无参数检验通常被称为“无分布”检验（distribution-free tests），因为它们不依赖于数据来自特定概率分布（如正态分布）的假设。

无参数检验的优点：

• 灵活性： 它们可以用于非正态分布的数据。
• 简单性： 它们通常基于数据的秩（ranks）或简单的符号（+ 或 -），而不是平均值或方差等复杂的参数。
• 稳健性： 它们较少受到极端值（outliers）的影响，因为它们关注的是数据的顺序而非精确数值。

无参数检验的缺点：

• 检验力较低（Lower Power）： 如果数据确实是正态分布的，无参数检验的“检验力”会比参数检验低。这意味着它们较难侦测出错误的虚无假设。
• 信息量较少： 由于它们使用秩或符号，因此会“舍弃”了包含在原始数值中的部分特定信息。

快速复习小盒子：
如果你确定数据符合正态分布，请使用参数检验（如 t-检验）。
如果分布未知或明显不是正态分布，请使用无参数检验。

2. 符号检验（The Sign Test）

符号检验（Sign Test）是最简单的无参数检验。我们用它来检验关于总体中位数（population median，记为 \( m \)）的假设。它被称为符号检验，是因为我们只关心数据点是在假设中位数的上方（+）还是下方（-）。

设立假设

虚无假设 \( H_0 \)：总体中位数等于特定值 \( m_0 \)。
\( H_0: m = m_0 \)

对立假设 \( H_1 \)：
• \( H_1: m \neq m_0 \)（双尾检验）
• \( H_1: m > m_0 \)（右尾检验）
• \( H_1: m < m_0 \)（左尾检验）

检验步骤（Step-by-Step）

1. 将样本中的每个数据值与假设的中位数 \( m_0 \) 进行比较。
2. 如果数值大于 \( m_0 \)，记录一个加号（+）。
3. 如果数值小于 \( m_0 \)，记录一个减号（-）。
4. 如果数值刚好等于 \( m_0 \)，我们忽略它，并相应地缩减样本大小 \( n \)。
5. 令 \( X \) 为加号的数量。在 \( H_0 \) 成立下，每个数值位于中位数上方或下方的概率均等。因此，检验统计量 \( X \) 遵循二项分布（Binomial Distribution）：
\( X \sim B(n, 0.5) \)

例子：假设你认为某咖啡店的中位数等待时间是 10 分钟。你观察了 10 位顾客，其中 8 人的等待时间超过 10 分钟（+），2 人少于 10 分钟（-）。由于 8 远大于预期的 5，你可能会拒绝 \( H_0 \)。

如果一开始觉得困难，别担心！ 只要记住：我们只是在计算有多少人落在围栏的哪一边。如果围栏真的是中位数，那应该会是一个 50/50 的比例。

3. Wilcoxon 配对样本符号秩检验（Wilcoxon Matched-Pair Signed Rank Test）

Wilcoxon 配对样本符号秩检验用于配对数据（例如对同一群人的“前后”测量）。它比符号检验更强大，因为它同时考虑了差异的方向（+ 或 -）和幅度（大小）。

假设

对于此检验，我们假设两个总体的分布形状相同，仅在位置上有所偏移。这意味着差异的分布是对称的。

设立假设

\( H_0 \)：两种处理方式之间没有差异（差异的总体中位数为零）。
\( H_1 \)：存在差异（差异的总体中位数不为零）。

检验步骤

1. 计算每对数据的差异 \( d_i \)（例如：后测减前测）。
2. 忽略任何差异为零的配对。
3. 取差异的绝对值 \( |d_i| \)，并由小到大进行排序（秩）（1, 2, 3...）。
课程笔记：本课程将排除秩数相同（tied）的情况。
4. 将原始符号（+ 或 -）重新分配回每个秩。
5. 计算 \( T^+ \)（正秩和）与 \( T^- \)（负秩和）。
6. 检验统计量 \( T \) 通常取 \( T^+ \) 和 \( T^- \) 中的较小值。将其与 Wilcoxon 临界值表进行比较。

类比： 想像两位运动员。符号检验只问“谁赢得多场比赛？”，而 Wilcoxon 检验则问“谁赢得多场比赛，且赢了多少距离？”。这使得它成为一个更精明的裁判！

重点总结： Wilcoxon 检验使用差异的秩，而不仅仅是方向。这使它能够比简单的符号检验捕捉到更多的信息。

4. 选择检验方法的总结

选择正确的检验方法就等于成功了一半。以下是快速指南：

1. 检验单一总体中位数？
使用符号检验（Sign Test）。

2. 检验配对样本的差异？
使用Wilcoxon 配对样本符号秩检验。

3. 数据符合正态分布且样本数小？
使用 t-检验（参数检验 - 在 3.3 节介绍）。

4. 数据不符合正态分布？
务必使用无参数选项（符号检验或 Wilcoxon 检验）。

你知道吗？ 无参数检验广泛应用于心理学和医学领域，研究人员经常使用“李克特量表”（如 1 到 5 星评分）。由于 1 星与 2 星之间的“差距”可能与 4 星和 5 星之间的“差距”不完全相同，这些检验非常适合用于分析此类数据！

成功检查清单

• 务必使用中位数一词清晰地陈述你的虚无假设 \( H_0 \) 和对立假设 \( H_1 \)。
• 对于符号检验，识别你的 \( n \) 以及检验统计量 \( X \sim B(n, 0.5) \)。
• 对于 Wilcoxon 检验，记住先对绝对差异进行排序，再放回符号。
• 始终在问题的情境下做出结论（例如：“在 5% 的显著性水平下，有足够证据显示中位数体重已经增加”）。

避免常见错误： 别忘了在符号检验和 Wilcoxon 检验中舍弃“零差异”！如果一个数据点等于假设的中位数，或者某个配对没有变化，这对我们判断数据倾向哪一方没有帮助，所以我们将其剔除并缩减 \( n \)。

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。

欢迎来到无参数检验（Non-parametric Tests）的世界！

1. 理解无参数检验

无参数检验的优点：

无参数检验的缺点：

2. 符号检验（The Sign Test）

设立假设

检验步骤（Step-by-Step）

3. Wilcoxon 配对样本符号秩检验（Wilcoxon Matched-Pair Signed Rank Test）

假设

设立假设

检验步骤

4. 选择检验方法的总结

成功检查清单

立即实践所学