Non-parametric tests - Further Mathematics A - H245 - Cambridge OCR A Level

欢迎来到无母数检验 (Non-Parametric Tests)！

在之前的统计学课程中，你可能使用过像 t 检验这类假设数据遵循特定规律（通常是常态分布）的检验方法。但如果你的数据杂乱无章、呈偏态，或者你根本不知道它的分布情况时该怎么办呢？这就是无母数检验 (Non-Parametric Tests) 发挥作用的时候了！你可以把它们想象成假设检验的“灵活版”。它们不在乎母体分布的形状，而是专注于数据的中位数 (median) 和排名 (ranks)。

快速回顾：在开始之前，请记住假设检验总是从虚无假设 (\(H_0\)) 和对立假设 (\(H_1\)) 开始。在本章中，我们通常是在检验母体中位数 (\(M\))。

1. 为何要采用无母数检验？

无母数检验通常被称为无分布检验 (distribution-free tests)。当遇到以下情况时，你应该选择使用它们：

样本量非常小。
数据呈偏态（不对称）。
数据为序位数据 (ordinal)（你可以将其排名，例如“第一、第二、第三”，但它们之间的间隔并不一定相等）。
你无法假设母体遵循常态分布。

主要区别：参数检验使用实际数值（算术平均数），而无母数检验使用数值的排名（它们从小到大排列时的位置）。

重点总结：无母数检验是统计学中的“叛逆者”——即使“常态分布”的标准规则被打破，它们依然有效！

2. 单样本符号检验 (Single-Sample Sign Test)

这是最简单的检验。它只关心观察值是高于 (+) 还是低于 (-) 假设的中位数。

运作步骤：

写出 \(H_0\)（例如 \(M = 50\)）和 \(H_1\)（例如 \(M > 50\)）。
针对每个数据点，如果它大于假设的中位数，记录为 +；如果较小，则记录为 -。
忽略任何与假设中位数完全相等的数值。
设 \(X\) 为正号的数量（若为双尾检验，则取正号或负号中数量较少者）。
在 \(H_0\) 成立的前提下，正号的数量遵循二项分布 (Binomial Distribution)：\(X \sim B(n, 0.5)\)，其中 \(n\) 是正号和负号的总数。
使用计算器计算概率（p值）并与显著水平进行比较。

类比：想像一个以中位数为平衡点的跷跷板。如果真实的中位数是 50，你会预期坐在“较高”一侧和“较低”一侧的人数各占一半。如果有远多于一半的人坐在“较高”的一侧，跷跷板就会倾斜，我们就会拒绝平衡点为 50 的假设！

3. 单样本威尔卡森符号等级检验 (Single-Sample Wilcoxon Signed-Rank Test)

符号检验虽然简单，但它丢弃了部分信息（它不在乎数值到底“大了多少”）。威尔卡森符号等级检验更强大，因为它考虑了差异的程度。

检验流程：

计算每个观察值与假设中位数之间的差值：\(d_i = x_i - M_0\)。
对这些差值进行排名，从小到大排列，暂时忽略正负号。（绝对值最小的差值获得第 1 名）。
将原始差值的正负号加回每个排名中（例如，如果差值是 -2 且获得了第 3 名，它就变成负向排名）。
计算正向排名的总和 (\(W_+\)) 和负向排名的总和 (\(W_-\))。
你的检验统计量 \(T\) 通常取 \(W_+\) 和 \(W_-\) 中的较小值。
将 \(T\) 与威尔卡森单样本表 (Wilcoxon Single-Sample table) 中的临界值进行比较。

常见错误：别忘了忽略差值为零的情况！如果某个观察值等于假设中位数，请剔除该数据并相应地减少 \(n\)。

重点总结：对于非常混乱的数据使用符号检验，但如果你想要一个考虑到差异大小、更“敏感”的检验，请使用威尔卡森符号等级检验。

4. 比较两个样本：配对与非配对

在进行检验之前，你必须决定你的数据集是“相关”的还是独立的。

配对样本 (Paired-Sample/Matched Pairs)

例子：测量 10 名学生运动前和运动后的脉搏。“前”和“后”的数据属于同一个人。我们使用符号检验或威尔卡森符号等级检验来检验差值（就像上面的单样本检验一样，只是检验中位数差值是否为 0）。

两样本 (Two-Sample/Unpaired)

例子：比较 10 名男生和 12 名女生的身高。这是两组独立的数据。我们使用威尔卡森秩和检验 (Wilcoxon Rank-Sum Test)（也称为曼-惠特尼 U 检验 (Mann-Whitney U Test)）。

5. 威尔卡森秩和检验 (Mann-Whitney U)

此检验用于判断两个独立的母体是否相同。

运作步骤：

将两个样本合并成一个大小为 \(N = m + n\) 的大清单。
将所有数值从 1 到 \(N\) 进行排名。
计算样本较小组的排名总和（设此总和为 \(R_m\)）。
检验统计量 \(W\) 就是该组的排名总和。
将 \(W\) 与威尔卡森秩和表 (Wilcoxon Rank-Sum tables) 进行比较。

你知道吗？统计表通常提供较小样本量 \(m\) 的临界值。如果你的组别大小不同，请务必按照表格说明来选取正确的数值！

6. 大样本的常态近似 (Normal Approximations)

当样本量 \(n\) 变大（通常 \(n > 20\)）时，威尔卡森表就不够用了。幸运的是，检验统计量开始遵循常态分布！

对于威尔卡森符号等级检验 (\(T\))：

平均数 \( \mu = \frac{1}{4}n(n+1) \)
变异数 \( \sigma^2 = \frac{1}{24}n(n+1)(2n+1) \)
\( T \sim N(\mu, \sigma^2) \)

对于威尔卡森秩和检验 (\(W\))：

平均数 \( \mu = \frac{1}{2}m(m+n+1) \)
变异数 \( \sigma^2 = \frac{1}{12}mn(m+n+1) \)
\( W \sim N(\mu, \sigma^2) \)

别担心，这看起来可能有点棘手！这些公式都会提供在你的公式手册中。只需记住，在计算 z 分数时要使用 0.5 的连续性修正 (continuity correction)，因为你正从离散的排名转向连续的常态曲线。

快速回顾栏

我该用哪个检验？

单样本（中位数）：符号检验或威尔卡森符号等级检验。
配对数据（前后对比）：使用差值进行符号检验或威尔卡森符号等级检验。
两组独立数据：威尔卡森秩和检验（曼-惠特尼 U 检验）。
大样本：使用常态近似公式。

记忆小撇步：Signed-Rank (符号等级) 用于 Same (相同) 的人（配对）。Rank-Sum (秩和) 用于 Separate (分开) 的组别。

总结清单

1. 排名：你排名正确吗？绝对差值最小的 = 第 1 名。
2. 假设：你的假设是关于中位数 (\(M\)) 而不是算术平均数吗？
3. 同分值：请记住，本课程的教学大纲排除了排名相同或观察值与中位数重合的问题，这让你的计算轻松不少！
4. 结论：务必将最终结论写在题目语境中。“有足够的证据显示在 5% 显著水平下，中位数分数有所增加。”

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。

欢迎来到无母数检验 (Non-Parametric Tests)！

1. 为何要采用无母数检验？

2. 单样本符号检验 (Single-Sample Sign Test)

运作步骤：

3. 单样本威尔卡森符号等级检验 (Single-Sample Wilcoxon Signed-Rank Test)

检验流程：

4. 比较两个样本：配对与非配对

配对样本 (Paired-Sample/Matched Pairs)

两样本 (Two-Sample/Unpaired)

5. 威尔卡森秩和检验 (Mann-Whitney U)

运作步骤：

6. 大样本的常态近似 (Normal Approximations)

对于威尔卡森符号等级检验 (\(T\))：

对于威尔卡森秩和检验 (\(W\))：

快速回顾栏

总结清单

立即实践所学