欢迎来到无母数检验 (Non-Parametric Tests)!

在之前的统计学课程中,你可能使用过像 t 检验这类假设数据遵循特定规律(通常是常态分布)的检验方法。但如果你的数据杂乱无章、呈偏态,或者你根本不知道它的分布情况时该怎么办呢?这就是无母数检验 (Non-Parametric Tests) 发挥作用的时候了!你可以把它们想象成假设检验的“灵活版”。它们不在乎母体分布的形状,而是专注于数据的中位数 (median)排名 (ranks)

快速回顾:在开始之前,请记住假设检验总是从虚无假设 (\(H_0\)) 和对立假设 (\(H_1\)) 开始。在本章中,我们通常是在检验母体中位数 (\(M\))。


1. 为何要采用无母数检验?

无母数检验通常被称为无分布检验 (distribution-free tests)。当遇到以下情况时,你应该选择使用它们:

  • 样本量非常小。
  • 数据呈偏态(不对称)。
  • 数据为序位数据 (ordinal)(你可以将其排名,例如“第一、第二、第三”,但它们之间的间隔并不一定相等)。
  • 你无法假设母体遵循常态分布。

主要区别:参数检验使用实际数值(算术平均数),而无母数检验使用数值的排名(它们从小到大排列时的位置)。

重点总结:无母数检验是统计学中的“叛逆者”——即使“常态分布”的标准规则被打破,它们依然有效!


2. 单样本符号检验 (Single-Sample Sign Test)

这是最简单的检验。它只关心观察值是高于 (+) 还是低于 (-) 假设的中位数。

运作步骤:

  1. 写出 \(H_0\)(例如 \(M = 50\))和 \(H_1\)(例如 \(M > 50\))。
  2. 针对每个数据点,如果它大于假设的中位数,记录为 +;如果较小,则记录为 -
  3. 忽略任何与假设中位数完全相等的数值。
  4. 设 \(X\) 为正号的数量(若为双尾检验,则取正号或负号中数量较少者)。
  5. 在 \(H_0\) 成立的前提下,正号的数量遵循二项分布 (Binomial Distribution):\(X \sim B(n, 0.5)\),其中 \(n\) 是正号和负号的总数。
  6. 使用计算器计算概率(p值)并与显著水平进行比较。

类比:想像一个以中位数为平衡点的跷跷板。如果真实的中位数是 50,你会预期坐在“较高”一侧和“较低”一侧的人数各占一半。如果有远多于一半的人坐在“较高”的一侧,跷跷板就会倾斜,我们就会拒绝平衡点为 50 的假设!


3. 单样本威尔卡森符号等级检验 (Single-Sample Wilcoxon Signed-Rank Test)

符号检验虽然简单,但它丢弃了部分信息(它不在乎数值到底“大了多少”)。威尔卡森符号等级检验更强大,因为它考虑了差异的程度。

检验流程:

  1. 计算每个观察值与假设中位数之间的差值:\(d_i = x_i - M_0\)。
  2. 对这些差值进行排名,从小到大排列,暂时忽略正负号。(绝对值最小的差值获得第 1 名)。
  3. 将原始差值的正负号加回每个排名中(例如,如果差值是 -2 且获得了第 3 名,它就变成负向排名)。
  4. 计算正向排名的总和 (\(W_+\)) 和负向排名的总和 (\(W_-\))。
  5. 你的检验统计量 \(T\) 通常取 \(W_+\) 和 \(W_-\) 中的较小值
  6. 将 \(T\) 与威尔卡森单样本表 (Wilcoxon Single-Sample table) 中的临界值进行比较。

常见错误:别忘了忽略差值为零的情况!如果某个观察值等于假设中位数,请剔除该数据并相应地减少 \(n\)。

重点总结:对于非常混乱的数据使用符号检验,但如果你想要一个考虑到差异大小、更“敏感”的检验,请使用威尔卡森符号等级检验。


4. 比较两个样本:配对与非配对

在进行检验之前,你必须决定你的数据集是“相关”的还是独立的。

配对样本 (Paired-Sample/Matched Pairs)

例子:测量 10 名学生运动和运动的脉搏。“前”和“后”的数据属于同一个人。我们使用符号检验或威尔卡森符号等级检验来检验差值(就像上面的单样本检验一样,只是检验中位数差值是否为 0)。

两样本 (Two-Sample/Unpaired)

例子:比较 10 名男生和 12 名女生的身高。这是两组独立的数据。我们使用威尔卡森秩和检验 (Wilcoxon Rank-Sum Test)(也称为曼-惠特尼 U 检验 (Mann-Whitney U Test))。


5. 威尔卡森秩和检验 (Mann-Whitney U)

此检验用于判断两个独立的母体是否相同。

运作步骤:

  1. 将两个样本合并成一个大小为 \(N = m + n\) 的大清单。
  2. 将所有数值从 1 到 \(N\) 进行排名。
  3. 计算样本较小组的排名总和(设此总和为 \(R_m\))。
  4. 检验统计量 \(W\) 就是该组的排名总和。
  5. 将 \(W\) 与威尔卡森秩和表 (Wilcoxon Rank-Sum tables) 进行比较。

你知道吗?统计表通常提供较小样本量 \(m\) 的临界值。如果你的组别大小不同,请务必按照表格说明来选取正确的数值!


6. 大样本的常态近似 (Normal Approximations)

当样本量 \(n\) 变大(通常 \(n > 20\))时,威尔卡森表就不够用了。幸运的是,检验统计量开始遵循常态分布

对于威尔卡森符号等级检验 (\(T\)):

平均数 \( \mu = \frac{1}{4}n(n+1) \)
变异数 \( \sigma^2 = \frac{1}{24}n(n+1)(2n+1) \)
\( T \sim N(\mu, \sigma^2) \)

对于威尔卡森秩和检验 (\(W\)):

平均数 \( \mu = \frac{1}{2}m(m+n+1) \)
变异数 \( \sigma^2 = \frac{1}{12}mn(m+n+1) \)
\( W \sim N(\mu, \sigma^2) \)

别担心,这看起来可能有点棘手!这些公式都会提供在你的公式手册中。只需记住,在计算 z 分数时要使用 0.5 的连续性修正 (continuity correction),因为你正从离散的排名转向连续的常态曲线。


快速回顾栏

我该用哪个检验?

  • 单样本(中位数):符号检验或威尔卡森符号等级检验。
  • 配对数据(前后对比):使用差值进行符号检验或威尔卡森符号等级检验。
  • 两组独立数据:威尔卡森秩和检验(曼-惠特尼 U 检验)。
  • 大样本:使用常态近似公式。

记忆小撇步:Signed-Rank (符号等级) 用于 Same (相同) 的人(配对)。Rank-Sum (秩和) 用于 Separate (分开) 的组别。


总结清单

1. 排名:你排名正确吗?绝对差值最小的 = 第 1 名。
2. 假设:你的假设是关于中位数 (\(M\)) 而不是算术平均数吗?
3. 同分值:请记住,本课程的教学大纲排除了排名相同或观察值与中位数重合的问题,这让你的计算轻松不少!
4. 结论:务必将最终结论写在题目语境中。“有足够的证据显示在 5% 显著水平下,中位数分数有所增加。”