欢迎来到无参数检验(Non-parametric Tests)的世界!
在你的 H2 数学旅程中,你可能已经花了很多时间与“正态分布”打交道。它是一条漂亮的钟形曲线,但现实世界的数据并不总是那么整齐!有时候,数据会出现偏态(skewed),或者我们的样本数太小,导致无法确定其背后的总体分布。
这就是无参数检验(Non-parametric tests)派上用场的时候了。你可以把它们想象成统计学界的“全地形车”。虽然参数检验(如 t-检验)需要一条平坦的“柏油路”(正态分布)才能顺畅运作,但无参数检验却能应付“崎岖地形”(任何形状的数据)。在本章中,我们将学习如何在不假设数据遵循特定分布的情况下进行假设检验。
1. 理解无参数检验
无参数检验通常被称为“无分布”检验(distribution-free tests),因为它们不依赖于数据来自特定概率分布(如正态分布)的假设。
无参数检验的优点:
• 灵活性: 它们可以用于非正态分布的数据。
• 简单性: 它们通常基于数据的秩(ranks)或简单的符号(+ 或 -),而不是平均值或方差等复杂的参数。
• 稳健性: 它们较少受到极端值(outliers)的影响,因为它们关注的是数据的顺序而非精确数值。
无参数检验的缺点:
• 检验力较低(Lower Power): 如果数据确实是正态分布的,无参数检验的“检验力”会比参数检验低。这意味着它们较难侦测出错误的虚无假设。
• 信息量较少: 由于它们使用秩或符号,因此会“舍弃”了包含在原始数值中的部分特定信息。
快速复习小盒子:
如果你确定数据符合正态分布,请使用参数检验(如 t-检验)。
如果分布未知或明显不是正态分布,请使用无参数检验。
2. 符号检验(The Sign Test)
符号检验(Sign Test)是最简单的无参数检验。我们用它来检验关于总体中位数(population median,记为 \( m \))的假设。它被称为符号检验,是因为我们只关心数据点是在假设中位数的上方(+)还是下方(-)。
设立假设
虚无假设 \( H_0 \):总体中位数等于特定值 \( m_0 \)。
\( H_0: m = m_0 \)
对立假设 \( H_1 \):
• \( H_1: m \neq m_0 \)(双尾检验)
• \( H_1: m > m_0 \)(右尾检验)
• \( H_1: m < m_0 \)(左尾检验)
检验步骤(Step-by-Step)
1. 将样本中的每个数据值与假设的中位数 \( m_0 \) 进行比较。
2. 如果数值大于 \( m_0 \),记录一个加号(+)。
3. 如果数值小于 \( m_0 \),记录一个减号(-)。
4. 如果数值刚好等于 \( m_0 \),我们忽略它,并相应地缩减样本大小 \( n \)。
5. 令 \( X \) 为加号的数量。在 \( H_0 \) 成立下,每个数值位于中位数上方或下方的概率均等。因此,检验统计量 \( X \) 遵循二项分布(Binomial Distribution):
\( X \sim B(n, 0.5) \)
例子:假设你认为某咖啡店的中位数等待时间是 10 分钟。你观察了 10 位顾客,其中 8 人的等待时间超过 10 分钟(+),2 人少于 10 分钟(-)。由于 8 远大于预期的 5,你可能会拒绝 \( H_0 \)。
如果一开始觉得困难,别担心! 只要记住:我们只是在计算有多少人落在围栏的哪一边。如果围栏真的是中位数,那应该会是一个 50/50 的比例。
3. Wilcoxon 配对样本符号秩检验(Wilcoxon Matched-Pair Signed Rank Test)
Wilcoxon 配对样本符号秩检验用于配对数据(例如对同一群人的“前后”测量)。它比符号检验更强大,因为它同时考虑了差异的方向(+ 或 -)和幅度(大小)。
假设
对于此检验,我们假设两个总体的分布形状相同,仅在位置上有所偏移。这意味着差异的分布是对称的。
设立假设
\( H_0 \):两种处理方式之间没有差异(差异的总体中位数为零)。
\( H_1 \):存在差异(差异的总体中位数不为零)。
检验步骤
1. 计算每对数据的差异 \( d_i \)(例如:后测减前测)。
2. 忽略任何差异为零的配对。
3. 取差异的绝对值 \( |d_i| \),并由小到大进行排序(秩)(1, 2, 3...)。
课程笔记:本课程将排除秩数相同(tied)的情况。
4. 将原始符号(+ 或 -)重新分配回每个秩。
5. 计算 \( T^+ \)(正秩和)与 \( T^- \)(负秩和)。
6. 检验统计量 \( T \) 通常取 \( T^+ \) 和 \( T^- \) 中的较小值。将其与 Wilcoxon 临界值表进行比较。
类比: 想像两位运动员。符号检验只问“谁赢得多场比赛?”,而 Wilcoxon 检验则问“谁赢得多场比赛,且赢了多少距离?”。这使得它成为一个更精明的裁判!
重点总结: Wilcoxon 检验使用差异的秩,而不仅仅是方向。这使它能够比简单的符号检验捕捉到更多的信息。
4. 选择检验方法的总结
选择正确的检验方法就等于成功了一半。以下是快速指南:
1. 检验单一总体中位数?
使用符号检验(Sign Test)。
2. 检验配对样本的差异?
使用Wilcoxon 配对样本符号秩检验。
3. 数据符合正态分布且样本数小?
使用 t-检验(参数检验 - 在 3.3 节介绍)。
4. 数据不符合正态分布?
务必使用无参数选项(符号检验或 Wilcoxon 检验)。
你知道吗? 无参数检验广泛应用于心理学和医学领域,研究人员经常使用“李克特量表”(如 1 到 5 星评分)。由于 1 星与 2 星之间的“差距”可能与 4 星和 5 星之间的“差距”不完全相同,这些检验非常适合用于分析此类数据!
成功检查清单
• 务必使用中位数一词清晰地陈述你的虚无假设 \( H_0 \) 和对立假设 \( H_1 \)。
• 对于符号检验,识别你的 \( n \) 以及检验统计量 \( X \sim B(n, 0.5) \)。
• 对于 Wilcoxon 检验,记住先对绝对差异进行排序,再放回符号。
• 始终在问题的情境下做出结论(例如:“在 5% 的显著性水平下,有足够证据显示中位数体重已经增加”)。
避免常见错误: 别忘了在符号检验和 Wilcoxon 检验中舍弃“零差异”!如果一个数据点等于假设的中位数,或者某个配对没有变化,这对我们判断数据倾向哪一方没有帮助,所以我们将其剔除并缩减 \( n \)。