统计假设检验导论

欢迎!如果你曾经好奇科学家是如何判断一种新药是否有效,或者厂商如何证明他们的灯泡真的能像宣称的那样耐用,那么你就是在接触统计假设检验 (Statistical Hypothesis Testing)。在本章中,我们将学习根据数据进行决策的正式“游戏规则”。如果刚开始觉得这些概念有点抽象,别担心;一旦你掌握了相关术语,这就像跟着食谱做菜一样简单!

1. 假设检验的语言

在进行任何计算之前,我们需要先熟悉它的专业术语。你可以把假设检验想象成一场法庭审讯

关键术语

  • 零假设 (Null Hypothesis, \(H_0\)): 这代表“在证明有罪前假定无罪”的立场。我们假设一切正常或与先前宣称的一致。例如:“这枚硬币是公平的”(\(p = 0.5\))。
  • 对立假设 (Alternative Hypothesis, \(H_1\)): 这就是你试图证明的内容。例如:“这枚硬币有偏差”(\(p \neq 0.5\))。
  • 检验统计量 (Test Statistic): 我们所收集的实际证据(例如:投掷 20 次硬币中出现正面次数的结果)。
  • 显著性水平 (Significance Level, \(\alpha\)): 判断的“门槛”。通常设定为 5% (0.05) 或 1% (0.01)。这是当零假设实际上为真时,我们却错误地拒绝它的概率。
  • 拒绝域 (Critical Region): 导致我们认定为“有罪”(拒绝 \(H_0\))的检验统计量数值范围。
  • 临界值 (Critical Value): 划定拒绝域边界的数值。
  • p 值 (p-value): 在假设 \(H_0\) 为真的前提下,获得目前结果(或更极端结果)的概率。

单尾检验 vs. 双尾检验

如何知道该用哪一种?观察题目中的字眼就知道了!

  • 单尾检验 (1-tail test): 当宣称涉及特定方向时使用。
    例子:“这种新肥料是否更好?”(\(H_1: p > 0.5\)) 或“机器是否装填不足?”(\(H_1: p < 0.5\))。
  • 双尾检验 (2-tail test): 当宣称内容仅表示某事物已经改变有所不同时使用。
    例子:“这枚硬币是否有偏差?”(\(H_1: p \neq 0.5\))。

快速复习: 在 5% 显著性水平的双尾检验中,你需要将显著性水平平分为两端,即底端占 2.5%,顶端占 2.5%。

重点提示: 务必以总体参数(如 \(p\) 或 \(\mu\))清楚定义你的假设。

2. 比例检验(二项分布)

当我们固定次数的试验中计算“成功”次数时,会使用此方法。

步骤流程

  1. 列出你的假设: 使用 \(p\) 作为总体比例。\(H_0: p = \dots\) 以及 \(H_1: p \dots\)
  2. 识别分布: 假设 \(H_0\) 为真,则 \(X \sim B(n, p)\)。
  3. 计算 p 值: 使用计算器找出你的结果或更极端结果的概率。
    • 若检验大于:\(P(X \geq \text{observed})\)
    • 若检验小于:\(P(X \leq \text{observed})\)
  4. 比较: 如果你的 p 值小于显著性水平,则拒绝 \(H_0\)。
  5. 在语境中下结论: 务必写出类似“在 5% 的显著性水平下,有足够的证据显示……”的句子。

例子:一位烘焙师宣称他烤的蛋糕有 90% 会发起来。你买了 20 个,只有 15 个发起来。他在夸大其词吗?
\(H_0: p = 0.9\)
\(H_1: p < 0.9\)
我们使用 \(B(20, 0.9)\) 来检验 \(P(X \leq 15)\)。如果该概率非常小(小于我们的显著性水平),我们就可以戳破他的谎言!

常见错误: 学生常忘记在概率中包含“等于”的部分(例如计算 \(P(X < 15)\) 而非 \(P(X \leq 15)\))。请务必包含观察值!

3. 相关性检验 (PMCC)

这用于检验总体中两个变量之间是否存在线性关系。

参数说明

  • \(r\): 样本相关系数(你从数据中计算出来的)。
  • \(\rho\) (rho): 总体相关系数(我们试图猜测的“真实”关系)。

相关性的假设

  • \(H_0: \rho = 0\)(无线性相关)。
  • \(H_1: \rho > 0\)(正相关)、\(\rho < 0\)(负相关)或 \(\rho \neq 0\)(有相关性)。

你知道吗? 你不需要计算 \(\rho\)。你只需使用计算器计算 \(r\),然后根据你的样本大小 (\(n\)) 和显著性水平,与临界值表(附在公式册中)进行比较。

重点提示: 如果你计算出的 \(|r|\) 大于临界值,则代表相关性“足够强”,足以拒绝无相关性的假设。

4. 平均数检验(正态分布)

当我们已知总体方差,并想根据样本检验平均数 (\(\mu\)) 是否已改变时,会使用此方法。

前置知识:样本平均数的分布

若总体为 \(X \sim N(\mu, \sigma^2)\),则大小为 \(n\) 的样本之平均数分布为: \( \bar{X} \sim N(\mu, \frac{\sigma^2}{n}) \)

记忆小贴士: 当样本大小 (\(n\)) 变大时,“离散程度”(标准误)会变小。这很合理,因为大样本更可靠!

检验统计量(标准化)

为了找出样本平均数与宣称平均数相差了几个标准差,我们使用: \( Z = \frac{\bar{X} - \mu}{\sigma / \sqrt{n}} \)

接着将此 \(Z\) 值与标准正态分布 \(N(0, 1^2)\) 进行比较。

正态检验步骤

  1. 列出 \(H_0: \mu = \dots\) 与 \(H_1: \mu \dots\)
  2. 写下样本平均数的分布:\(\bar{X} \sim N(\mu, \frac{\sigma^2}{n})\)。
  3. 找出 p 值:\(P(\bar{X} > \text{observed mean})\) 或 \(P(\bar{X} < \text{observed mean})\)。
  4. 与显著性水平比较并下结论。

快速复习盒:
对于 5% 的单尾检验,临界 Z 值为 1.6449
对于 5% 的双尾检验,临界 Z 值为 \(\pm 1.96\)

最后的鼓励

假设检验看起来步骤繁多,但逻辑非常清晰。只要记住:设定假设 \(\rightarrow\) 进行检验 \(\rightarrow\) 进行比较 \(\rightarrow\) 下结论。 保持书写规范,并务必将最终答案与题目中的实际情境连接起来。你一定可以的!