Statistical hypothesis testing

统计假设检验导论

欢迎！如果你曾经好奇科学家是如何判断一种新药是否有效，或者厂商如何证明他们的灯泡真的能像宣称的那样耐用，那么你就是在接触统计假设检验 (Statistical Hypothesis Testing)。在本章中，我们将学习根据数据进行决策的正式“游戏规则”。如果刚开始觉得这些概念有点抽象，别担心；一旦你掌握了相关术语，这就像跟着食谱做菜一样简单！

1. 假设检验的语言

在进行任何计算之前，我们需要先熟悉它的专业术语。你可以把假设检验想象成一场法庭审讯。

关键术语

零假设 (Null Hypothesis, \(H_0\))： 这代表“在证明有罪前假定无罪”的立场。我们假设一切正常或与先前宣称的一致。例如：“这枚硬币是公平的”(\(p = 0.5\))。
对立假设 (Alternative Hypothesis, \(H_1\))： 这就是你试图证明的内容。例如：“这枚硬币有偏差”(\(p \neq 0.5\))。
检验统计量 (Test Statistic)： 我们所收集的实际证据（例如：投掷 20 次硬币中出现正面次数的结果）。
显著性水平 (Significance Level, \(\alpha\))： 判断的“门槛”。通常设定为 5% (0.05) 或 1% (0.01)。这是当零假设实际上为真时，我们却错误地拒绝它的概率。
拒绝域 (Critical Region)： 导致我们认定为“有罪”（拒绝 \(H_0\)）的检验统计量数值范围。
临界值 (Critical Value)： 划定拒绝域边界的数值。
p 值 (p-value)： 在假设 \(H_0\) 为真的前提下，获得目前结果（或更极端结果）的概率。

单尾检验 vs. 双尾检验

如何知道该用哪一种？观察题目中的字眼就知道了！

单尾检验 (1-tail test)： 当宣称涉及特定方向时使用。
例子：“这种新肥料是否更好？”(\(H_1: p > 0.5\)) 或“机器是否装填不足？”(\(H_1: p < 0.5\))。
双尾检验 (2-tail test)： 当宣称内容仅表示某事物已经改变或有所不同时使用。
例子：“这枚硬币是否有偏差？”(\(H_1: p \neq 0.5\))。

快速复习： 在 5% 显著性水平的双尾检验中，你需要将显著性水平平分为两端，即底端占 2.5%，顶端占 2.5%。

重点提示： 务必以总体参数（如 \(p\) 或 \(\mu\)）清楚定义你的假设。

2. 比例检验（二项分布）

当我们固定次数的试验中计算“成功”次数时，会使用此方法。

步骤流程

列出你的假设： 使用 \(p\) 作为总体比例。\(H_0: p = \dots\) 以及 \(H_1: p \dots\)
识别分布： 假设 \(H_0\) 为真，则 \(X \sim B(n, p)\)。
计算 p 值： 使用计算器找出你的结果或更极端结果的概率。
- 若检验大于：\(P(X \geq \text{observed})\)
- 若检验小于：\(P(X \leq \text{observed})\)
比较： 如果你的 p 值小于显著性水平，则拒绝 \(H_0\)。
在语境中下结论： 务必写出类似“在 5% 的显著性水平下，有足够的证据显示……”的句子。

例子：一位烘焙师宣称他烤的蛋糕有 90% 会发起来。你买了 20 个，只有 15 个发起来。他在夸大其词吗？
\(H_0: p = 0.9\)
\(H_1: p < 0.9\)
我们使用 \(B(20, 0.9)\) 来检验 \(P(X \leq 15)\)。如果该概率非常小（小于我们的显著性水平），我们就可以戳破他的谎言！

常见错误： 学生常忘记在概率中包含“等于”的部分（例如计算 \(P(X < 15)\) 而非 \(P(X \leq 15)\)）。请务必包含观察值！

3. 相关性检验 (PMCC)

这用于检验总体中两个变量之间是否存在线性关系。

参数说明

\(r\)： 样本相关系数（你从数据中计算出来的）。
\(\rho\) (rho)： 总体相关系数（我们试图猜测的“真实”关系）。

4. 平均数检验（正态分布）

当我们已知总体方差，并想根据样本检验平均数 (\(\mu\)) 是否已改变时，会使用此方法。

前置知识：样本平均数的分布

若总体为 \(X \sim N(\mu, \sigma^2)\)，则大小为 \(n\) 的样本之平均数分布为： \( \bar{X} \sim N(\mu, \frac{\sigma^2}{n}) \)

记忆小贴士： 当样本大小 (\(n\)) 变大时，“离散程度”（标准误）会变小。这很合理，因为大样本更可靠！

检验统计量（标准化）

为了找出样本平均数与宣称平均数相差了几个标准差，我们使用： \( Z = \frac{\bar{X} - \mu}{\sigma / \sqrt{n}} \)

接着将此 \(Z\) 值与标准正态分布 \(N(0, 1^2)\) 进行比较。

正态检验步骤

列出 \(H_0: \mu = \dots\) 与 \(H_1: \mu \dots\)
写下样本平均数的分布：\(\bar{X} \sim N(\mu, \frac{\sigma^2}{n})\)。
找出 p 值：\(P(\bar{X} > \text{observed mean})\) 或 \(P(\bar{X} < \text{observed mean})\)。
与显著性水平比较并下结论。

快速复习盒：
对于 5% 的单尾检验，临界 Z 值为 1.6449。
对于 5% 的双尾检验，临界 Z 值为 \(\pm 1.96\)。

最后的鼓励

假设检验看起来步骤繁多，但逻辑非常清晰。只要记住：设定假设 \(\rightarrow\) 进行检验 \(\rightarrow\) 进行比较 \(\rightarrow\) 下结论。 保持书写规范，并务必将最终答案与题目中的实际情境连接起来。你一定可以的！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。