Hypothesis testing - Mathematics B (MEI) - H630 - Cambridge OCR AS Level

欢迎来到假设检验的世界！

你有没有听过别人夸下海口，说：「我有 80% 的把握能预测硬币投掷的结果」，然后心想：「我才不信呢！」？假设检验 (Hypothesis testing) 就是统计学中的侦探游戏。它让我们能够针对某个主张，透过检视证据（数据）来判断该主张是否可信，还是纯属胡说八道。

在本章中，我们将专注于使用二项分布 (Binomial Distribution) 来检验关于概率的主张。别担心，这些术语听起来有点吓人，但我们会一步一步拆解给你听！

1. 核心概念：无罪推定原则

假设检验的逻辑就像法庭审判一样。在法庭上，我们假设被告是无罪的，直到有足够的证据证明他有罪。在统计学中：

零假设 (Null Hypothesis, \(H_0\))： 这是「无罪」或「现状」的立场。我们假设没有任何改变，或者该主张是标准情况。在 MEI 的课程中，其形式永远是 \(H_0: p = \text{数值}\)。
对立假设 (Alternative Hypothesis, \(H_1\))： 这是「有罪」的立场。这是我们怀疑实际发生的情况（例如，概率上升、下降或单纯发生了改变）。

现实生活范例： 一位园丁声称她种植的种子发芽率为 70%。你认为这些种子的品质其实没那么好。
\(H_0: p = 0.7\) （该主张为真）
\(H_1: p < 0.7\) （发芽率低于声称的数值）

重点复习：
- 务必始终使用 \(p\) （总体参数）来书写假设。
- \(H_0\) 永远使用等号 (\(=\))。
- \(H_1\) 使用小于 (\(<\))、大于 (\(>\)) 或不等于 (\(\neq\))。

2. 检验的语言

要进行检验，你需要了解「游戏规则」。以下是你将在考试中看到的关键术语：

检验统计量 (Test Statistic)

这就是「证据」。它是你在样本中观察到的实际结果。例如，如果你种了 20 颗种子，只有 10 颗发芽，那么 10 就是你的检验统计量。

显著性水平 (Significance Level, \(\alpha\))

这是我们的「举证门槛」。通常设定为 5% 或 1%。它代表错误拒绝零假设的概率。如果观察到的结果纯属巧合的概率低于这个水平，我们就会「拒绝」零假设。

p 值 (p-value)

p 值是指在假设 \(H_0\) 为真的前提下，观察到该结果或更极端结果的概率。
记忆口诀：「p 值若太低，\(H_0\) 就要去！」（如果 \(p < \text{显著性水平}\)，我们就拒绝 \(H_0\)）。

拒绝域与临界值 (Critical Regions and Critical Values)

拒绝域 (Critical region) 是指检验统计量落入该范围时，会导致我们拒绝 \(H_0\) 的数值范围。临界值 (Critical value) 则是进入该范围的第一个数值。

关键结论： 如果你的检验统计量落在拒绝域内，或是你的 p 值小于显著性水平，代表你有足够的证据来支持你的怀疑 (\(H_1\))。

3. 单侧与双侧检验

我们该如何决定检验的方向？这全取决于我们在寻找什么。

单侧检验 (1-Tail Test)： 当我们怀疑概率在特定方向上有所改变时使用。
例子：「我觉得概率上升了 (\(p > \dots\))」或「我觉得概率下降了 (\(p < \dots\))」。
双侧检验 (2-Tail Test)： 当我们怀疑概率改变了，但不确定是往哪个方向改变时使用。
例子：「我觉得概率不同了 (\(p \neq \dots\))」。

双侧检验的重要小贴士： 你必须将显著性水平减半！如果你是在 5% 的水平下进行检验，你需要寻找两端各 2.5% 的区域。

4. 一步一步来：如何进行二项式检验

如果起初觉得棘手也无妨，每次都按照这五个步骤做：

陈述假设： 清楚写出 \(H_0: p = \dots\) 和 \(H_1: p \dots\)。
辨识模型： 写出零假设下的分布，例如 \(X \sim B(n, p)\)。
选择显著性水平： 记下题目给定的水平（例如 5%）。
计算 p 值： 使用计算器，找出获得该极端结果的概率。
- 若 \(H_1: p < k\)，找出 \(P(X \leq \text{观察值})\)。
- 若 \(H_1: p > k\)，找出 \(P(X \geq \text{观察值})\)，即 \(1 - P(X \leq \text{观察值} - 1)\)。
结论： 将你的 p 值与显著性水平进行比较，并根据题意写出结论。

5. 写出结论：MEI 的标准方式

MEI 的阅卷老师对结论的写法非常讲究！他们要求使用非断言式 (non-assertive) 的语言。我们从不「证明」任何事，我们只会说是否有足够的证据或没有足够的证据。

「优秀」结论范例：
「p 值 (0.032) 小于 5% 的显著性水平。在 5% 的显著性水平下，有足够的证据显示种子的发芽率已经下降。」

「不良」结论范例：
「p 值很低，所以发芽率一定是 60%。」（太过于武断！统计学处理的是概率，而不是绝对确定的事实）。

常见错误： 千万不要只写「接受 \(H_0\)」。应该说「没有足够的证据来拒绝 \(H_0\)」。这就像陪审团判决「无罪」——这并不代表被告 100% 清白，只是证明不足以定罪而已。

6. 总结速查

你知道吗？ 显著性水平其实就是「虚惊一场」的概率——也就是当零假设实际上为真时，我们却错误地拒绝了它！

复习关键重点：

\(H_0\)： 现状 (\(p =\))。
\(H_1\)： 怀疑点 (\(<\)、\(>\) 或 \(\neq\))。
单侧： 单一方向。双侧： 任何变动（请记得将 % 减半！）。
p 值 < 显著性水平： 结果显著，拒绝 \(H_0\)。
结论： 必须结合题目背景，且语气需谨慎、非断言。

请继续利用计算器的二项式累计功能多加练习——熟练度与精确度会让这些题目变得容易许多！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。