Hypothesis test for the proportion in a binomial distribution - Mathematics A - H230 - Cambridge OCR AS Level

欢迎来到假设检验 (Hypothesis Testing)！

你有没有想过，一枚「幸运」硬币是否真的有偏差？或者一种新药是否真的比旧药更有效？假设检验就像是数学界的侦探游戏。在本章中，我们将学习如何运用二项分布 (Binomial Distribution) 来判断关于比例的说法是否合理，抑或这只是随机巧合。

如果起初觉得这些文字有点抽象，请不用担心——一旦掌握了当中的逻辑，数学计算其实非常直接明了！

1. 「核心概念」：检验的逻辑

假设你的朋友声称他能预测 80% 的硬币投掷结果。你观察他投掷了 10 次，结果他猜中了 9 次。这纯粹是运气，还是他真的有「超能力」？

在假设检验中，我们总是先假设现状没有改变（例如硬币是公平的）。接着，我们会计算得到「9 次中 9 次」这种极端结果的概率。如果这个概率微乎其微，我们就会「拒绝」这只是运气的说法。

你需要知道的关键术语

零假设 (Null Hypothesis, \(H_0\))： 这代表「现状」。我们假设比例 \(p\) 与以往完全相同。
例子：\(H_0: p = 0.5\)（硬币是公平的）。

备择假设 (Alternative Hypothesis, \(H_1\))： 这是我们实际要检测的目标。它是指怀疑比例已经发生了改变。
例子：\(H_1: p > 0.5\)（硬币对正面有偏差）。

检验统计量 (Test Statistic)： 这是我们在样本中观察到的实际「成功」次数（例如你朋友投掷出的 9 个正面）。

显著性水平 (Significance Level, \(\alpha\))： 这是我们设定的「门槛」。通常为 5% (0.05)。如果观察到结果的概率低于这个数值，我们就称其为「具统计显著性」。

快速回顾： 假设检验就像一场法庭审判。被告在未经证实有罪前是无罪的。在数学中，\(H_0\) 代表「无罪」（无事发生），我们需要强而有力的证据来证明「有罪」(\(H_1\))。

2. 设定假设

在为二项分布比例 \(p\) 编写假设时，必须始终使用参数 \(p\)，并以文字说明其代表的意义。

你可能会进行三种类型的检验：

1. 单侧检验（上侧）： 检测比例是否增加了。\(H_1: p > \text{数值}\)。
2. 单侧检验（下侧）： 检测比例是否减少了。\(H_1: p < \text{数值}\)。
3. 双侧检验： 检测比例是否在任一方向上有所改变。\(H_1: p \neq \text{数值}\)。

常见错误： 永远不要在假设中使用你的样本结果。例如，如果你观察到 8/10 的成功率，不要写成 \(H_0: p = 0.8\)。假设是关于整个总体 (population)，而不仅仅是你的小样本。

3. 逐步检验过程

请为每一题遵循以下 5 个步骤：

步骤 1：陈述假设。
定义 \(p\)（例如：「其中 \(p\) 为种子发芽的概率」）。
写出 \(H_0: p = \dots\) 和 \(H_1: p < \dots\)（或是 \(>\) 或 \(\neq\)）。

步骤 2：识别模型。
在零假设下陈述分布：\(X \sim B(n, p)\)。
\(n\) 是你的样本大小，而 \(p\) 是来自 \(H_0\) 的数值。

步骤 3：计算 p-值 (p-value)。
这是得到你观察到的结果或更极端结果的概率。
- 若检测 \(p > \dots\)，计算 \(P(X \ge \text{观察值})\)。
- 若检测 \(p < \dots\)，计算 \(P(X \le \text{观察值})\)。

步骤 4：与显著性水平比较。
如果 p-值 \(\le\) 显著性水平，我们拒绝 \(H_0\)。
如果 p-值 \(>\) 显著性水平，我们无法拒绝 \(H_0\)。

步骤 5：在情境中作结论。
使用类似这样的句子：「在 5% 的显著性水平下，有足够证据显示……的比例已经增加。」

你知道吗？ 我们从不说「接受」\(H_0\)。我们只会说没有足够的证据来拒绝它。这就像陪审团说「无罪释放」——这并不一定代表真的「清白」，只是证明不足而已！

4. 临界区域与临界值

有时，题目不会要求计算 p-值，而是要求找出临界区域 (Critical Region)。这是指你会拒绝 \(H_0\) 的数值范围。

临界值 (Critical Value)： 进入拒绝区域的第一个数值。
接受区域 (Acceptance Region)： 我们保持 \(H_0\) 的数值范围。

OCR 重要规则： 对于指定的显著性水平（例如 5%），检验统计量落在拒绝区域内的概率，必须是在不超过显著性水平的前提下，尽可能地接近该水平。

双侧检验的变量

在双侧检验 (\(H_1: p \neq \dots\)) 中，「怀疑」仅指事情有所改变。我们将显著性水平平分为二。
例子：在 5% 的显著性水平下，我们会在下端寻找 2.5%，并在上端寻找 2.5%。

记忆小撇步： 双侧 = 两个方向 = 百分比的两个半部。

5. 理解显著性水平

「5% 显著性水平」实际上是什么意思？
它是错误地拒绝零假设的概率。换句话说，有 5% 的可能性是我们断定事情发生了改变，但实际上，该结果只是一次罕见的运气。

快速总结表：
- p-值较小 (\(<\alpha\))： 结果罕见 \(\rightarrow\) 有证据反对 \(H_0\) \(\rightarrow\) 拒绝 \(H_0\)。
- p-值较大 (\(>\alpha\))： 结果常见 \(\rightarrow\) 无证据反对 \(H_0\) \(\rightarrow\) 无法拒绝 \(H_0\)。

常见陷阱

1. 忘记情境： 你的最后一句必须提到真实世界的情况（种子、硬币、选票等）。
2. 计算错误： 记得在计算器上，\(P(X \ge 8)\) 要计算为 \(1 - P(X \le 7)\)。
3. 假设符号： 永远使用 \(p\) 来代表总体比例。不要使用 \(x\) 或 \(\mu\)。
4. 进位： 不要过早将 p-值四舍五入；保持精确度以便与显著性水平比较。

重点总结： 假设检验不是为了达到 100% 的确定。它是为了判断在当前的规则下，一个结果是否「太不可能」以至于不可能是由随机产生的。利用计算器找出这些概率，与「门槛」（显著性水平）进行比较，并写下明确的结论！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。