Hypothesis test for the proportion in a binomial distribution - Mathematics A - H240 - Cambridge OCR A Level

欢迎来到假设检验 (Hypothesis Testing) 的世界！

你有没有听过别人夸下海口——例如“我掷硬币有 80% 的概率会出现正面”——然后心想：“我敢说他们只是运气好罢了”？其实，假设检验正是数学上用来证明一个人是真的有“实力”（或是某个情况真的发生了变化），还是纯粹“运气好”的工具。

在本章中，我们将学习如何利用二项分布 (Binomial Distribution) 来检验关于比例 (proportions) 的主张。如果一开始觉得有点棘手也不用担心，我们会一步步拆解教学！

1. “数学侦探”的专用语言

在开始计算之前，我们必须先掌握一些术语。你可以把假设检验想象成一场法庭审判。

假设 (The Hypotheses)

零假设 \( (H_0) \)： 这就是“现状”。它假设一切都没有改变，原有的主张是正确的。我们总是将其写作 \( H_0: p = \text{某个数值} \)。
备择假设 \( (H_1) \)： 这就是“有事情发生了”的假设。这是你怀疑实际发生的情况。它可以是 \( p > \)、\( p < \) 或 \( p \neq \)。

检验工具

检验统计量 (Test Statistic)： 这是你在样本中观察到的实际结果（例如：“我掷了 20 次硬币，结果出现 15 次正面”）。
显著性水平 \( (\alpha) \)： 这是我们设立的“怀疑阈值”，通常为 5% (0.05) 或 1% (0.01)。这代表我们愿意承担犯错的风险上限。
p 值 (p-value)： 若零假设为真，获得你目前观察到之结果（或更极端结果）的概率。

小提醒： 在作答时，你必须明确定义 \( p \) 代表什么。例如：“其中 \( p \) 代表喜欢吃辣的人口比例。”

2. 单尾检验 vs. 双尾检验

我们设定备择假设 \( (H_1) \) 的方式，取决于我们想要检测什么。

单尾检验 (One-Tail Test)

当我们怀疑比例有明确的增加或明确的减少时使用。
例子：“我认为这种新药比旧药更有效。”
\( H_1: p > 0.5 \)

双尾检验 (Two-Tail Test)

当我们怀疑比例只是有所改变（我们不知道是变多还是变少）时使用。
例子：“我认为袋子里红糖果的比例与标签上写的不同。”
\( H_1: p \neq 0.5 \)

记忆小撇步：
单尾 = 单一方向（更高或更低）。
双尾 = 两个方向（更高或更低——总之就是不一样！）。

重要贴士： 在双尾检验中，你必须将显著性水平平分到两端。如果总显著性水平是 5%，你需要在两端各自寻找 2.5% (0.025) 的概率区间。

3. 临界区间法 (The Critical Region Approach)

临界区间 (Critical Region)（又称拒绝区间）就是“禁区”。如果我们的检验统计量落入这个区域，我们就拒绝零假设。

如何找出它：
使用计算器的二项累积分布函数 (Binomial Cumulative Distribution, BCD)。你要寻找的是使得概率首次低于（或等于）显著性水平的那个 \( x \) 值。

例子： 如果我们在 5% 的显著性水平下，针对 \( X \sim B(20, 0.5) \) 检测比例是否增加：
我们检查 \( P(X \geq 15) \)、\( P(X \geq 16) \) 等。如果 \( P(X \geq 15) = 0.0207 \)（小于 0.05），那么 15 就在我们的临界区间内。

你知道吗？ 显著性水平实际上就是错误拒绝零假设的概率。这就是所谓的“误报”率！

4. 步骤教学：执行检验

每次执行检验时请遵循以下步骤，以确保不会失分：

列出假设： 清晰写下 \( H_0 \) 和 \( H_1 \)，并定义 \( p \)。
定义分布： 说明模型，例如在 \( H_0 \) 下 \( X \sim B(n, p) \)。
选择显著性水平： 通常题目会给定（例如 5%）。
计算概率： 计算得到你的结果或更极端结果的概率。
- 如果 \( H_1: p > k \)，计算 \( P(X \geq \text{observed}) \)。
- 如果 \( H_1: p < k \)，计算 \( P(X \leq \text{observed}) \)。
比较： 你的概率（p 值）是否小于显著性水平？
总结： 写出正式的结论。一定要结合题目背景来写！

避免常见错误： 不要只写“拒绝 \( H_0 \)”。你必须加上背景描述，例如：“在 5% 的显著性水平下，有足够的证据显示故障灯泡的比例已经下降。”

5. 总结与重点摘要

假设检验并不是要追求 100% 的确定性；它的重点在于我们是否有足够的证据来改变我们的看法。

速查表：
- 接受区间 (Acceptance Region)： 我们保留 \( H_0 \) 的数值范围。
- 临界值 (Critical Value)： 落入临界区间的第一个数值。
- 显著性水平： “截止”概率（误报的风险）。
- 计算器： 务必使用累积函数（List 或 Variable 模式）来检查分布“尾端”的概率。

现实类比： 想象一个烟雾警报器。如果它太灵敏（显著性水平过高），烤吐司时它就会响（错误地拒绝了 \( H_0 \)）。如果它不够灵敏（显著性水平太低），它可能会漏掉真正的火灾。我们选择一个水平（如 5%）来平衡这些风险！

核心建议： 检查时务必留意检验的方向。对于 \( P(X \geq x) \)，请记住大多数计算器直接计算的是 \( P(X \leq x) \)，因此你可能需要用 \( 1 - P(X \leq x-1) \)。如果不确定，请检查你的计算器说明书！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。