欢迎来到假设检验的世界!

你有没有听过别人夸下海口,说:「我有 80% 的把握能预测硬币投掷的结果」,然后心想:「我才不信呢!」?假设检验 (Hypothesis testing) 就是统计学中的侦探游戏。它让我们能够针对某个主张,透过检视证据(数据)来判断该主张是否可信,还是纯属胡说八道。

在本章中,我们将专注于使用二项分布 (Binomial Distribution) 来检验关于概率的主张。别担心,这些术语听起来有点吓人,但我们会一步一步拆解给你听!


1. 核心概念:无罪推定原则

假设检验的逻辑就像法庭审判一样。在法庭上,我们假设被告是无罪的,直到有足够的证据证明他有罪。在统计学中:

  • 零假设 (Null Hypothesis, \(H_0\)): 这是「无罪」或「现状」的立场。我们假设没有任何改变,或者该主张是标准情况。在 MEI 的课程中,其形式永远是 \(H_0: p = \text{数值}\)。
  • 对立假设 (Alternative Hypothesis, \(H_1\)): 这是「有罪」的立场。这是我们怀疑实际发生的情况(例如,概率上升、下降或单纯发生了改变)。

现实生活范例: 一位园丁声称她种植的种子发芽率为 70%。你认为这些种子的品质其实没那么好。
\(H_0: p = 0.7\) (该主张为真)
\(H_1: p < 0.7\) (发芽率低于声称的数值)

重点复习:
- 务必始终使用 \(p\) (总体参数)来书写假设。
- \(H_0\) 永远使用等号 (\(=\))。
- \(H_1\) 使用小于 (\(<\))、大于 (\(>\)) 或不等于 (\(\neq\))。


2. 检验的语言

要进行检验,你需要了解「游戏规则」。以下是你将在考试中看到的关键术语:

检验统计量 (Test Statistic)

这就是「证据」。它是你在样本中观察到的实际结果。例如,如果你种了 20 颗种子,只有 10 颗发芽,那么 10 就是你的检验统计量

显著性水平 (Significance Level, \(\alpha\))

这是我们的「举证门槛」。通常设定为 5% 或 1%。它代表错误拒绝零假设的概率。如果观察到的结果纯属巧合的概率低于这个水平,我们就会「拒绝」零假设。

p 值 (p-value)

p 值是指在假设 \(H_0\) 为真的前提下,观察到该结果或更极端结果的概率。
记忆口诀:「p 值若太低,\(H_0\) 就要去!」(如果 \(p < \text{显著性水平}\),我们就拒绝 \(H_0\))。

拒绝域与临界值 (Critical Regions and Critical Values)

拒绝域 (Critical region) 是指检验统计量落入该范围时,会导致我们拒绝 \(H_0\) 的数值范围。临界值 (Critical value) 则是进入该范围的第一个数值。

关键结论: 如果你的检验统计量落在拒绝域内,或是你的 p 值小于显著性水平,代表你有足够的证据来支持你的怀疑 (\(H_1\))。


3. 单侧与双侧检验

我们该如何决定检验的方向?这全取决于我们在寻找什么。

  • 单侧检验 (1-Tail Test): 当我们怀疑概率在特定方向上有所改变时使用。
    例子:「我觉得概率上升了 (\(p > \dots\))」或「我觉得概率下降了 (\(p < \dots\))」。
  • 双侧检验 (2-Tail Test): 当我们怀疑概率改变了,但不确定是往哪个方向改变时使用。
    例子:「我觉得概率不同了 (\(p \neq \dots\))」。

双侧检验的重要小贴士: 你必须将显著性水平减半!如果你是在 5% 的水平下进行检验,你需要寻找两端各 2.5% 的区域。


4. 一步一步来:如何进行二项式检验

如果起初觉得棘手也无妨,每次都按照这五个步骤做:

  1. 陈述假设: 清楚写出 \(H_0: p = \dots\) 和 \(H_1: p \dots\)。
  2. 辨识模型: 写出零假设下的分布,例如 \(X \sim B(n, p)\)。
  3. 选择显著性水平: 记下题目给定的水平(例如 5%)。
  4. 计算 p 值: 使用计算器,找出获得该极端结果的概率。
    - 若 \(H_1: p < k\),找出 \(P(X \leq \text{观察值})\)。
    - 若 \(H_1: p > k\),找出 \(P(X \geq \text{观察值})\),即 \(1 - P(X \leq \text{观察值} - 1)\)。
  5. 结论: 将你的 p 值与显著性水平进行比较,并根据题意写出结论。

5. 写出结论:MEI 的标准方式

MEI 的阅卷老师对结论的写法非常讲究!他们要求使用非断言式 (non-assertive) 的语言。我们从不「证明」任何事,我们只会说是否有足够的证据没有足够的证据

「优秀」结论范例:
「p 值 (0.032) 小于 5% 的显著性水平。在 5% 的显著性水平下,有足够的证据显示种子的发芽率已经下降。」

「不良」结论范例:
「p 值很低,所以发芽率一定是 60%。」(太过于武断!统计学处理的是概率,而不是绝对确定的事实)。

常见错误: 千万不要只写「接受 \(H_0\)」。应该说「没有足够的证据来拒绝 \(H_0\)」。这就像陪审团判决「无罪」——这并不代表被告 100% 清白,只是证明不足以定罪而已。


6. 总结速查

你知道吗? 显著性水平其实就是「虚惊一场」的概率——也就是当零假设实际上为真时,我们却错误地拒绝了它!

复习关键重点:
  • \(H_0\): 现状 (\(p =\))。
  • \(H_1\): 怀疑点 (\(<\)、\(>\) 或 \(\neq\))。
  • 单侧: 单一方向。双侧: 任何变动(请记得将 % 减半!)。
  • p 值 < 显著性水平: 结果显著,拒绝 \(H_0\)。
  • 结论: 必须结合题目背景,且语气需谨慎、非断言。

请继续利用计算器的二项式累计功能多加练习——熟练度与精确度会让这些题目变得容易许多!