Hypothesis tests

简介：什么是假设检验 (Hypothesis Test)？

欢迎！今天我们要来认识统计学中最强大的工具之一：假设检验 (Hypothesis Testing)。别被这个名词吓到了——其实你在日常生活中天天都在用！

想象一下，你的朋友声称他能单靠味觉分辨出昂贵的瓶装水和自来水。你对此半信半疑。为了“检验”他的说法，你准备了几杯水让他喝。如果他全部猜对，你可能就开始相信他了；如果他猜错了，你就会认为他的说法是假的。简单来说，这就是假设检验的核心概念。

在数学科 (XMA01) 中，我们运用这一套方法来判断针对总体 (population) 的“声称”是否属实，或者我们观察到的现象是否只是随机出现的巧合。

1. 假设检验的术语

在开始运算之前，我们先来学习统计学中的“术语”。你可以把它想象成一场法庭审判。

零假设 (Null Hypothesis) \( (H_0) \)

零假设是我们的“预设立场”。在审判中，这就像是“未经证明有罪前，推定为无罪”。在数学中，我们假设现状并未改变。我们记作 \(H_0\)。
例如：\(H_0: p = 0.5\)（这枚硬币是公平的）。

备择假设 (Alternative Hypothesis) \( (H_1) \)

备择假设则是你想证明的事情，也就是你的“声称”。我们记作 \(H_1\)。
例如：\(H_1: p > 0.5\)（这枚硬币有偏向正面出现的偏差）。

显著性水平 (Significance Level) \( (\alpha) \)

这是我们证据的“门槛”。常见的数值为 5% (0.05) 或 1% (0.01)。这代表我们愿意承担犯错的风险。如果观察到的结果纯属巧合发生的概率低于这个水平，我们就会拒绝零假设。

检验统计量 (Test Statistic)

这是我们收集到的数据证据。如果你掷硬币 10 次，出现 9 次正面，那么“9”就是你的检验统计量。

快速复习：
- \(H_0\)：现状（没有任何改变）。
- \(H_1\)：新的声称（发生了改变）。
- 显著性水平：我们的“证据门槛”。

2. 单尾检验 (One-Tailed) 与双尾检验 (Two-Tailed)

根据我们想寻找的目标，检验分为两种“方向”。

单尾检验

当声称明确指出了改变的方向时，我们使用单尾检验。
- “概率增加了” \( (H_1: p > ...) \)
- “概率减少了” \( (H_1: p < ...) \)

双尾检验

当我们只想知道概率是否改变，但不确定是增加还是减少时，我们使用双尾检验。
- “概率有所不同” \( (H_1: p \neq ...) \)
- 小撇步：在双尾检验中，你必须将显著性水平平分。如果是 5% 的检验，你需要在上方找 2.5%，并在下方找 2.5%。

重点提示：一定要细心寻找题目中出现的关键词，如“大于”、“小于”或“改变”，来决定该用哪种检验！

3. 步骤教学

如果刚开始觉得很难，不用担心！只要每次都遵循以下这五个步骤，你就能轻松上手。

第一步：定义你的参数 (Parameter)。
写下 \(p\) 代表什么。
例如：设 \(p\) 为种子发芽的概率。

第二步：列出你的假设。
写出你的 \(H_0\) 和 \(H_1\)。

第三步：写出分布与显著性水平。
通常在 S1/S2 中，这是二项分布 (Binomial Distribution)：\(X \sim B(n, p)\)。标明你的 \(\alpha\)（例如 5%）。

第四步：计算概率 (p-value)。
假设 \(H_0\) 为真，计算出你观察到的结果（或比该结果更极端）的概率。

第五步：比较并作出结论。
- 如果你的概率小于显著性水平：拒绝 \(H_0\) (Reject \(H_0\))。代表有足够证据支持该声称。
- 如果你的概率大于显著性水平：不拒绝 \(H_0\) (Do not reject \(H_0\))。代表证据不足。

4. 拒绝域 (Critical Regions) 与临界值 (Critical Values)

有时候，我们不想针对单一结果去算 p-value，而是想找出“禁区”。

拒绝域 (Critical Region) 是指那些会导致我们拒绝零假设的检验统计量数值范围。
临界值 (Critical Value) 则是划分该区域的“边界”数值。

比喻：想象篱笆上挂着“禁止进入”的牌子。篱笆就是临界值，而篱笆后的整个区域就是拒绝域。

常见错误：在寻找二项分布的拒绝域时，你必须选择一个能将概率保持在显著性水平以内的值。千万不要超过 5%（或其他设定的水平）！

5. 实际应用范例

情境：有人认为一颗骰子偏向出现数字 6。掷了 20 次，数字 6 出现了 8 次。请以 5% 的显著性水平进行检验。

1. 参数：设 \(p\) 为掷出 6 的概率。在 \(H_0\) 下，\(p = 1/6\)。
2. 假设：\(H_0: p = 1/6\)，\(H_1: p > 1/6\)。
3. 分布：\(X \sim B(20, 1/6)\)，且 \(\alpha = 0.05\)。
4. 计算：我们需要 \(P(X \geq 8)\)。
使用查表法或计算器：\(P(X \geq 8) = 1 - P(X \leq 7) \approx 0.0102\)。
5. 结论：由于 \(0.0102\) (1.02%) 小于 0.05 (5%)，我们拒绝 \(H_0\)。有显著证据显示该骰子偏向出现 6。

总结：黄金法则

- 务必在开头定义 \(p\)。
- 务必在最终结论使用“有证据显示 (evidence to suggest)”——永远不要说你已经“证明 (proven)”了 100%。在统计学上，我们只会说有“强而有力的证据”。
- 对于双尾检验，记得将结果与 \(\alpha/2\) 进行比较。
- 如果概率很低，零假设就得走！(这是一个好记的口诀，用来提醒何时该拒绝 \(H_0\))。

你知道吗？假设检验主要由罗纳德·费雪 (Ronald Fisher) 发展，他曾用一个实验来检验一位女士是否真的能分辨出奶茶是“先加奶”还是“先加茶”！(结果她真的做到了！)

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。