Hypothesis testing - Mathematics (8865) - GCE A-Level - Higher 1 (H1)

简介：利用数据作决策

欢迎来到假设检验 (Hypothesis Testing) 的世界！你有没有听过某些说法，并好奇它是否真的正确？例如，一家巧克力公司声称其巧克力棒重量刚好是 50 克，但你怀疑它们可能不足秤。又或者，一位补习老师声称他们的新教学法能让学生分数提高 10 分。

在本章中，我们将学习如何运用数学方法，去判断这些说法是否有数据支持。这就像担任法庭上的法官：我们假设某人是“清白”的（现状），直到我们有足够的“证据”（数据）去证明并非如此。如果起初觉得这些概念比较抽象也不用担心——一旦掌握了当中的步骤，你就会豁然开朗！

1. 核心概念：假设检验的“角色阵容”

要进行检验，我们需要定义两个对立的想法：

虚无假设 \( (H_0) \)

你可以把 \( H_0 \) 想成是“现状”或“平淡”的版本。它假设没有任何事情发生改变，或者制造商的说法是正确的。
例子：“巧克力棒的平均重量为 50 克。” (\( H_0: \mu = 50 \))

对立假设 \( (H_1) \)

这是“令人兴奋”的版本——也就是你真正想要测试或寻找证据支持的说法。
例子：“平均重量实际上少于 50 克。” (\( H_1: \mu < 50 \))

显著性水平 \( (\alpha) \)

这是我们对“证据”的要求门槛。通常设定为 5% (\( 0.05 \)) 或 1% (\( 0.01 \))。它代表了我们愿意承担犯错的风险程度。如果结果纯粹由随机因素造成的概率低于此水平，我们就会拒绝那个“平淡”的 \( H_0 \)。

重点重温：
- \( H_0 \)：必须使用等号 (\( = \))。
- \( H_1 \)：使用 \( < \)、\( > \) 或 \( \neq \)。
- 证据：只有当我们的数据极不可能由随机因素造成时，我们才会拒绝 \( H_0 \)。

2. 单尾与双尾检验

我们如何知道 \( H_1 \) 该用什么符号？这取决于我们想测试什么！

单尾检验 (One-Tailed Test，方向性)：我们明确地寻找增加或减少的趋势。
例子：“新药物是否增加了反应时间？”(\( H_1: \mu > \text{数值} \)) 或“节食是否减少了体重？”(\( H_1: \mu < \text{数值} \))。

双尾检验 (Two-Tailed Test，非方向性)：我们只想知道数值是否改变了或有差异，而不论它是增加还是减少。
例子：“机器是否仍校准正确，或者平均重量是否不同于 50 克？”(\( H_1: \mu \neq 50 \))。

记忆小撇步：
如果题目出现“增加”、“减少”、“多于”或“少于” → 单尾。
如果题目出现“改变”、“不同”、“有差异”或“说法是否仍然成立” → 双尾。

3. 检验统计量与 p-value

为了作出决策，我们需要将样本数据转化为一个标准化的分数，称为检验统计量 (Test Statistic, \( Z \))。对于 H1 数学，我们集中处理总体平均数 (\( \mu \))。

检验统计量的公式为：
\( Z = \frac{\bar{x} - \mu}{\sigma / \sqrt{n}} \)

其中：
- \( \bar{x} \) 是样本平均数。
- \( \mu \) 是来自 \( H_0 \) 的总体平均数。
- \( \sigma \) 是总体标准差。
- \( n \) 是样本大小。

p-value (p 值)

这是你的图形计算器 (GC) 会给你的“神奇数字”。它代表了如果 \( H_0 \) 是正确的前提下，获得你现有样本结果的概率。

黄金法则：
- 若 p-value \( < \alpha \)：结果是“显著”的，拒绝 \( H_0 \)。
- 若 p-value \( \geq \alpha \)：证据不足，不拒绝 \( H_0 \)。

你知道吗？在现实世界中，许多科学发现只有在 p-value 小于 0.05 时才被承认。这是证明效力的“黄金标准”！

4. 什么时候可以使用这个检验？

根据 8865 课程大纲，我们主要在两种情况下使用 \( Z \)-检验：

情况 A：总体呈正态分布且方差已知
如果题目指出总体为“正态分布”并且给出了总体方差 (\( \sigma^2 \))，你就可以直接进行检验！

情况 B：大样本 (中心极限定理)
如果总体不呈正态分布（或我们不知道其分布），但样本大小足够大 (\( n \geq 30 \))，根据中心极限定理 (CLT)，我们依然可以将样本平均数视为正态分布！

专家提示：如果你不知道总体方差 (\( \sigma^2 \))，你必须使用由样本计算出的无偏总体方差估计值 (\( s^2 \))。

5. 解题步骤指南

如果觉得步骤繁多也不用担心，每次只要跟随这 5 个步骤即可：

步骤 1：列出假设
写出 \( H_0: \mu = \text{数值} \) 和 \( H_1: \mu (<, >, \text{或} \neq) \text{数值} \)。并用文字清楚定义 \( \mu \) 是什么！

步骤 2：列出显著性水平
例如：“在 5% 的显著性水平下进行检验。”

步骤 3：列出分布与检验统计量
确认你使用的是正态分布还是 CLT (\( n \geq 30 \))。计算你的 \( Z \) 值（或交由 GC 计算）。

步骤 4：找出 p-value (或临界区域)
使用图形计算器的“Z-Test”功能，输入 \( \mu_0 \)、\( \sigma \)、\( \bar{x} \) 和 \( n \)。

步骤 5：作出结论
比较 p-value 与 \( \alpha \)。
“由于 p-value = 0.03 < 0.05，我们拒绝 \( H_0 \)。在 5% 的显著性水平下，有足够证据显示平均重量已经减少。”

6. 临界区域与临界值

有时我们不使用 p-value，而是观察临界区域 (Critical Region)。这就是图表上显示的“拒绝区”。

如果计算出的 \( Z \)-统计量落在临界区域内，你就拒绝 \( H_0 \)。

以 5% 单尾检验（右尾）为例：
临界值 (Critical Value) 是 \( Z = 1.645 \)。如果计算出的 \( Z > 1.645 \)，就代表进入了“拒绝区”。

避免常见错误：
当进行 5% 显著性水平的双尾检验时，你必须将 5% 分成两半！你需要寻找尾部的 2.5% (\( 0.025 \))。如果你的 GC 设置正确（选择 \( \neq \) 选项），它通常会自动处理，但在回答概念性问题时要特别注意！

总结：关键要点

1. 假设： \( H_0 \) 是预设情况；\( H_1 \) 是你要测试的对象。
2. 决策规则： 如果 p-value < 显著性水平，则拒绝 \( H_0 \)。
3. 大样本： 如果 \( n \geq 30 \)，即使总体非正态，我们也能使用 Z-检验（归功于 CLT）。
4. 重视情境： 最终答案必须结合题目的实际背景（例如：“植物的平均高度为...”）。
5. 永远不要说“接受 \( H_0 \)”： 我们只能“拒绝 \( H_0 \)”或“不拒绝 \( H_0 \)”。我们并没有证明 \( H_0 \) 是 100% 正确的；只是目前没有足够的证据去否定它！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。