统计假设检验导论
欢迎!如果你曾经好奇科学家是如何判断一种新药是否有效,或者厂商如何证明他们的灯泡真的能像宣称的那样耐用,那么你就是在接触统计假设检验 (Statistical Hypothesis Testing)。在本章中,我们将学习根据数据进行决策的正式“游戏规则”。如果刚开始觉得这些概念有点抽象,别担心;一旦你掌握了相关术语,这就像跟着食谱做菜一样简单!
1. 假设检验的语言
在进行任何计算之前,我们需要先熟悉它的专业术语。你可以把假设检验想象成一场法庭审讯。
关键术语
- 零假设 (Null Hypothesis, \(H_0\)): 这代表“在证明有罪前假定无罪”的立场。我们假设一切正常或与先前宣称的一致。例如:“这枚硬币是公平的”(\(p = 0.5\))。
- 对立假设 (Alternative Hypothesis, \(H_1\)): 这就是你试图证明的内容。例如:“这枚硬币有偏差”(\(p \neq 0.5\))。
- 检验统计量 (Test Statistic): 我们所收集的实际证据(例如:投掷 20 次硬币中出现正面次数的结果)。
- 显著性水平 (Significance Level, \(\alpha\)): 判断的“门槛”。通常设定为 5% (0.05) 或 1% (0.01)。这是当零假设实际上为真时,我们却错误地拒绝它的概率。
- 拒绝域 (Critical Region): 导致我们认定为“有罪”(拒绝 \(H_0\))的检验统计量数值范围。
- 临界值 (Critical Value): 划定拒绝域边界的数值。
- p 值 (p-value): 在假设 \(H_0\) 为真的前提下,获得目前结果(或更极端结果)的概率。
单尾检验 vs. 双尾检验
如何知道该用哪一种?观察题目中的字眼就知道了!
- 单尾检验 (1-tail test): 当宣称涉及特定方向时使用。
例子:“这种新肥料是否更好?”(\(H_1: p > 0.5\)) 或“机器是否装填不足?”(\(H_1: p < 0.5\))。 - 双尾检验 (2-tail test): 当宣称内容仅表示某事物已经改变或有所不同时使用。
例子:“这枚硬币是否有偏差?”(\(H_1: p \neq 0.5\))。
快速复习: 在 5% 显著性水平的双尾检验中,你需要将显著性水平平分为两端,即底端占 2.5%,顶端占 2.5%。
重点提示: 务必以总体参数(如 \(p\) 或 \(\mu\))清楚定义你的假设。
2. 比例检验(二项分布)
当我们固定次数的试验中计算“成功”次数时,会使用此方法。
步骤流程
- 列出你的假设: 使用 \(p\) 作为总体比例。\(H_0: p = \dots\) 以及 \(H_1: p \dots\)
- 识别分布: 假设 \(H_0\) 为真,则 \(X \sim B(n, p)\)。
- 计算 p 值: 使用计算器找出你的结果或更极端结果的概率。
- 若检验大于:\(P(X \geq \text{observed})\)
- 若检验小于:\(P(X \leq \text{observed})\)
- 比较: 如果你的 p 值小于显著性水平,则拒绝 \(H_0\)。
- 在语境中下结论: 务必写出类似“在 5% 的显著性水平下,有足够的证据显示……”的句子。
例子:一位烘焙师宣称他烤的蛋糕有 90% 会发起来。你买了 20 个,只有 15 个发起来。他在夸大其词吗?
\(H_0: p = 0.9\)
\(H_1: p < 0.9\)
我们使用 \(B(20, 0.9)\) 来检验 \(P(X \leq 15)\)。如果该概率非常小(小于我们的显著性水平),我们就可以戳破他的谎言!
常见错误: 学生常忘记在概率中包含“等于”的部分(例如计算 \(P(X < 15)\) 而非 \(P(X \leq 15)\))。请务必包含观察值!
3. 相关性检验 (PMCC)
这用于检验总体中两个变量之间是否存在线性关系。
参数说明
- \(r\): 样本相关系数(你从数据中计算出来的)。
- \(\rho\) (rho): 总体相关系数(我们试图猜测的“真实”关系)。
相关性的假设
- \(H_0: \rho = 0\)(无线性相关)。
- \(H_1: \rho > 0\)(正相关)、\(\rho < 0\)(负相关)或 \(\rho \neq 0\)(有相关性)。
你知道吗? 你不需要计算 \(\rho\)。你只需使用计算器计算 \(r\),然后根据你的样本大小 (\(n\)) 和显著性水平,与临界值表(附在公式册中)进行比较。
重点提示: 如果你计算出的 \(|r|\) 大于临界值,则代表相关性“足够强”,足以拒绝无相关性的假设。
4. 平均数检验(正态分布)
当我们已知总体方差,并想根据样本检验平均数 (\(\mu\)) 是否已改变时,会使用此方法。
前置知识:样本平均数的分布
若总体为 \(X \sim N(\mu, \sigma^2)\),则大小为 \(n\) 的样本之平均数分布为: \( \bar{X} \sim N(\mu, \frac{\sigma^2}{n}) \)
记忆小贴士: 当样本大小 (\(n\)) 变大时,“离散程度”(标准误)会变小。这很合理,因为大样本更可靠!
检验统计量(标准化)
为了找出样本平均数与宣称平均数相差了几个标准差,我们使用: \( Z = \frac{\bar{X} - \mu}{\sigma / \sqrt{n}} \)
接着将此 \(Z\) 值与标准正态分布 \(N(0, 1^2)\) 进行比较。
正态检验步骤
- 列出 \(H_0: \mu = \dots\) 与 \(H_1: \mu \dots\)
- 写下样本平均数的分布:\(\bar{X} \sim N(\mu, \frac{\sigma^2}{n})\)。
- 找出 p 值:\(P(\bar{X} > \text{observed mean})\) 或 \(P(\bar{X} < \text{observed mean})\)。
- 与显著性水平比较并下结论。
快速复习盒:
对于 5% 的单尾检验,临界 Z 值为 1.6449。
对于 5% 的双尾检验,临界 Z 值为 \(\pm 1.96\)。
最后的鼓励
假设检验看起来步骤繁多,但逻辑非常清晰。只要记住:设定假设 \(\rightarrow\) 进行检验 \(\rightarrow\) 进行比较 \(\rightarrow\) 下结论。 保持书写规范,并务必将最终答案与题目中的实际情境连接起来。你一定可以的!