欢迎来到 1 个及 2 个样本的假设检验!
在之前的学习中,你可能接触过各种条件都十分“完美”的假设检验——例如已知总体方差,或者样本量非常大。但在现实世界中,我们很少能掌握所有事实。本章的主旨是让你化身为统计侦探,在信息不足,或想要比较两组不同数据(例如评估新药是否比旧药更有效)时,懂得如何分析问题。
别担心这看起来比基础检验复杂。我们会一步步拆解,并使用你已经熟悉的逻辑:零假设 (Null Hypothesis)、检验统计量 (Test Statistic) 和 结论 (Conclusion)。
1. 单一平均数的检验:t 分布
(课程大纲 16.1)
在之前的章节中,你使用了正态 (\(z\)) 分布。但如果你不知道总体方差 (\(\sigma^2\)),而且样本量又很少呢?这就是 t 分布 大显身手的时候了。
何时使用 t 检验:
当以下情况满足时,请使用单一样本 t 检验:
1. 总体 方差未知。
2. 样本量 较小 (通常 \(n < 30\))。
3. 总体本身符合 正态分布(这是一个至关重要的假设!)。
“安全边际”的类比
你可以把 \(t\) 分布想象成一个“更谨慎”版本的正态分布。由于我们是从少量样本中估算方差,因此我们无法百分之百确定其精确度。与正态分布相比,\(t\) 分布有“更肥的尾部”(fatter tails),这意味着除非证据非常强烈,否则很难拒绝零假设。随着样本量 (\(n\)) 增加,\(t\) 分布会变得越来越像正态分布!
关键公式:
检验统计量的计算方式为:
\(t = \frac{\bar{x} - \mu}{s / \sqrt{n}}\)
其中 \(s\) 是你的样本标准差。你还需要知道 自由度 (degrees of freedom) (\(v\)),计算方式很简单:\(v = n - 1\)。
快速复习箱:
小样本 + 方差未知 + 总体正态 = 使用 t 检验!
2. 比较两个平均数(独立样本)
(课程大纲 16.2 & 16.3)
有时我们想知道两组之间是否有差异。例如:“A 校学生的成绩是否比 B 校学生高?”
情境 A:已知方差(z 检验)
如果你真的知道两个总体的方差 (\(\sigma_1^2\) 和 \(\sigma_2^2\)),则使用 \(z\) 分布。
检验统计量:
\(z = \frac{(\bar{x}_1 - \bar{x}_2) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}}\)
通常我们的零假设是两者无差异,因此 \((\mu_1 - \mu_2) = 0\)。
情境 B:方差未知但相等(合并 t 检验 - Pooled t-test)
这在现实中更常见。如果我们不知道方差,但假设两组的方差 相等,我们会将数据“合并”(pool) 起来,以获得对该共同方差更好的估计。
你知道吗? 只有在两个总体都符合正态分布且方差相等时,此检验才有效。在考试中你不需要证明方差相等,但你必须将其明确列为假设条件!
“合并”步骤:
首先,计算 合并方差估计值 (\(s_p^2\)):
\(s_p^2 = \frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2}\)
然后,求出检验统计量:
\(t = \frac{\bar{x}_1 - \bar{x}_2}{s_p \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}\)
对于此检验,自由度为 \(v = n_1 + n_2 - 2\)。
记忆小撇步: 把“合并”(Pooling) 想象成百家宴 (potluck dinner)。与其每个人吃自己的食物(分开的方差),不如把所有食物放进一个大碗里(合并方差)共同分享!
重点提示: 如果你在关于两个平均数的题目中看到“假设方差相等”(assume equal variances),记得去查阅小册子中的 合并方差 (pooled variance) 公式。
3. 两个二项比例的差异
(课程大纲 16.4)
如果数据不是“平均数”而是“比例”怎么办?例如:“城镇 A 和城镇 B 支持某项法律的人口比例是否不同?”
方法:
就像处理平均数一样,如果我们在零假设下假设两个比例相等,我们就使用比例 (\(p\)) 的 合并估计值。
合并比例 (\(\hat{p}\)):
\(\hat{p} = \frac{x_1 + x_2}{n_1 + n_2}\) (总成功次数除以总试验次数)
检验统计量:
\(z = \frac{p_1 - p_2}{\sqrt{\hat{p}(1 - \hat{p})(\frac{1}{n_1} + \frac{1}{n_2})}}\)
常见错误: 千万别忘记这是 \(z\) 检验,不是 \(t\) 检验!对于比例问题,我们使用正态近似法。
4. 在情境中诠释结果
(课程大纲 16.5)
统计学中最重要的一环就是解释你的数字代表什么。如果你算对了所有数学结果,却没有解释答案,你会损失很多不该失的分数!
如何撰写结论:
1. 比较: 说明你的检验统计量是否落在拒绝域内 (例如:“由于 2.45 > 1.96...”),或是 p-value 是否小于显著性水平。
2. 决策: 表明你是“拒绝 \(H_0\)”还是“无法拒绝 \(H_0\)”。
3. 情境: 使用题目中的关键词。避免过于“武断”。
不要写: “这证明了药物有效。”
要写: “在 5% 的显著性水平下,有 显著证据 表明平均康复时间已缩短。”
关键点: 统计学讲的是 证据 (evidence),而非 证明 (proof)。永远使用像“显示”(suggests that) 或“迹象表明”(evidence to indicate) 之类的词汇。
总结检查表
- 单一平均数(小样本,\(\sigma\) 未知): 使用 \(t\) 检验,自由度 \(v = n - 1\)。
- 两个平均数(已知 \(\sigma\)): 使用 \(z\) 检验。
- 两个平均数(未知但相等 \(\sigma\)): 使用合并 \(t\) 检验,自由度 \(v = n_1 + n_2 - 2\)。
- 两个比例: 使用合并 \(z\) 检验。
- 有效性: 进行 \(t\) 检验时,务必确认总体是否为 正态分布!