Hypothesis testing for 1 and 2 samples

欢迎来到 1 个及 2 个样本的假设检验！

在之前的学习中，你可能接触过各种条件都十分“完美”的假设检验——例如已知总体方差，或者样本量非常大。但在现实世界中，我们很少能掌握所有事实。本章的主旨是让你化身为统计侦探，在信息不足，或想要比较两组不同数据（例如评估新药是否比旧药更有效）时，懂得如何分析问题。

别担心这看起来比基础检验复杂。我们会一步步拆解，并使用你已经熟悉的逻辑：零假设 (Null Hypothesis)、检验统计量 (Test Statistic) 和 结论 (Conclusion)。

1. 单一平均数的检验：t 分布

(课程大纲 16.1)

在之前的章节中，你使用了正态 (\(z\)) 分布。但如果你不知道总体方差 (\(\sigma^2\))，而且样本量又很少呢？这就是 t 分布 大显身手的时候了。

何时使用 t 检验：

当以下情况满足时，请使用单一样本 t 检验：
1. 总体 方差未知。
2. 样本量较小 (通常 \(n < 30\))。
3. 总体本身符合 正态分布（这是一个至关重要的假设！）。

“安全边际”的类比

你可以把 \(t\) 分布想象成一个“更谨慎”版本的正态分布。由于我们是从少量样本中估算方差，因此我们无法百分之百确定其精确度。与正态分布相比，\(t\) 分布有“更肥的尾部”(fatter tails)，这意味着除非证据非常强烈，否则很难拒绝零假设。随着样本量 (\(n\)) 增加，\(t\) 分布会变得越来越像正态分布！

关键公式：

检验统计量的计算方式为：
\(t = \frac{\bar{x} - \mu}{s / \sqrt{n}}\)
其中 \(s\) 是你的样本标准差。你还需要知道 自由度 (degrees of freedom) (\(v\))，计算方式很简单：\(v = n - 1\)。

快速复习箱：
小样本 + 方差未知 + 总体正态 = 使用 t 检验！

2. 比较两个平均数（独立样本）

(课程大纲 16.2 & 16.3)

有时我们想知道两组之间是否有差异。例如：“A 校学生的成绩是否比 B 校学生高？”

情境 A：已知方差（z 检验）

如果你真的知道两个总体的方差 (\(\sigma_1^2\) 和 \(\sigma_2^2\))，则使用 \(z\) 分布。
检验统计量：
\(z = \frac{(\bar{x}_1 - \bar{x}_2) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}}\)
通常我们的零假设是两者无差异，因此 \((\mu_1 - \mu_2) = 0\)。

情境 B：方差未知但相等（合并 t 检验 - Pooled t-test）

这在现实中更常见。如果我们不知道方差，但假设两组的方差相等，我们会将数据“合并”(pool) 起来，以获得对该共同方差更好的估计。

你知道吗？ 只有在两个总体都符合正态分布且方差相等时，此检验才有效。在考试中你不需要证明方差相等，但你必须将其明确列为假设条件！

“合并”步骤：

首先，计算 合并方差估计值 (\(s_p^2\))：
\(s_p^2 = \frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2}\)

然后，求出检验统计量：
\(t = \frac{\bar{x}_1 - \bar{x}_2}{s_p \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}\)
对于此检验，自由度为 \(v = n_1 + n_2 - 2\)。

记忆小撇步： 把“合并”(Pooling) 想象成百家宴 (potluck dinner)。与其每个人吃自己的食物（分开的方差），不如把所有食物放进一个大碗里（合并方差）共同分享！

重点提示： 如果你在关于两个平均数的题目中看到“假设方差相等”(assume equal variances)，记得去查阅小册子中的 合并方差 (pooled variance) 公式。

3. 两个二项比例的差异

(课程大纲 16.4)

如果数据不是“平均数”而是“比例”怎么办？例如：“城镇 A 和城镇 B 支持某项法律的人口比例是否不同？”

方法：

就像处理平均数一样，如果我们在零假设下假设两个比例相等，我们就使用比例 (\(p\)) 的 合并估计值。
合并比例 (\(\hat{p}\))：
\(\hat{p} = \frac{x_1 + x_2}{n_1 + n_2}\) (总成功次数除以总试验次数)

检验统计量：

\(z = \frac{p_1 - p_2}{\sqrt{\hat{p}(1 - \hat{p})(\frac{1}{n_1} + \frac{1}{n_2})}}\)

常见错误： 千万别忘记这是 \(z\) 检验，不是 \(t\) 检验！对于比例问题，我们使用正态近似法。

4. 在情境中诠释结果

(课程大纲 16.5)

统计学中最重要的一环就是解释你的数字代表什么。如果你算对了所有数学结果，却没有解释答案，你会损失很多不该失的分数！

如何撰写结论：

1. 比较： 说明你的检验统计量是否落在拒绝域内 (例如：“由于 2.45 > 1.96...”)，或是 p-value 是否小于显著性水平。
2. 决策： 表明你是“拒绝 \(H_0\)”还是“无法拒绝 \(H_0\)”。
3. 情境： 使用题目中的关键词。避免过于“武断”。
不要写： “这证明了药物有效。”
要写： “在 5% 的显著性水平下，有 显著证据 表明平均康复时间已缩短。”

关键点： 统计学讲的是 证据 (evidence)，而非 证明 (proof)。永远使用像“显示”(suggests that) 或“迹象表明”(evidence to indicate) 之类的词汇。

总结检查表

- 单一平均数（小样本，\(\sigma\) 未知）： 使用 \(t\) 检验，自由度 \(v = n - 1\)。
- 两个平均数（已知 \(\sigma\)）： 使用 \(z\) 检验。
- 两个平均数（未知但相等 \(\sigma\)）： 使用合并 \(t\) 检验，自由度 \(v = n_1 + n_2 - 2\)。
- 两个比例： 使用合并 \(z\) 检验。
- 有效性： 进行 \(t\) 检验时，务必确认总体是否为 正态分布！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。