🚀 使用正态分布与 t 分布进行统计推断:学习笔记(9231 Further Statistics)

欢迎来到 Further Statistics 中最强大、最实用的章节之一!本节的核心在于:即使我们手中只有少量的数据(样本),也要学会如何对庞大的总体做出稳健的决策和预测。

在之前的学习中,你已经广泛使用了正态分布(Z-检验),通常是假设已知总体方差(\(\sigma^2\))或者样本量足够大。但在现实世界中,我们往往不知道 \(\sigma^2\),且数据集可能非常小。这时,t 分布就是你的救星!

你将学习如何选择正确的检验方法(Z 检验或 t 检验),并利用它进行假设检验以及构建总体均值的置信区间。


1. 快速回顾:何时使用 Z 检验 vs. t 检验

在正态分布(Z-检验)和 t 分布之间进行选择,取决于两个因素:样本量 (\(n\)) 以及是否已知总体方差 (\(\sigma^2\))

正态分布(Z-检验):黄金标准

当我们对总体参数有充分的把握时,我们会依赖标准正态分布(Z)。

  • 情况 1:已知总体方差(无论样本量 \(n\) 大小如何)。
  • 情况 2:样本量较大(\(n \ge 30\)),即使总体方差未知。为什么呢?这是因为中心极限定理(Central Limit Theorem);当 \(n\) 较大时,样本方差(\(s^2\))是总体方差(\(\sigma^2\))的一个非常好的估计,抽样分布本质上趋于正态分布。

t 分布:小样本专家

当我们面对真正的不确定性时,使用 t 分布。

  • 情况 3:总体方差未知且样本量较小(\(n < 30\))。

💡 类比: 将 Z-检验想象成一把锋利、精确的手术刀,当你确切知道自己在切什么时使用它。而 t 分布则像一把稍微钝一点的刀;因为它给了你更大的误差范围,这是因为你对估计精度的把握没那么足。

关键点: 如果 \(\sigma^2\) 未知且 \(n\) 较小,你必须使用 t 分布。这是 9231 均值推断部分的核心。

2. 理解 t 分布

a) 什么是 t 分布?

t 分布(或称学生 t 分布)与正态分布相似:它们都是对称的、钟形的,并以零为中心。然而,与标准正态分布(Z)相比,t 分布通常更扁平,且尾部更厚。这反映了当我们使用样本方差 \(s^2\) 来估计 \(\sigma^2\) 时所引入的额外不确定性。

b) 自由度 (\(\nu\))

t 分布的形状随着其自由度 (\(\nu\)) 的变化而变化。

  • 对于大小为 \(n\) 的单样本,自由度总是:\(\nu = n - 1\)。
  • 随着 \(\nu\) 的增加(即样本量 \(n\) 变大),t 分布变得越来越窄,并逐渐趋近于标准正态分布(Z)。

为什么要 \(n-1\)? 在计算样本均值 (\(\bar{x}\)) 以估计方差时,我们“用掉”了一条信息(即一个自由度)。如果你已知 \(\bar{x}\) 和 \(n-1\) 个数值,最后一个值也就固定了。因此,只有 \(n-1\) 个值是可以“自由变动”的。


3. 单个总体均值 (\(\mu\)) 的推断

当我们从总体方差未知的总体中抽取小样本(\(n < 30\))时,使用 t 检验。

a) 假设检验(t-检验)

统计量 \(T\) 用来衡量样本均值 (\(\bar{x}\)) 与零假设 \(H_0\) 中提出的总体均值 (\(\mu_0\)) 之间相差了几个标准误。

第 1 步:建立假设

示例:\(H_0: \mu = 50\) 对比 \(H_1: \mu \ne 50\)(双尾检验)。

第 2 步:计算方差的无偏估计 (\(s^2\))

总体方差 \(\sigma^2\) 由无偏样本方差 \(s^2\) 估计。如果题目给出的是原始数据,你必须先计算它:

$$s^2 = \frac{1}{n-1} \sum (x - \bar{x})^2$$

第 3 步:计算检验统计量 T

$$T = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}$$

其中 \(s / \sqrt{n}\) 是均值的估计标准误。

第 4 步:确定自由度和临界值

自由度:\(\nu = n - 1\)。根据 \(\nu\) 和显著性水平 (\(\alpha\)),从统计表(MF19,第 41 页)中查出临界 t 值。

第 5 步:结论

将计算出的 \(T\) 值与临界值对比,或者将 p 值与 \(\alpha\) 对比。如果 \(|T| > t_{\text{crit}}\),则拒绝 \(H_0\)。

b) \(\mu\) 的置信区间 (CI)

置信区间给出了一个数值范围,真实总体均值 \(\mu\) 很可能落在这个范围内。由于 \(\sigma^2\) 未知且 \(n\) 较小,我们使用 t 分布的临界值。

\(\mu\) 的置信区间公式为:

$$\bar{x} \pm t_{\text{crit}} \times \frac{s}{\sqrt{n}}$$

  • \(\bar{x}\) 是样本均值。
  • \(t_{\text{crit}}\) 是使用 \(\nu = n - 1\) 和所需置信水平查表得到的临界 t 值(例如,95% 置信区间,查 MF19 t 表中 0.975 那一列)。
  • \(\frac{s}{\sqrt{n}}\) 是估计标准误。
易错提醒! 切记:在求 95% 置信区间时,双尾检验对应 t 表中 \(p = 0.975\) 的值(因为 \(1 - 0.95 = 0.05\),且 \(0.05/2 = 0.025\),所以 \(p = 1 - 0.025 = 0.975\))。

4. 两个总体均值之差 (\(\mu_1 - \mu_2\)) 的推断

本节非常关键,要求你准确识别样本是独立的还是相关的(配对的),以及样本量是大是小。

情景 A:大样本(Z-检验)

如果两个样本量 \(n_1\) 和 \(n_2\) 都较大(\(\ge 30\)),我们使用正态(Z)分布,用样本方差 \(s_1^2\) 和 \(s_2^2\) 代替 \(\sigma_1^2\) 和 \(\sigma_2^2\)。

检验统计量:

$$Z = \frac{(\bar{x}_1 - \bar{x}_2) - 0}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}$$

置信区间:

$$(\bar{x}_1 - \bar{x}_2) \pm Z_{\text{crit}} \times \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}$$

情景 B:小独立样本(双样本 t-检验)

当我们有两个来自正态分布的小独立样本,且假设两个总体具有相同的未知方差(\(\sigma_1^2 = \sigma_2^2 = \sigma^2\))时,使用此检验。

第 1 步:计算合并方差估计 (\(s_p^2\))

由于假设方差相同,我们将数据“合并”以获得对该共同方差的单一且更好的估计。MF19(第 39 页)提供的公式是:

$$s_p^2 = \frac{\sum(x_1 - \bar{x}_1)^2 + \sum(x_2 - \bar{x}_2)^2}{n_1 + n_2 - 2}$$

注意:\(\sum(x - \bar{x})^2\) 通常被称为离差平方和 (Sum of Squares, SS)。此公式本质上就是 \((SS_1 + SS_2) / (n_1 + n_2 - 2)\)。

第 2 步:计算检验统计量 T

$$T = \frac{(\bar{x}_1 - \bar{x}_2) - 0}{\sqrt{s_p^2 \left(\frac{1}{n_1} + \frac{1}{n_2}\right)}}$$

第 3 步:自由度 (\(\nu\))

当合并两个独立样本时,自由度为各自自由度之和:

$$\nu = (n_1 - 1) + (n_2 - 1) = n_1 + n_2 - 2$$

第 4 步:\(\mu_1 - \mu_2\) 的置信区间

$$(\bar{x}_1 - \bar{x}_2) \pm t_{\text{crit}} \times \sqrt{s_p^2 \left(\frac{1}{n_1} + \frac{1}{n_2}\right)}$$

如果起初觉得这很复杂,别担心! 最难的部分是计算 \(s_p^2\)。一旦算出来,剩下的只需将数值代入使用相应自由度的标准 t 公式即可。

情景 C:配对样本 t-检验(相关样本)

当测量值自然相关时使用此检验(例如:比较同一组人的“前”和“后”分数,或比较同卵双胞胎)。

这里的妙招是:我们不将其视为两个独立的组,而是将配对分数的差值视为单个样本。

配对 t-检验步骤:

  1. 计算每一对的差值 \(d\) (\(d = x_1 - x_2\))。
  2. 计算差值的平均值 \(\bar{d}\) 和差值的标准差 \(s_d\)。
  3. 假设检验简化为对差值的单样本 t-检验,检验平均差值 \(\mu_d\) 是否为零(即 \(H_0: \mu_d = 0\))。

检验统计量:

$$T = \frac{\bar{d} - 0}{s_d / \sqrt{n}}$$

其中 \(n\) 是配对的数量。

自由度:

$$\nu = n - 1$$

\(\mu_d\) 的置信区间:

$$\bar{d} \pm t_{\text{crit}} \times \frac{s_d}{\sqrt{n}}$$

选择正确检验方法的辅助总结:
  • 单样本,\(\sigma^2\) 已知或 \(n\) 大: Z-检验(正态)
  • 单样本,\(\sigma^2\) 未知,\(n\) 小: t-检验 (\(\nu = n-1\))
  • 双样本,独立,\(n\) 大: Z-检验(正态近似)
  • 双样本,独立,\(n\) 小: 双样本 t-检验(合并方差,\(\nu = n_1 + n_2 - 2\))
  • 双样本,相关/配对: 配对 t-检验(对差值进行单样本分析,\(\nu = n-1\))

5. 处理置信区间 (CI)

置信区间是假设检验的补充。如果假设的均值(\(\mu_0\) 或 \(\mu_1 - \mu_2 = 0\))落在了计算出的置信区间之外,那么你将在相应的显著性水平上拒绝零假设。

a) 确定适当的 CI 公式

寻找 CI 的过程与选择假设检验方法的过程是一致的:

  1. 确定参数: 你是在估计单个均值 (\(\mu\)) 还是均值之差 (\(\mu_1 - \mu_2\))?
  2. 确定分布: 是正态 (Z) 还是 t (T)?(基于样本量 \(n\) 和是否已知 \(\sigma^2\))。
  3. 确定临界值: 查出 \(Z_{\text{crit}}\)(来自正态表)或 \(t_{\text{crit}}\)(使用相应的自由度查 t 表)。

任何置信区间的结构都是:

$$(\text{点估计}) \pm (\text{临界值}) \times (\text{标准误})$$

b) 解读置信区间

95% 的置信区间并不意味着真实总体均值有 95% 的概率落在这个特定的区间内。它真正的含义是:如果我们重复抽样过程多次,所构建出来的 95% 的置信区间都将包含真实总体均值。

示例:如果方法 A 和方法 B 之间均值差的 95% 置信区间是 (2.5, 4.1),由于该区间不包含零,我们可以 95% 地确信方法 A 优于方法 B。

c) 你知道吗?

t 分布最初是由 William Sealy Gosset 在 1908 年提出的。他在健力士(Guinness)啤酒厂工作,利用小样本来监控啤酒质量。由于公司规定禁止他以个人名义发表文章,他使用了“Student”(学生)这个笔名,因此该分布被称为“学生 t 分布”。

快速回顾:必备要素

要在本章中取得成功,请确保你能迅速识别出题目中的三个要点:

  1. 样本量是大还是小?
  2. 总体方差 \(\sigma^2\) 是已知还是未知?
  3. 样本是独立还是配对的?

回答这些问题将直接引导你找到正确的检验统计量(Z 或 T)以及正确的自由度 (\(\nu\))。

坚持练习选择正确的步骤,你一定能掌握这个主题!