Inference using normal and t-distributions

🚀 使用正态分布与 t 分布进行统计推断：学习笔记（9231 Further Statistics）

欢迎来到 Further Statistics 中最强大、最实用的章节之一！本节的核心在于：即使我们手中只有少量的数据（样本），也要学会如何对庞大的总体做出稳健的决策和预测。

在之前的学习中，你已经广泛使用了正态分布（Z-检验），通常是假设已知总体方差（$\sigma^2$）或者样本量足够大。但在现实世界中，我们往往不知道 $\sigma^2$，且数据集可能非常小。这时，t 分布就是你的救星！

你将学习如何选择正确的检验方法（Z 检验或 t 检验），并利用它进行假设检验以及构建总体均值的置信区间。

1. 快速回顾：何时使用 Z 检验 vs. t 检验

在正态分布（Z-检验）和 t 分布之间进行选择，取决于两个因素：样本量 ($n$) 以及是否已知总体方差 ($\sigma^2$)。

正态分布（Z-检验）：黄金标准

当我们对总体参数有充分的把握时，我们会依赖标准正态分布（Z）。

情况 1：已知总体方差（无论样本量 $n$ 大小如何）。
情况 2：样本量较大（$n \ge 30$），即使总体方差未知。为什么呢？这是因为中心极限定理（Central Limit Theorem）；当 $n$ 较大时，样本方差（$s^2$）是总体方差（$\sigma^2$）的一个非常好的估计，抽样分布本质上趋于正态分布。

t 分布：小样本专家

当我们面对真正的不确定性时，使用 t 分布。

情况 3：总体方差未知且样本量较小（$n < 30$）。

💡 类比： 将 Z-检验想象成一把锋利、精确的手术刀，当你确切知道自己在切什么时使用它。而 t 分布则像一把稍微钝一点的刀；因为它给了你更大的误差范围，这是因为你对估计精度的把握没那么足。

关键点： 如果 $\sigma^2$ 未知且 $n$ 较小，你必须使用 t 分布。这是 9231 均值推断部分的核心。

2. 理解 t 分布

a) 什么是 t 分布？

t 分布（或称学生 t 分布）与正态分布相似：它们都是对称的、钟形的，并以零为中心。然而，与标准正态分布（Z）相比，t 分布通常更扁平，且尾部更厚。这反映了当我们使用样本方差 $s^2$ 来估计 $\sigma^2$ 时所引入的额外不确定性。

b) 自由度 ($\nu$)

t 分布的形状随着其自由度 ($\nu$) 的变化而变化。

对于大小为 $n$ 的单样本，自由度总是：$\nu = n - 1$。
随着 $\nu$ 的增加（即样本量 $n$ 变大），t 分布变得越来越窄，并逐渐趋近于标准正态分布（Z）。

为什么要 $n-1$? 在计算样本均值 ($\bar{x}$) 以估计方差时，我们“用掉”了一条信息（即一个自由度）。如果你已知 $\bar{x}$ 和 $n-1$ 个数值，最后一个值也就固定了。因此，只有 $n-1$ 个值是可以“自由变动”的。

3. 单个总体均值 ($\mu$) 的推断

当我们从总体方差未知的总体中抽取小样本（$n < 30$）时，使用 t 检验。

a) 假设检验（t-检验）

统计量 $T$ 用来衡量样本均值 ($\bar{x}$) 与零假设 $H_0$ 中提出的总体均值 ($\mu_0$) 之间相差了几个标准误。

第 1 步：建立假设

示例：$H_0: \mu = 50$ 对比 $H_1: \mu \ne 50$（双尾检验）。

第 2 步：计算方差的无偏估计 ($s^2$)

总体方差 $\sigma^2$ 由无偏样本方差 $s^2$ 估计。如果题目给出的是原始数据，你必须先计算它：

$$s^2 = \frac{1}{n-1} \sum (x - \bar{x})^2$$

第 3 步：计算检验统计量 T

$$T = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}$$

其中 $s / \sqrt{n}$ 是均值的估计标准误。

第 4 步：确定自由度和临界值

自由度：$\nu = n - 1$。根据 $\nu$ 和显著性水平 ($\alpha$)，从统计表（MF19，第 41 页）中查出临界 t 值。

第 5 步：结论

将计算出的 $T$ 值与临界值对比，或者将 p 值与 $\alpha$ 对比。如果 $|T| > t_{\text{crit}}$，则拒绝 $H_0$。

b) $\mu$ 的置信区间 (CI)

置信区间给出了一个数值范围，真实总体均值 $\mu$ 很可能落在这个范围内。由于 $\sigma^2$ 未知且 $n$ 较小，我们使用 t 分布的临界值。

$\mu$ 的置信区间公式为：

$$\bar{x} \pm t_{\text{crit}} \times \frac{s}{\sqrt{n}}$$

$\bar{x}$ 是样本均值。
$t_{\text{crit}}$ 是使用 $\nu = n - 1$ 和所需置信水平查表得到的临界 t 值（例如，95% 置信区间，查 MF19 t 表中 0.975 那一列）。
$\frac{s}{\sqrt{n}}$ 是估计标准误。

易错提醒！ 切记：在求 95% 置信区间时，双尾检验对应 t 表中 $p = 0.975$ 的值（因为 $1 - 0.95 = 0.05$，且 $0.05/2 = 0.025$，所以 $p = 1 - 0.025 = 0.975$）。

4. 两个总体均值之差 ($\mu_1 - \mu_2$) 的推断

本节非常关键，要求你准确识别样本是独立的还是相关的（配对的），以及样本量是大是小。

情景 A：大样本（Z-检验）

如果两个样本量 $n_1$ 和 $n_2$ 都较大（$\ge 30$），我们使用正态（Z）分布，用样本方差 $s_1^2$ 和 $s_2^2$ 代替 $\sigma_1^2$ 和 $\sigma_2^2$。

检验统计量：

$$Z = \frac{(\bar{x}_1 - \bar{x}_2) - 0}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}$$

置信区间：

$$(\bar{x}_1 - \bar{x}_2) \pm Z_{\text{crit}} \times \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}$$

情景 B：小独立样本（双样本 t-检验）

当我们有两个来自正态分布的小独立样本，且假设两个总体具有相同的未知方差（$\sigma_1^2 = \sigma_2^2 = \sigma^2$）时，使用此检验。

第 1 步：计算合并方差估计 ($s_p^2$)

由于假设方差相同，我们将数据“合并”以获得对该共同方差的单一且更好的估计。MF19（第 39 页）提供的公式是：

$$s_p^2 = \frac{\sum(x_1 - \bar{x}_1)^2 + \sum(x_2 - \bar{x}_2)^2}{n_1 + n_2 - 2}$$

注意：$\sum(x - \bar{x})^2$ 通常被称为离差平方和 (Sum of Squares, SS)。此公式本质上就是 $(SS_1 + SS_2) / (n_1 + n_2 - 2)$。

第 2 步：计算检验统计量 T

$$T = \frac{(\bar{x}_1 - \bar{x}_2) - 0}{\sqrt{s_p^2 \left(\frac{1}{n_1} + \frac{1}{n_2}\right)}}$$

第 3 步：自由度 ($\nu$)

当合并两个独立样本时，自由度为各自自由度之和：

$$\nu = (n_1 - 1) + (n_2 - 1) = n_1 + n_2 - 2$$

第 4 步：$\mu_1 - \mu_2$ 的置信区间

$$(\bar{x}_1 - \bar{x}_2) \pm t_{\text{crit}} \times \sqrt{s_p^2 \left(\frac{1}{n_1} + \frac{1}{n_2}\right)}$$

如果起初觉得这很复杂，别担心！ 最难的部分是计算 $s_p^2$。一旦算出来，剩下的只需将数值代入使用相应自由度的标准 t 公式即可。

情景 C：配对样本 t-检验（相关样本）

当测量值自然相关时使用此检验（例如：比较同一组人的“前”和“后”分数，或比较同卵双胞胎）。

这里的妙招是：我们不将其视为两个独立的组，而是将配对分数的差值视为单个样本。

配对 t-检验步骤：

计算每一对的差值 $d$ ($d = x_1 - x_2$)。
计算差值的平均值 $\bar{d}$ 和差值的标准差 $s_d$。
假设检验简化为对差值的单样本 t-检验，检验平均差值 $\mu_d$ 是否为零（即 $H_0: \mu_d = 0$）。

检验统计量：

$$T = \frac{\bar{d} - 0}{s_d / \sqrt{n}}$$

其中 $n$ 是配对的数量。

自由度：

$$\nu = n - 1$$

$\mu_d$ 的置信区间：

$$\bar{d} \pm t_{\text{crit}} \times \frac{s_d}{\sqrt{n}}$$

选择正确检验方法的辅助总结：

单样本，$\sigma^2$ 已知或 $n$ 大： Z-检验（正态）
单样本，$\sigma^2$ 未知，$n$ 小： t-检验 ($\nu = n-1$)
双样本，独立，$n$ 大： Z-检验（正态近似）
双样本，独立，$n$ 小： 双样本 t-检验（合并方差，$\nu = n_1 + n_2 - 2$）
双样本，相关/配对： 配对 t-检验（对差值进行单样本分析，$\nu = n-1$）

5. 处理置信区间 (CI)

置信区间是假设检验的补充。如果假设的均值（$\mu_0$ 或 $\mu_1 - \mu_2 = 0$）落在了计算出的置信区间之外，那么你将在相应的显著性水平上拒绝零假设。

a) 确定适当的 CI 公式

寻找 CI 的过程与选择假设检验方法的过程是一致的：

确定参数： 你是在估计单个均值 ($\mu$) 还是均值之差 ($\mu_1 - \mu_2$)？
确定分布： 是正态 (Z) 还是 t (T)？（基于样本量 $n$ 和是否已知 $\sigma^2$）。
确定临界值： 查出 $Z_{\text{crit}}$（来自正态表）或 $t_{\text{crit}}$（使用相应的自由度查 t 表）。

任何置信区间的结构都是：

$$(\text{点估计}) \pm (\text{临界值}) \times (\text{标准误})$$

b) 解读置信区间

95% 的置信区间并不意味着真实总体均值有 95% 的概率落在这个特定的区间内。它真正的含义是：如果我们重复抽样过程多次，所构建出来的 95% 的置信区间都将包含真实总体均值。

示例：如果方法 A 和方法 B 之间均值差的 95% 置信区间是 (2.5, 4.1)，由于该区间不包含零，我们可以 95% 地确信方法 A 优于方法 B。

c) 你知道吗？

t 分布最初是由 William Sealy Gosset 在 1908 年提出的。他在健力士（Guinness）啤酒厂工作，利用小样本来监控啤酒质量。由于公司规定禁止他以个人名义发表文章，他使用了“Student”（学生）这个笔名，因此该分布被称为“学生 t 分布”。

快速回顾：必备要素

要在本章中取得成功，请确保你能迅速识别出题目中的三个要点：

样本量是大还是小？
总体方差 $\sigma^2$ 是已知还是未知？
样本是独立还是配对的？

回答这些问题将直接引导你找到正确的检验统计量（Z 或 T）以及正确的自由度 ($\nu$)。

坚持练习选择正确的步骤，你一定能掌握这个主题！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。

🚀 使用正态分布与 t 分布进行统计推断：学习笔记（9231 Further Statistics）

1. 快速回顾：何时使用 Z 检验 vs. t 检验

正态分布（Z-检验）：黄金标准

t 分布：小样本专家

2. 理解 t 分布

a) 什么是 t 分布？

b) 自由度 (\(\nu\))

3. 单个总体均值 (\(\mu\)) 的推断

a) 假设检验（t-检验）

b) \(\mu\) 的置信区间 (CI)

4. 两个总体均值之差 (\(\mu_1 - \mu_2\)) 的推断

情景 A：大样本（Z-检验）

情景 B：小独立样本（双样本 t-检验）

第 1 步：计算合并方差估计 (\(s_p^2\))