Estimation, confidence intervals and tests

欢迎来到 S3 单元：估计、置信区间与假设检验！

你好，未来的统计学家！在这一章中，我们将告别单纯的数据描述，转而对整个总体做出有力且明智的推断。这就是统计推断的核心——通过一小部分样本来得出关于总体的宏大结论。

为什么这很重要？ 无论你将来从事金融、医学还是质量控制领域，你几乎不可能获得*全部*数据。我们利用本章提供的工具，在特定的置信水平下确定总体的真实数值（比如产品的平均寿命或某种品牌的偏好比例）。掌握这些概念对于你的考试以及现实世界的分析工作都至关重要！

1. 点估计量与无偏估计

在统计学中，点估计量 (point estimator) 仅仅是一个统计量（样本数据的函数），我们用它来估计未知的总体参数（如总体均值 $\mu$ 或方差 $\sigma^2$）。

什么是无偏估计量？

当我们估计总体参数时，我们希望估计结果是“公平”的。如果一个估计量在多次采样后的平均值等于参数的真实值，那么该估计量就是无偏的 (unbiased)。

可以把它想象成射击练习。如果你的估计量是无偏的，即使单次射击（样本）可能会偏离靶心（真实参数），但所有射击点位置的平均值正好位于靶心上。

你需要掌握的关键估计量包括：

总体均值 ($\mu$)： 使用样本均值 $\bar{X}$ 来估计。（$\bar{X}$ 是 $\mu$ 的无偏估计量）。
总体比例 ($p$)： 使用样本比例 $\hat{p}$ 来估计。（$\hat{p}$ 是 $p$ 的无偏估计量）。

关键问题：方差的估计

这是学生最容易出错的地方。我们有两种计算样本方差的主要方法，但只有一种是总体方差 $\sigma^2$ 的无偏估计量。

有偏估计量 ($S^2$)

这是你在之前的统计学课程中学到的标准公式，即用离差平方和除以 $n$： $$S^2 = \frac{\sum (x_i - \bar{x})^2}{n}$$ 如果你使用 $S^2$ 来估计总体方差 $\sigma^2$，你的估计值通常会偏小。它是一个有偏估计量 (biased estimator)。

无偏估计量 ($\hat{\sigma}^2$)

为了获得总体方差的无偏估计，我们通过使用自由度 (degrees of freedom) $n-1$ 来调整分母： $$\hat{\sigma}^2 = \frac{\sum (x_i - \bar{x})^2}{n-1}$$ $\hat{\sigma}^2$ 是总体方差无偏估计量的标准符号。在 A Level 教材中，它也常被称为样本方差 (sample variance)。

记忆窍门：为什么要除以 $n-1$？
在计算方差时，你需要先利用样本均值 $\bar{x}$ 来计算偏差。由于你使用了数据本身来计算 $\bar{x}$，你已经“消耗”掉了一个信息单位，只剩下 $n-1$ 个*自由*信息（即自由度）。除以 $n-1$ 可以纠正这种固有的低估偏差。

估计量的核心结论： 在估计时，请务必对 $\mu$ 使用 $\bar{X}$，对 $p$ 使用 $\hat{p}$，并对于 $\sigma^2$ 的最佳（无偏）估计，**务必除以 $n-1$**。

2. 置信区间：我们到底在说什么？

置信区间 (Confidence Interval, CI) 是一个数值范围，我们相信真实总体参数位于该范围内，它是基于一定的可信度（置信水平）计算出来的。

钓鱼类比

想象你正在一个巨大的湖泊里捕捞某种特定的鱼（真实总体均值 $\mu$）。你看不到鱼，但你可以根据你采样到的少量湖水撒下一张网（即置信区间）。

网的大小： 由要求的置信水平（例如 95% 或 99%）决定。99% 的置信区间（网更大）让你捕获到鱼的几率更高，但区间会更宽（精度更低）。
鱼：总体参数 ($\mu$)。它是固定的，但我们未知其具体数值。

如果你构建了 100 个置信区间（即抽取 100 个样本并撒下 100 次网），95% 的置信水平意味着**其中 95 个网会成功捕捉到真实的总体均值 $\mu$**。其余 5 个区间则会错过。

公式结构

所有的置信区间都遵循以下结构：

$$ \text{估计值} \pm (\text{临界值} \times \text{标准误}) $$

其中 $(\text{临界值} \times \text{标准误})$ 这一项被称为误差幅度 (Margin of Error)。

你知道吗？ 科学研究中最常用的置信水平是 95%。这对应于 0.05 的显著性水平 ($\alpha$)。

3. 计算均值 ($\mu$) 的置信区间

计算均值置信区间的方法完全取决于两个因素：样本量 ($n$) 以及总体方差 ($\sigma^2$) 是否已知。

A. 当总体方差 ($\sigma^2$) 已知时，计算 $\mu$ 的 CI

如果我们已知总体方差，无论样本量 $n$ 是多少，根据中心极限定理 (CLT)，我们都可以使用正态分布 (Z 分数)。

Z 区间计算步骤

核对假设： 总体本身服从正态分布，或者 $n$ 足够大 ($n > 30$)，满足中心极限定理。
确定数值： 找出 $\bar{x}$、$\sigma$、$n$ 以及置信水平。
查找临界 Z 值 ($z$)： 使用正态分布表（或计算器）查找对应置信水平的临界值。
计算区间： $$ \bar{x} \pm z \times \frac{\sigma}{\sqrt{n}} $$

快速复习：常见的 Z 值：
（这些是你经常用到的关键值，对应双尾检验）：

90% 置信水平：$z = 1.6449$
95% 置信水平：$z = 1.9600$
99% 置信水平：$z = 2.5758$

B. 当总体方差 ($\sigma^2$) 未知时，计算 $\mu$ 的 CI

当 $\sigma^2$ 未知时，我们必须使用样本方差 $\hat{\sigma}^2$ 来估计它。在这种情况下（特别是小样本时），检验统计量的分布不再是正态分布。相反，我们使用学生 t 分布 (Student's t-distribution)。

重要提示： $t$ 分布比正态分布更宽、更平坦，这反映了由于从样本数据估计 $\sigma^2$ 而带来的额外不确定性。

T 区间计算步骤

核对假设： 我们**必须**假设原始总体服从正态分布。（如果 $n$ 非常大，$t$ 分布会趋近于正态分布）。
计算 $\hat{\sigma}$： 使用 $s/\sqrt{n-1}$（其中 $s^2$ 为标准样本方差），或者直接使用无偏估计量的平方根：$\hat{\sigma} = \sqrt{\frac{\sum (x_i - \bar{x})^2}{n-1}}$。
确定自由度 ($v$)： $v = n-1$。
查找临界 T 值 ($t_v$)： 使用 $t$ 分布表，根据 $v = n-1$ 和要求的置信水平（双尾）查找。
计算区间： $$ \bar{x} \pm t_v \times \frac{\hat{\sigma}}{\sqrt{n}} $$

如果一开始觉得这很复杂，别担心。Z 区间和 T 区间的核心区别仅仅是查表的种类不同！记住：方差未知？用 T！

4. 比例 ($p$) 的置信区间

如果我们正在调查二项结果（例如成功/失败、是/否），我们感兴趣的是总体比例 $p$。我们使用样本比例 $\hat{p}$ 来估计 $p$。

为了使 CI 计算有效，我们通常要求样本量足够大，满足 $n\hat{p} > 5$ 且 $n(1-\hat{p}) > 5$。

比例区间计算步骤

确定数值： 成功次数 $x$，样本量 $n$，以及 $\hat{p} = x/n$。
标准误： 样本比例的标准误计算公式为： $$ \text{SE} = \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} $$
查找临界 Z 值 ($z$)： 使用正态分布表（与方差已知的情况相同）。
计算区间： $$ \hat{p} \pm z \times \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} $$

避免常见的错误： 处理比例时，**永远使用 Z 分布**（正态近似），因为对于足够大的样本，$\hat{p}$ 的分布近似于正态分布。

5. 总体方差 ($\sigma^2$) 的置信区间

有时，数据的离散程度比平均值更重要（例如制造业的一致性）。要计算总体方差 $\sigma^2$ 的置信区间，我们必须假设总体服从正态分布，并使用卡方 ($\chi^2$) 分布。

所使用的统计量为：

$$ \chi^2 = \frac{(n-1)\hat{\sigma}^2}{\sigma^2} $$

$\chi^2$ 分布的特点：

仅定义在正数域上。
不对称（右偏）。
由自由度 $v = n-1$ 决定。

卡方区间计算步骤

核对假设： 总体**必须**服从正态分布。
确定数值： 计算无偏方差估计 $\hat{\sigma}^2$ 和自由度 $v = n-1$。
查找临界 $\chi^2$ 值： 由于分布不对称，你需要从 $\chi^2$ 表中查找**两个**临界值（自由度 $v = n-1$）。对于 95% 的 CI：
- $\chi^2_L$：对应 $(1 - 0.025)$ 即 0.975 的值（左尾）。
- $\chi^2_R$：对应 $0.025$ 的值（右尾）。
计算区间（针对 $\sigma^2$）： $$ \left( \frac{(n-1)\hat{\sigma}^2}{\chi^2_{R}}, \frac{(n-1)\hat{\sigma}^2}{\chi^2_{L}} \right) $$

注意这里的调换！ 请注意，较小的 $\chi^2_L$ 值被用于方差区间的上限，而较大的 $\chi^2_R$ 值被用于下限。这是因为 $\sigma^2$ 位于检验统计量的分母中。

置信区间分布总结：

均值 ($\mu$)，$\sigma$ 已知：Z
均值 ($\mu$)，$\sigma$ 未知：T (自由度 $n-1$)
比例 ($p$)：Z
方差 ($\sigma^2$)：$\chi^2$ (自由度 $n-1$)

6. 单样本假设检验

假设检验（在之前的模块中已详细介绍）用于判断是否有足够的统计证据拒绝原假设 ($H_0$) 并支持备择假设 ($H_1$)。在 S3 中，我们使用 Z、T 和 $\chi^2$ 分布来应用这些标准程序。

A. 总体均值 ($\mu$) 的检验

其过程与置信区间一样，取决于方差是否已知：

情形 1：$\sigma^2$ 已知 (Z 检验)

检验统计量： $$ Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} $$ 我们将计算出的 $Z$ 值与来自正态分布的临界 $Z$ 值进行比较。

情形 2：$\sigma^2$ 未知 (T 检验)

我们使用无偏估计 $\hat{\sigma}$ 来代替标准差。

检验统计量： $$ T = \frac{\bar{X} - \mu_0}{\hat{\sigma} / \sqrt{n}} $$ 我们将计算出的 $T$ 值与来自 $t$ 分布的临界 $T$ 值进行比较，使用自由度 $v = n-1$。

B. 总体方差 ($\sigma^2$) 的检验

如果我们想测试总体方差是否等于特定值 $\sigma_0^2$，我们使用卡方检验。

假设示例：
$H_0: \sigma^2 = \sigma_0^2$
$H_1: \sigma^2 \neq \sigma_0^2$ (双尾) 或 $H_1: \sigma^2 > \sigma_0^2$ (单尾)

检验统计量 ($\chi^2$)

检验统计量： $$ \chi^2 = \frac{(n-1)\hat{\sigma}^2}{\sigma_0^2} $$ 我们将计算出的 $\chi^2$ 值与来自表的临界 $\chi^2$ 值进行比较，使用自由度 $v = n-1$。

假设检验步骤总结：

陈述 $H_0$ 和 $H_1$： 清晰地定义原假设和备择假设。
陈述显著性水平 ($\alpha$)： 通常为 5% (0.05) 或 1% (0.01)。
计算检验统计量： 使用相应的公式 (Z, T, 或 $\chi^2$)。
查找临界值： 使用正确的分布和自由度（如有必要）查表。
结论： 将统计量与临界值进行比较，或使用 $p$ 值。如果统计量落在拒绝域内，则拒绝 $H_0$。
语境陈述： 结合原始问题写出结论性语句。

互动贴士：置信区间与假设检验的关系
95% 的置信区间可用于进行 5% 显著性水平下的双尾假设检验。如果假设的值 ($\mu_0$ 或 $\sigma_0^2$) 落在置信区间之外，你就拒绝 $H_0$。如果它落在区间内，则不拒绝 $H_0$。

最终核心要点

整个章节的关键在于根据两个因素识别所需的分布（Z、T 或 $\chi^2$）：你正在估计哪个参数 ($\mu, p, \sigma^2$)，以及总体方差是否已知。

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。

Estimation, confidence intervals and tests

欢迎来到 S3 单元：估计、置信区间与假设检验！

1. 点估计量与无偏估计

什么是无偏估计量？

关键问题：方差的估计

有偏估计量 (\(S^2\))

无偏估计量 (\(\hat{\sigma}^2\))

2. 置信区间：我们到底在说什么？

钓鱼类比

公式结构

3. 计算均值 (\(\mu\)) 的置信区间

A. 当总体方差 (\(\sigma^2\)) 已知时，计算 \(\mu\) 的 CI

Z 区间计算步骤

B. 当总体方差 (\(\sigma^2\)) 未知时，计算 \(\mu\) 的 CI

T 区间计算步骤

4. 比例 (\(p\)) 的置信区间

比例区间计算步骤

5. 总体方差 (\(\sigma^2\)) 的置信区间

卡方区间计算步骤

6. 单样本假设检验

A. 总体均值 (\(\mu\)) 的检验

情形 1：\(\sigma^2\) 已知 (Z 检验)

情形 2：\(\sigma^2\) 未知 (T 检验)

B. 总体方差 (\(\sigma^2\)) 的检验

检验统计量 (\(\chi^2\))

最终核心要点

准备好测试自己了吗？

更多Further Mathematics (YFM01)章节

立即实践所学