Estimation

学习笔记：估计 (FS2.3)

你好！欢迎来到“估计”这一章！FS2 统计学中的这一部分非常重要，因为它让我们超越了单纯计算样本统计量的层面，转而帮助我们对整个总体做出合理的推断。

在现实世界中，我们很少有时间和资源去测量每一个个体或每一件物品（即整个总体）。因此，我们通常会抽取一个样本。估计就是这样一种技术：我们利用小样本中的信息（例如样本均值 \(\bar{x}\)），以此为基础，满怀信心地预测出未知且真实的总体参数（例如总体均值 \(\mu\)）。

别担心这个概念听起来很抽象——我们将利用熟悉的统计学概念（如正态分布和 \(t\) 分布），把这个过程拆解成清晰、易懂的步骤。

什么是估计？点估计与区间估计

1. 点估计（回顾）

在 FS2.2 中，我们学习了点估计。点估计是指用一个单一的数值来估计总体参数。

总体均值 (\(\mu\)) 的最佳点估计是样本均值 (\(\bar{x}\))。
总体方差 (\(\sigma^2\)) 的最佳点估计是无偏样本方差 (\(s^2\))。

示例：如果你测量了某所学院 50 名学生的身高，平均值为 170 厘米，那么 170 厘米就是该学院所有学生平均身高的点估计值。

2. 区间估计（FS2.3 的重点）

点估计几乎肯定是不准确的！真实的总体均值可能是 170.1 厘米或 169.9 厘米，但几乎不可能正好是 170.0 厘米。

区间估计（或称置信区间）为我们提供了一个数值范围，真实的总体参数很可能落在这个范围内。

核心要点： 我们不再说“我认为平均值正好是 170 厘米”，而是说“我有 95% 的把握确信，真实的平均值介于 168 厘米和 172 厘米之间。”

置信区间 (CI) 的概念

1. 定义置信区间

置信区间 (CI) 是根据样本数据计算出的一个区间，该区间以一定的置信水平包含真实的总体参数。

本大纲仅关注关于均值对称的置信区间。这意味着你的最佳估计值（\(\bar{x}\)）正好处于该区间的中心。

其结构始终为：

置信区间 = 点估计 \(\pm\) 误差幅度 (E)

误差幅度 (E) 反映了因使用样本而非整个总体而产生的统计不确定性。

2. 理解置信水平

置信水平（例如 90%、95%、99%）告诉你，你有多大把握确定该区间包含了真实的均值。

类比：捕鱼网
想象真实的总体均值 (\(\mu\)) 是海里的一条鱼。你的样本均值 (\(\bar{x}\)) 是你的船所在的位置。置信区间就是你的捕鱼网。

如果你使用 90% 的置信水平（网较窄），你可能会更频繁地漏掉鱼（有 10% 的几率漏掉）。
如果你使用 99% 的置信水平（网非常宽），你几乎肯定能抓到鱼（只有 1% 的几率漏掉）。

区间越宽，置信度越高，但提供的信息精确度就越低！

3. 标准误与临界值

要计算误差幅度 \(E\)，我们需要两个要素：

标准误 (\(\sigma_{\bar{X}}\))

这是均值抽样分布的标准差。它衡量了样本均值预计偏离总体均值的程度。

\[ \sigma_{\bar{X}} = \frac{\sigma}{\sqrt{n}} \]

其中 \(\sigma\) 是总体标准差，\(n\) 是样本容量。

临界值 (z 或 t)

该值根据你选择的置信水平决定了区间的宽度。

对于 95% 的置信区间，我们在上尾留出 2.5%，下尾留出 2.5%。
临界值是对应于该尾部面积的 \(z\) 分数或 \(t\) 分数。

对于 95% 的置信水平，临界 Z值为 1.96。（从 FS1 开始，你应该对这个数字非常熟悉了！）

快速回顾：误差幅度公式

\[ E = \text{临界值} \times \text{标准误} \]

计算置信区间：三种关键情形

我们所使用的分布（以及相应的临界值）完全取决于两件事：总体方差 (\(\sigma^2\)) 是否已知？ 以及 样本容量 (\(n\)) 是多少？

情形 1：总体方差 (\(\sigma^2\)) 已知的正态分布

如果我们已知总体方差 \(\sigma^2\)（或总体标准差 \(\sigma\)），无论样本容量 \(n\) 大小如何，我们都使用 Z分布（正态分布）。

公式 (Z-区间)：

\[ \bar{x} \pm z \times \frac{\sigma}{\sqrt{n}} \]

情形 2：大样本 (\(n \geq 30\))

如果样本容量较大（通常 \(n \geq 30\)），中心极限定理 (CLT) 保证了均值的抽样分布近似为正态分布。

即使 \(\sigma\) 未知，对于大样本，我们也可以用样本标准差 (\(s\)) 代替 \(\sigma\)。此时我们仍然使用 Z分布。

公式 (大样本的 Z-区间)：

\[ \bar{x} \pm z \times \frac{s}{\sqrt{n}} \]

（记住：大纲指出，对于已知或未知方差的大样本，我们均可使用正态近似。）

情形 3：小样本 (\(n < 30\)) 且总体方差 (\(\sigma^2\)) 未知

这是最棘手的情况。如果样本很小且我们不知道总体方差 \(\sigma^2\)，使用正态分布会低估不确定性。

此时，我们改用 t分布（学生 \(t\) 分布）。

\(t\) 分布比 Z分布更宽、更平坦，从而提供了更大的误差幅度，以应对用小样本 \(s\) 估计 \(\sigma\) 所带来的不确定性。
它需要计算自由度 (\(\nu\))：\(\nu = n - 1\)。
我们根据 \(\nu\) 和置信水平查 \(t\) 分布表来确定临界 \(t\) 值。

公式 (t-区间)：

\[ \bar{x} \pm t_{\nu} \times \frac{s}{\sqrt{n}} \]

⚠ 常见错误警告：Z 与 t 的选择 ⚠

在选择临界值之前，请务必检查以下两个关键事实：

\(\sigma\) 是否已知？ 若已知 -> 使用 Z。
\(\sigma\) 是否未知？ 检查 \(n\)。若 \(n \geq 30\) -> 使用 Z（适用中心极限定理）。若 \(n < 30\) -> 使用 t（需考虑额外的不确定性）。

推断与样本容量估计

1. 基于置信区间的推断

置信区间提供了一种对总体均值 (\(\mu\)) 进行假设检验的简单方法，这有时被称为“观察法检验”。

假设我们构建了 \(\mu\) 的 95% 置信区间。我们可以用它来检验原假设 \(H_0: \mu = \mu_0\)。

原则：

如果假设的均值 (\(\mu_0\)) 落在置信区间内，则在相应的显著性水平下没有理由拒绝 \(H_0\)。
如果假设的均值 (\(\mu_0\)) 落在置信区间外，则在相应的显著性水平下拒绝 \(H_0\)。

示例：如果 95% 的置信区间是 [168, 172]，且有人声称 \(\mu_0 = 175\)，由于 175 在区间之外，我们可以在 5% 的显著性水平下拒绝他们的主张。

2. 估计样本容量 (\(n\))

在规划研究时，我们经常需要确定在给定的置信水平下，要达到特定的误差幅度 (\(E\)) 需要多大的样本容量。

由于误差幅度 \(E = z \times \frac{\sigma}{\sqrt{n}}\)，我们可以通过重排公式求解 \(n\)：

\[ \sqrt{n} = \frac{z\sigma}{E} \]

\[ n = \left(\frac{z\sigma}{E}\right)^2 \]

在这种情况下，我们必须使用 Z临界值，因为我们在规划样本容量时，假设样本收集后中心极限定理会适用。我们还需要对 \(\sigma\) 有一个估计值（来自以往的研究或试点样本）。

关键步骤：向上取整
由于样本容量 \(n\) 必须是整数，你必须始终将计算结果向上取整。如果计算得到 \(n = 100.1\)，你需要 101 个样本。如果向下取整到 100，你将无法达到所需的区间宽度。

✓ 本章核心要点

目标： 利用样本均值 (\(\bar{x}\)) 为真实的总体均值 (\(\mu\)) 创建一个范围（置信区间）。
公式结构： \(\bar{x} \pm (\text{临界值} \times \frac{\text{标准差}}{\sqrt{n}})\)。
Z检验条件： 当 \(\sigma\) 已知，或 \(n \geq 30\) 时使用。
t检验条件： 当 \(\sigma\) 未知且 \(n < 30\) 时使用。自由度 \(\nu = n-1\)。
推断： 如果假设均值 \(\mu_0\) 在置信区间之外，则拒绝 \(H_0\)。
样本容量： 计算 \(n = \left(\frac{z\sigma}{E}\right)^2\)，并始终向上取整到下一个整数。

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。