学习笔记:估计 (FS2.3)

你好!欢迎来到“估计”这一章!FS2 统计学中的这一部分非常重要,因为它让我们超越了单纯计算样本统计量的层面,转而帮助我们对整个总体做出合理的推断。

在现实世界中,我们很少有时间和资源去测量每一个个体或每一件物品(即整个总体)。因此,我们通常会抽取一个样本。估计就是这样一种技术:我们利用小样本中的信息(例如样本均值 \(\bar{x}\)),以此为基础,满怀信心地预测出未知且真实的总体参数(例如总体均值 \(\mu\))。

别担心这个概念听起来很抽象——我们将利用熟悉的统计学概念(如正态分布和 \(t\) 分布),把这个过程拆解成清晰、易懂的步骤。

什么是估计?点估计与区间估计

1. 点估计(回顾)

在 FS2.2 中,我们学习了点估计。点估计是指用一个单一的数值来估计总体参数。

  • 总体均值 (\(\mu\)) 的最佳点估计是样本均值 (\(\bar{x}\))。
  • 总体方差 (\(\sigma^2\)) 的最佳点估计是无偏样本方差 (\(s^2\))。

示例:如果你测量了某所学院 50 名学生的身高,平均值为 170 厘米,那么 170 厘米就是该学院所有学生平均身高的点估计值。

2. 区间估计(FS2.3 的重点)

点估计几乎肯定是不准确的!真实的总体均值可能是 170.1 厘米或 169.9 厘米,但几乎不可能正好是 170.0 厘米。

区间估计(或称置信区间)为我们提供了一个数值范围,真实的总体参数很可能落在这个范围内。

核心要点: 我们不再说“我认为平均值正好是 170 厘米”,而是说“我有 95% 的把握确信,真实的平均值介于 168 厘米和 172 厘米之间。”

置信区间 (CI) 的概念

1. 定义置信区间

置信区间 (CI) 是根据样本数据计算出的一个区间,该区间以一定的置信水平包含真实的总体参数。

本大纲仅关注关于均值对称的置信区间。这意味着你的最佳估计值(\(\bar{x}\))正好处于该区间的中心。

其结构始终为:

置信区间 = 点估计 \(\pm\) 误差幅度 (E)

误差幅度 (E) 反映了因使用样本而非整个总体而产生的统计不确定性。

2. 理解置信水平

置信水平(例如 90%、95%、99%)告诉你,你有多大把握确定该区间包含了真实的均值。

类比:捕鱼网
想象真实的总体均值 (\(\mu\)) 是海里的一条鱼。你的样本均值 (\(\bar{x}\)) 是你的船所在的位置。置信区间就是你的捕鱼网。

  • 如果你使用 90% 的置信水平(网较窄),你可能会更频繁地漏掉鱼(有 10% 的几率漏掉)。
  • 如果你使用 99% 的置信水平(网非常宽),你几乎肯定能抓到鱼(只有 1% 的几率漏掉)。

区间越宽,置信度越高,但提供的信息精确度就越低!

3. 标准误与临界值

要计算误差幅度 \(E\),我们需要两个要素:

标准误 (\(\sigma_{\bar{X}}\))

这是均值抽样分布的标准差。它衡量了样本均值预计偏离总体均值的程度。

\[ \sigma_{\bar{X}} = \frac{\sigma}{\sqrt{n}} \]

其中 \(\sigma\) 是总体标准差,\(n\) 是样本容量。

临界值 (z 或 t)

该值根据你选择的置信水平决定了区间的宽度。

  • 对于 95% 的置信区间,我们在上尾留出 2.5%,下尾留出 2.5%。
  • 临界值是对应于该尾部面积的 \(z\) 分数或 \(t\) 分数。

对于 95% 的置信水平,临界 Z值1.96。(从 FS1 开始,你应该对这个数字非常熟悉了!)

快速回顾:误差幅度公式

\[ E = \text{临界值} \times \text{标准误} \]

计算置信区间:三种关键情形

我们所使用的分布(以及相应的临界值)完全取决于两件事:总体方差 (\(\sigma^2\)) 是否已知? 以及 样本容量 (\(n\)) 是多少?

情形 1:总体方差 (\(\sigma^2\)) 已知的正态分布

如果我们已知总体方差 \(\sigma^2\)(或总体标准差 \(\sigma\)),无论样本容量 \(n\) 大小如何,我们都使用 Z分布(正态分布)

公式 (Z-区间):

\[ \bar{x} \pm z \times \frac{\sigma}{\sqrt{n}} \]

情形 2:大样本 (\(n \geq 30\))

如果样本容量较大(通常 \(n \geq 30\)),中心极限定理 (CLT) 保证了均值的抽样分布近似为正态分布。

即使 \(\sigma\) 未知,对于大样本,我们也可以用样本标准差 (\(s\)) 代替 \(\sigma\)。此时我们仍然使用 Z分布

公式 (大样本的 Z-区间):

\[ \bar{x} \pm z \times \frac{s}{\sqrt{n}} \]

(记住:大纲指出,对于已知或未知方差的大样本,我们均可使用正态近似。)

情形 3:小样本 (\(n < 30\)) 且总体方差 (\(\sigma^2\)) 未知

这是最棘手的情况。如果样本很小且我们不知道总体方差 \(\sigma^2\),使用正态分布会低估不确定性。

此时,我们改用 t分布(学生 \(t\) 分布)。

  • \(t\) 分布比 Z分布更宽、更平坦,从而提供了更大的误差幅度,以应对用小样本 \(s\) 估计 \(\sigma\) 所带来的不确定性。
  • 它需要计算自由度 (\(\nu\)):\(\nu = n - 1\)。
  • 我们根据 \(\nu\) 和置信水平查 \(t\) 分布表来确定临界 \(t\) 值。

公式 (t-区间):

\[ \bar{x} \pm t_{\nu} \times \frac{s}{\sqrt{n}} \]

⚠ 常见错误警告:Z 与 t 的选择 ⚠

在选择临界值之前,请务必检查以下两个关键事实:

  1. \(\sigma\) 是否已知? 若已知 -> 使用 Z。
  2. \(\sigma\) 是否未知? 检查 \(n\)。若 \(n \geq 30\) -> 使用 Z(适用中心极限定理)。若 \(n < 30\) -> 使用 t(需考虑额外的不确定性)。

推断与样本容量估计

1. 基于置信区间的推断

置信区间提供了一种对总体均值 (\(\mu\)) 进行假设检验的简单方法,这有时被称为“观察法检验”。

假设我们构建了 \(\mu\) 的 95% 置信区间。我们可以用它来检验原假设 \(H_0: \mu = \mu_0\)。

原则:

  • 如果假设的均值 (\(\mu_0\)) 落在置信区间内,则在相应的显著性水平下没有理由拒绝 \(H_0\)
  • 如果假设的均值 (\(\mu_0\)) 落在置信区间外,则在相应的显著性水平下拒绝 \(H_0\)

示例:如果 95% 的置信区间是 [168, 172],且有人声称 \(\mu_0 = 175\),由于 175 在区间之外,我们可以在 5% 的显著性水平下拒绝他们的主张。

2. 估计样本容量 (\(n\))

在规划研究时,我们经常需要确定在给定的置信水平下,要达到特定的误差幅度 (\(E\)) 需要多大的样本容量。

由于误差幅度 \(E = z \times \frac{\sigma}{\sqrt{n}}\),我们可以通过重排公式求解 \(n\):

\[ \sqrt{n} = \frac{z\sigma}{E} \]

\[ n = \left(\frac{z\sigma}{E}\right)^2 \]

在这种情况下,我们必须使用 Z临界值,因为我们在规划样本容量时,假设样本收集后中心极限定理会适用。我们还需要对 \(\sigma\) 有一个估计值(来自以往的研究或试点样本)。

关键步骤:向上取整
由于样本容量 \(n\) 必须是整数,你必须始终将计算结果向上取整。如果计算得到 \(n = 100.1\),你需要 101 个样本。如果向下取整到 100,你将无法达到所需的区间宽度。

✓ 本章核心要点

  • 目标: 利用样本均值 (\(\bar{x}\)) 为真实的总体均值 (\(\mu\)) 创建一个范围(置信区间)。
  • 公式结构: \(\bar{x} \pm (\text{临界值} \times \frac{\text{标准差}}{\sqrt{n}})\)。
  • Z检验条件: 当 \(\sigma\) 已知,或 \(n \geq 30\) 时使用。
  • t检验条件: 当 \(\sigma\) 未知且 \(n < 30\) 时使用。自由度 \(\nu = n-1\)。
  • 推断: 如果假设均值 \(\mu_0\) 在置信区间之外,则拒绝 \(H_0\)。
  • 样本容量: 计算 \(n = \left(\frac{z\sigma}{E}\right)^2\),并始终向上取整到下一个整数。