欢迎来到估计量(Estimator)的世界!

在以往的统计学学习中,你已经学会利用数据来描述观察到的现象(例如计算你自己的考试成绩平均分)。在高等数学(Further Mathematics)中,我们将跨出一大步。我们会利用少量数据(样本,Sample)对一个更大的群体(总体,Population)做出非常聪明的“猜测”。

估计量(Estimators)就是我们用来进行这些猜测的数学工具或公式。理解它们就像学习如何成为一名侦探——利用小样本中的线索来解开整个总体的谜团!如果刚开始觉得有点抽象也不用担心,我们会一步一步为你拆解。

先备知识检查:请记住,总体(Population)是你感兴趣的整个群体(例如:世界上所有的学生),而样本(Sample)是你实际测量的一小部分(例如:你学校里的 50 名学生)。


1. 什么是估计量?

估计量(Estimator)是一套规则或公式,它告诉你如何根据样本数据计算出总体参数的估计值。

你可以这样理解: 估计量食谱(公式本身)。 估计值(Estimate)蛋糕(代入数据后算出的具体数字)。

无偏估计量(Unbiased Estimators)

我们希望估计量是“公平”的。在数学术语中,我们称之为无偏(Unbiased)

如果一个估计量的平均值等于我们要寻找的总体参数的真实值,那么它就是无偏的。

类比: 想象一位弓箭手。如果这位弓箭手是“无偏”的,虽然他的箭不一定每次都能正中红心,但它们会均匀地分布在红心周围。他不会有总是偏左或总是偏右的习惯。

重点总结:无偏估计量不会系统性地高估或低估真实值。


2. 估计总体平均值 \((\mu)\)

好消息是,估计总体平均值非常简单!

我们称之为 \(\bar{X}\) 的样本平均值(sample mean),就是总体平均值 \(\mu\) 的一个无偏估计量

公式

\( \hat{\mu} = \bar{X} = \frac{\sum X}{n} \)

其中: - \(\hat{\mu}\)(读作 "mu-hat")是我们对总体平均值的估计值。 - \(\sum X\) 是样本中所有数值的总和。 - \(n\) 是样本中的数据个数。

小贴士:在统计学中,只要看到希腊字母上面有个“帽子”符号 (^),就代表“......的估计值”。


3. 估计总体方差 \((\sigma^2)\)

这里开始会稍微复杂一点,但请跟上!

如果你使用以前学过的标准方差公式(除以 \(n\)),实际上你会低估总体的真实离散程度。这是因为小样本不太可能包含大总体中存在的“极端”数值。

为了使估计量变成无偏,我们必须进行一个小技巧,称为贝塞尔修正(Bessel's Correction)。我们不除以 \(n\),而是除以 \(n - 1\)。

方差的无偏估计公式 \((S^2)\)

\( S^2 = \frac{1}{n-1} \left( \sum X^2 - \frac{(\sum X)^2}{n} \right) \)

或者,如果你已经知道样本平均值 \(\bar{X}\): \( S^2 = \frac{\sum (X - \bar{X})^2}{n-1} \)

要避免的常见错误:一定要检查你的计算器设置!许多计算器有两个按钮:\(\sigma_n\)(除以 \(n\))和 \(s_{n-1}\)(除以 \(n-1\))。对于无偏估计量,你必须使用 \(n-1\) 的版本。

重点总结:除以 \(n-1\) 可以稍微“拉大”我们的估计值,以弥补样本通常看起来比真实总体“更紧凑”的事实。


4. 一步一步来:求无偏估计值

让我们看看一个现实生活中的例子。假设你测量了工厂生产的 5 条巧克力棒的重量(单位:克):48, 52, 50, 49, 51

步骤 1:求 \(X\) 的总和。
\( \sum X = 48 + 52 + 50 + 49 + 51 = 250 \)

步骤 2:求平均值的无偏估计值 \((\hat{\mu})\)。
\( \hat{\mu} = \frac{250}{5} = 50 \) 克。

步骤 3:求 \(X^2\) 的总和。
\( \sum X^2 = 48^2 + 52^2 + 50^2 + 49^2 + 51^2 = 2304 + 2704 + 2500 + 2401 + 2601 = 12510 \)

步骤 4:代入无偏方差公式。
\( S^2 = \frac{1}{5-1} \left( 12510 - \frac{250^2}{5} \right) \)
\( S^2 = \frac{1}{4} \left( 12510 - \frac{62500}{5} \right) \)
\( S^2 = \frac{1}{4} \left( 12510 - 12500 \right) \)
\( S^2 = \frac{10}{4} = 2.5 \)

总体方差的无偏估计值为 2.5


5. 合并(Pooling)估计值

有时你可能会有两个不同的样本(例如:早班样本和晚班样本),你想将它们合并以获得更好的整体估计。

合并平均值

如果你有样本 1(大小为 \(n_1\),平均值为 \(\bar{x}_1\))和样本 2(大小为 \(n_2\),平均值为 \(\bar{x}_2\)):
\( \bar{x}_{combined} = \frac{n_1\bar{x}_1 + n_2\bar{x}_2}{n_1 + n_2} \)

类比: 这只是一个“加权平均值”。如果早班有 100 人,而晚班只有 5 人,早班的数据在最终答案中应该占有更大的“权重”。


快速复习栏

1. 平均值的无偏估计量:始终使用 \(\bar{X} = \frac{\sum X}{n}\)。
2. 方差的无偏估计量:使用分母为 \(n-1\) 的公式。
3. 为什么是 \(n-1\)?为了修正样本通常会低估总体真实离散程度的事实。
4. 符号:\(S^2\) 或 \(\hat{\sigma}^2\) 通常都代表方差的无偏估计值。


你知道吗?

使用 \(n-1\) 代替 \(n\) 的想法是由弗里德里希·贝塞尔(Friedrich Bessel)在 1818 年普及的。在此之前,人们经常得出错误的预测,因为他们没有意识到自己的样本倾向于过于一致(偏差)。这个微小的数学调整永久改变了我们从事科学和工程研究的方式!


如果方差公式刚开始看起来很吓人,不用担心!只要练习代入几次数字,这就会变得像本能一样自然。记住:只要是“无偏”的,分母通常就是“n 减 1”!