Estimators

欢迎来到估计量（Estimator）的世界！

在以往的统计学学习中，你已经学会利用数据来描述观察到的现象（例如计算你自己的考试成绩平均分）。在高等数学（Further Mathematics）中，我们将跨出一大步。我们会利用少量数据（样本，Sample）对一个更大的群体（总体，Population）做出非常聪明的“猜测”。

估计量（Estimators）就是我们用来进行这些猜测的数学工具或公式。理解它们就像学习如何成为一名侦探——利用小样本中的线索来解开整个总体的谜团！如果刚开始觉得有点抽象也不用担心，我们会一步一步为你拆解。

先备知识检查：请记住，总体（Population）是你感兴趣的整个群体（例如：世界上所有的学生），而样本（Sample）是你实际测量的一小部分（例如：你学校里的 50 名学生）。

1. 什么是估计量？

估计量（Estimator）是一套规则或公式，它告诉你如何根据样本数据计算出总体参数的估计值。

你可以这样理解： 估计量是食谱（公式本身）。 估计值（Estimate）是蛋糕（代入数据后算出的具体数字）。

无偏估计量（Unbiased Estimators）

我们希望估计量是“公平”的。在数学术语中，我们称之为无偏（Unbiased）。

如果一个估计量的平均值等于我们要寻找的总体参数的真实值，那么它就是无偏的。

类比： 想象一位弓箭手。如果这位弓箭手是“无偏”的，虽然他的箭不一定每次都能正中红心，但它们会均匀地分布在红心周围。他不会有总是偏左或总是偏右的习惯。

重点总结：无偏估计量不会系统性地高估或低估真实值。

2. 估计总体平均值 \((\mu)\)

好消息是，估计总体平均值非常简单！

我们称之为 \(\bar{X}\) 的样本平均值（sample mean），就是总体平均值 \(\mu\) 的一个无偏估计量。

公式

\( \hat{\mu} = \bar{X} = \frac{\sum X}{n} \)

其中： - \(\hat{\mu}\)（读作 "mu-hat"）是我们对总体平均值的估计值。 - \(\sum X\) 是样本中所有数值的总和。 - \(n\) 是样本中的数据个数。

小贴士：在统计学中，只要看到希腊字母上面有个“帽子”符号 (^)，就代表“......的估计值”。

3. 估计总体方差 \((\sigma^2)\)

这里开始会稍微复杂一点，但请跟上！

如果你使用以前学过的标准方差公式（除以 \(n\)），实际上你会低估总体的真实离散程度。这是因为小样本不太可能包含大总体中存在的“极端”数值。

为了使估计量变成无偏，我们必须进行一个小技巧，称为贝塞尔修正（Bessel's Correction）。我们不除以 \(n\)，而是除以 \(n - 1\)。

方差的无偏估计公式 \((S^2)\)

\( S^2 = \frac{1}{n-1} \left( \sum X^2 - \frac{(\sum X)^2}{n} \right) \)

或者，如果你已经知道样本平均值 \(\bar{X}\)： \( S^2 = \frac{\sum (X - \bar{X})^2}{n-1} \)

要避免的常见错误：一定要检查你的计算器设置！许多计算器有两个按钮：\(\sigma_n\)（除以 \(n\)）和 \(s_{n-1}\)（除以 \(n-1\)）。对于无偏估计量，你必须使用 \(n-1\) 的版本。

重点总结：除以 \(n-1\) 可以稍微“拉大”我们的估计值，以弥补样本通常看起来比真实总体“更紧凑”的事实。

4. 一步一步来：求无偏估计值

让我们看看一个现实生活中的例子。假设你测量了工厂生产的 5 条巧克力棒的重量（单位：克）：48, 52, 50, 49, 51。

步骤 1：求 \(X\) 的总和。
\( \sum X = 48 + 52 + 50 + 49 + 51 = 250 \)

步骤 2：求平均值的无偏估计值 \((\hat{\mu})\)。
\( \hat{\mu} = \frac{250}{5} = 50 \) 克。

步骤 3：求 \(X^2\) 的总和。
\( \sum X^2 = 48^2 + 52^2 + 50^2 + 49^2 + 51^2 = 2304 + 2704 + 2500 + 2401 + 2601 = 12510 \)

步骤 4：代入无偏方差公式。
\( S^2 = \frac{1}{5-1} \left( 12510 - \frac{250^2}{5} \right) \)
\( S^2 = \frac{1}{4} \left( 12510 - \frac{62500}{5} \right) \)
\( S^2 = \frac{1}{4} \left( 12510 - 12500 \right) \)
\( S^2 = \frac{10}{4} = 2.5 \)

总体方差的无偏估计值为 2.5。

5. 合并（Pooling）估计值

有时你可能会有两个不同的样本（例如：早班样本和晚班样本），你想将它们合并以获得更好的整体估计。

合并平均值

如果你有样本 1（大小为 \(n_1\)，平均值为 \(\bar{x}_1\)）和样本 2（大小为 \(n_2\)，平均值为 \(\bar{x}_2\)）：
\( \bar{x}_{combined} = \frac{n_1\bar{x}_1 + n_2\bar{x}_2}{n_1 + n_2} \)

类比： 这只是一个“加权平均值”。如果早班有 100 人，而晚班只有 5 人，早班的数据在最终答案中应该占有更大的“权重”。

快速复习栏

1. 平均值的无偏估计量：始终使用 \(\bar{X} = \frac{\sum X}{n}\)。
2. 方差的无偏估计量：使用分母为 \(n-1\) 的公式。
3. 为什么是 \(n-1\)？为了修正样本通常会低估总体真实离散程度的事实。
4. 符号：\(S^2\) 或 \(\hat{\sigma}^2\) 通常都代表方差的无偏估计值。

你知道吗？

使用 \(n-1\) 代替 \(n\) 的想法是由弗里德里希·贝塞尔（Friedrich Bessel）在 1818 年普及的。在此之前，人们经常得出错误的预测，因为他们没有意识到自己的样本倾向于过于一致（偏差）。这个微小的数学调整永久改变了我们从事科学和工程研究的方式！

如果方差公式刚开始看起来很吓人，不用担心！只要练习代入几次数字，这就会变得像本能一样自然。记住：只要是“无偏”的，分母通常就是“n 减 1”！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。