Confidence intervals and tests using the t

简介：\(t\)-分布的威力

欢迎来到 Further Statistics 2 中最实用的一章！在你的数学旅程中，你可能已经使用过正态分布 (\(z\)-分布) 来进行平均值的假设检验。但有一个前提：要使用 \(z\)-检验，你必须知道总体方差 (\(\sigma^2\))。

在现实世界中，我们几乎不可能知道整个总体的真实方差。相反地，我们必须利用样本来估计它。这就是\(t\)-分布（也称为学生 \(t\)-分布）大显身手的时候了！即使在信息有限的情况下，它也能让我们做出准确的预测。你可以把 \(t\)-分布想象成正态分布的“谨慎版”——它考虑了因未知 \(\sigma^2\) 而产生的额外不确定性。

1. 单一平均值 (\(\mu\)) 的检验

当我们想检验一个样本是否来自具有特定平均值 \(\mu\) 的总体，但不知道总体方差 \(\sigma^2\) 时，我们就会使用单一样本 \(t\)-检验。

设定

我们使用由样本计算出的总体方差无偏估计量 (\(s^2\))。由于我们使用的是估计值，我们的概率曲线“形状”会根据数据量的多寡而改变。这是通过自由度 (\(v\)) 来衡量的。

快速回顾： 对于单一样本，若样本大小为 \(n\)，自由度为：
\(v = n - 1\)

检验统计量

为了观察样本平均值 \(\bar{x}\) 与假设平均值 \(\mu\) 之间的距离，我们计算 \(t\)-统计量：

\(t = \frac{\bar{x} - \mu}{s / \sqrt{n}}\)

其中 \(s\) 是样本标准差。然后将此数值与使用 \(n-1\) 自由度的 \(t\)-分布表中的临界值进行比较。

记忆小贴士： “自由即减一”。要找到单一样本的自由度，只需从样本大小减去 1 即可！

你知道吗？ \(t\)-分布是由在健力士（Guinness）酿酒厂工作的 William Sealy Gosset 所发展出来的！他以“学生 (Student)”为笔名发表论文，因为他的雇主不希望竞争对手知道他们正在运用统计学来提升啤酒质量。

平均值的置信区间

除了进行假设检验外，我们还可以估计真实总体平均值所在的范围。置信区间的公式为：

\(\bar{x} \pm t_{v}(\% \text{ 水平}) \times \frac{s}{\sqrt{n}}\)

示例：如果麦片盒重量的 95% 置信区间为 \([495g, 505g]\)，这意味着我们有 95% 的信心认为，所有生产的麦片盒的真实平均重量都在此范围内。

重点总结： 当总体方差未知且底层总体呈现正态分布时，请使用 \(t\)-分布。

2. 配对 \(t\)-检验 (Paired \(t\)-test)

有时候，数据会以配对形式出现。这通常发生在“前后对照”的情境或“配对样本”（例如测试同一个人的左脚与右脚）中。

运作方式

不要被两列数据迷惑了！在配对 \(t\)-检验中，我们不关心原始分数，只关心配对之间的差值 (\(d\))。

步骤说明：
1. 计算每一对的差值 \(d = x_1 - x_2\)。
2. 将这些差值视为单一样本数据。
3. 检验这些差值的平均值为零的假设 (\(H_0: \mu_d = 0\))。
4. 使用与单一平均值检验相同的公式：\(t = \frac{\bar{d} - 0}{s_d / \sqrt{n}}\)，其中 \(n\) 为配对数量。

常见错误： 学生常在这里将自由度误用为 \(2n - 1\)。请记住，因为我们已经将两组数据转换为一组差值，自由度仅为 \((\text{配对数量}) - 1\)。

重点总结： 配对检验通过比较同一个体前后的差异，减少了“背景噪音”，使检验对变化更为敏感。

3. 比较两个独立平均值

如果你想比较两个完全不同的组别呢？例如：“A 校学生的分数是否高于 B 校学生？”这就是独立样本 \(t\)-检验。

条件：相等方差

在 Edexcel 课程大纲的这部分（第 7.3 节），我们假设两个总体具有相等但未知的方差。由于我们假设方差相同，我们会将样本数据“合并 (pooled)”在一起，以获得对该共同方差更好的估计。

合并方差估计 (\(s^2\))

这是两个样本方差的加权平均：

\(s^2 = \frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2}\)

类比： 想象两位厨师在煮汤。如果厨师 A 煮了一大锅，而厨师 B 只煮了一小碗，当你把汤混合时，大锅的味道影响力应该更大。合并方差赋予较大样本更多的“权重”。

检验统计量

若要检验平均值是否不同 (\(H_0: \mu_1 = \mu_2\))：

\(t = \frac{(\bar{x}_1 - \bar{x}_2) - (\mu_1 - \mu_2)}{s \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}\)

此检验的自由度为：
\(v = n_1 + n_2 - 2\)

快速回顾：为什么是 \(n_1 + n_2 - 2\)？
当我们计算平均值时，每个样本都会“损失”一个自由度。因为我们有两个样本，所以损失了两个！

重点总结： 仅在题目说明（或可以假设）两个独立组别的方差相等时，才使用合并 \(t\)-检验。

成功检查清单

如果这些公式起初看起来很吓人，别担心。大部分的工作只是辨识题目所讲述的“故事”类型。问自己：

1. 我知道总体方差 \(\sigma^2\) 吗？
- 是 \(\rightarrow\) 使用 \(z\)-检验 (正态分布)。
- 否 \(\rightarrow\) 使用 \(t\)-检验。

2. 题目中有一个组别还是两个？
- 一组 \(\rightarrow\) 单一样本 \(t\)-检验 (\(df = n-1\))。
- 两组（配对/前后对照） \(\rightarrow\) 对差值进行配对 \(t\)-检验 (\(df = \text{配对数} - 1\))。
- 两组（独立） \(\rightarrow\) 合并 \(t\)-检验 (\(df = n_1 + n_2 - 2\))。

3. 我的假设是什么？
- 对于任何 \(t\)-检验，总体必须为正态分布。对于独立样本检验，我们还假设方差相等。

最后小贴士： 使用计算器时，务必检查它要求输入的是“样本标准差 (\(s_x\))”还是“总体标准差 (\(\sigma_x\))”。进行 \(t\)-检验时，我们永远使用分母为 \(n-1\) 的版本！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。

Confidence intervals and tests using the t – distribution

简介：\(t\)-分布的威力

1. 单一平均值 (\(\mu\)) 的检验

设定

检验统计量

平均值的置信区间

2. 配对 \(t\)-检验 (Paired \(t\)-test)

运作方式

3. 比较两个独立平均值

条件：相等方差

合并方差估计 (\(s^2\))

检验统计量

成功检查清单

准备好测试自己了吗？

更多Further Mathematics (9FM0)章节

立即实践所学