Other Hypothesis Tests and confidence intervals

引言：为什么要关注方差？

你好！欢迎来到 Further Statistics 2 中最实用的章节之一。到目前为止，你可能已经花了很多时间在处理均值 (means) 的检验。但在现实世界中，方差 (variance，即“离散程度”或一致性) 往往同样重要，甚至更重要！

想象一家制造飞机引擎螺栓的工厂。如果螺栓的平均尺寸正确，但方差很大，那么有些螺栓会太大，有些则太小。这会导致它们无法装配！在本章中，我们将学习如何检验总体方差是否符合特定数值，以及如何比较两个不同组别的方差。如果这些符号一开始让你感到困惑，请别担心，我们会一步一步为你拆解。

1. 正态分布的方差检验

当我们想要检验单一总体的方差 (\(\sigma^2\)) 时，我们会使用 卡方 (\(\chi^2\)) 分布。这个分布特别用于处理“平方”的数值，这非常合理，因为方差本质上就是一种平方后的度量！

检验统计量 (Test Statistic)

要进行这项检验，我们使用以下公式计算 \(\chi^2\) 值：

\(\chi^2 = \frac{(n-1)S^2}{\sigma^2}\)

其中：
- \(n\) 是你的样本大小。
- \(S^2\) 是你从样本中算出的无偏估计量 (unbiased estimate)。
- \(\sigma^2\) 是你用来进行检验的总体方差（来自你的原假设）。

自由度 (Degrees of Freedom)

对于这项检验，自由度 (df) 总是 \(n - 1\)。你可以把它想象成你的“灵活空间”。如果你有 10 个数据点，你就有 9 个自由度。

逐步假设检验

1. 设定假设： \(H_0: \sigma^2 = \text{数值}\) 以及 \(H_1: \sigma^2 \neq, <, \text{ 或 } > \text{数值}\)。
2. 计算检验统计量： 使用上述的 \(\chi^2\) 公式。
3. 找出临界值 (critical value)： 根据你的显著性水平和 \(df = n-1\)，在 \(\chi^2\) 分布表中查出数值。
4. 比较并得出结论： 如果你算出的值落在“拒绝域”(critical region)（即极端的尾部区域），就拒绝 \(H_0\)。

方差的置信区间 (Confidence Intervals)

你也可以估计真实的总体方差落在哪个范围。置信区间的公式为：

\( \left( \frac{(n-1)S^2}{\chi^2_{\text{upper}}}, \frac{(n-1)S^2}{\chi^2_{\text{lower}}} \right) \)

注意：由于 \(\chi^2\) 分布不是对称的，所以从表中查出的“上限”和“下限”数值会不同！

快速复习箱：
- 使用 \(\chi^2\) 进行单一方差检验。
- 自由度 = \(n-1\)。
- 务必使用无偏估计量 \(S^2\)。

重点总结： \(\chi^2\) 检验能帮助我们判断数据的“离散程度”是否与我们预期的有显著差异。

2. 比较两个方差：F 检验

如果想知道两部不同的机器是否同样稳定？或者一种新的培训方法是否能比旧方法减少测验分数的方差？这时，我们需要使用 F 分布来比较两个独立样本。

F 统计量

F 检验基本上就是两个方差的比率。计算起来非常简单：

\(F = \frac{S_1^2}{S_2^2}\)

黄金法则： 为了方便起见，请务必将较大的样本方差放在分子 (\(S_1^2 > S_2^2\))。这样可以确保你的 \(F\) 值永远大于 1，这也符合统计表的一般编排方式。

F 检验的自由度

F 分布有两组自由度：
- \(\nu_1 = n_1 - 1\)（对应分子中的方差）
- \(\nu_2 = n_2 - 1\)（对应分母中的方差）

查表时，你必须确保这两组自由度的顺序正确！

现实生活示例

想象比较两个品牌的灯泡。品牌 A 的寿命样本方差为 100 小时，品牌 B 为 250 小时。为了查看品牌 B 是否显著地更“不可靠”(方差更大)，你会计算 \(F = \frac{250}{100} = 2.5\)。然后你再检查在给定的样本大小下，2.5 是否为一个异常大的比率。

常见错误避坑指南

- 混淆 \(S^2\) 与 \(\sigma^2\)： 记住，\(S^2\) 来自你的数据，而 \(\sigma^2\) 是理论上的总体数值。
- 忘记平方： 如果题目给你的是标准差 (\(s\))，你必须先将其平方得到方差 (\(S^2\))，才能使用公式！
- 双尾检验： 如果你进行的是 \(H_1: \sigma_1^2 \neq \sigma_2^2\)，记得将显著性水平除以 2（例如，进行 5% 的检验时，在表中要查 0.025）。

你知道吗？ F 分布是以现代统计学创始人之一罗纳德·费雪 (Sir Ronald Fisher) 的名字命名的。他开发这个分布是为了协助分析农业实验数据！

重点总结： F 检验是一个比值。如果比值接近 1，则两者的方差可能相等；如果比值非常大，则表示其中一组的方差程度显著大于另一组。

3. 总结检查清单

在进入考场前，请确保你能做到以下几点：

1. 辨别何时使用 \(\chi^2\) (单一样本) 而何时使用 \(F\) (两个样本)。
2. 从原始数据中计算方差的无偏估计量 \(S^2\)。
3. 找出正确的自由度 (\(n-1\))。
4. 正确使用两种分布的统计表。
5. 在题目情境中解释结果（例如：“有证据显示机器 A 比机器 B 更稳定”）。

如果一开始觉得困难，别担心！ 统计学最重要的就是练习。只要你亲手做过三到四次假设检验，模式就会变得非常清晰。你一定能行的！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。