Chi-squared tests - Further Mathematics B (MEI) - H645 - Cambridge OCR A Level

简介：欢迎来到卡方检验（Chi-Squared Tests）的世界！

你有没有好奇过，两件事物之间是否存在真正的关联，还是你所看到的规律纯粹只是巧合？例如，你喜欢的音乐类型真的取决于你的年龄吗？还是这只是随机的？卡方检验（Chi-squared (\(\chi^2\)) tests）就是能帮助我们以统计信心来回答这些问题的数学工具！

在本章中，我们将学习如何运用这些检验来检查类别之间的关联性（Association），并验证我们收集的数据是否符合特定的概率模型（Probability model）（例如你之前学过的二项分布或泊松分布）。如果刚开始觉得这些概念有点深奥，别担心——我们会把它们拆解成简单且易于掌握的步骤。

1. 基础概念：列联表（Contingency Tables）

在进行任何检验之前，我们需要先整理数据。当我们处理的是类别数据（Categorical data）（即符合“红/蓝”或“合格/不合格”这类分组的数据）时，我们会使用列联表。

例子： 假设我们访问了 100 名学生，询问他们喜欢喝茶还是咖啡，同时记录他们是中六还是中七的学生。列联表将会清晰地显示有多少名中六生喜欢喝茶、有多少名中七生喜欢喝咖啡，以此类推。

关键术语

观测值（Observed Values, \(O\)）： 这是你在数据表中看到的实际数字。
期望值（Expected Values, \(E\)）： 这是如果类别之间完全没有关联时，我们所“预期”会看到的数字。

2. 卡方关联性检验（独立性检验）

这项检验旨在检查两个因素是否为独立（Independent）（即没有关联），还是它们之间存在关联性（Association）。

步骤 1：建立假设（Hypotheses）

我们总是从“虚无假设”（Null Hypothesis, \(H_0\)）开始，它假设一个平淡无奇的选项——即没有发生任何有趣的事情。

\(H_0\)：两个因素之间没有关联（它们是独立的）。
\(H_1\)：两个因素之间存在关联。

步骤 2：计算期望频数（Expected Frequencies, \(E\)）

对于表格中的每个格子，如果 \(H_0\) 为真，我们使用以下公式来计算该格应该出现的数值：

\[E = \frac{\text{列总计} \times \text{行总计}}{\text{总计}}\]

步骤 3：求检验统计量（Test Statistic, \(\chi^2_{\text{calc}}\)）

我们想知道观测值与期望值之间的差异。我们使用以下公式：

\[\chi^2 = \sum \frac{(O - E)^2}{E}\]

小复习： 每一个 \(\frac{(O - E)^2}{E}\) 都被称为一个贡献值（Contribution）。将它们全部相加即得到最终的检验统计量。如果观测值与期望值非常接近，\(\chi^2\) 就会很小！

步骤 4：自由度（Degrees of Freedom, \(df\)）

要从统计表找到“临界值（Critical Value）”，你需要自由度。对于一个有 \(r\) 行和 \(c\) 列的列联表：

\[df = (r - 1)(c - 1)\]

步骤 5：做出决策

将你计算出的 \(\chi^2\) 值与公式手册中的临界值进行比较（使用你的 \(df\) 和显著性水平）：

若 \(\chi^2_{\text{calc}} > \text{临界值}\)：拒绝 \(H_0\)。有证据显示存在关联！
若 \(\chi^2_{\text{calc}} < \text{临界值}\)：不拒绝 \(H_0\)。没有足够的证据显示它们相关。

重点总结： 较大的 \(\chi^2\) 值意味着“我们看到的”与“我们预期的”之间的差异太大，不能单纯归咎于运气！

3. 卡方拟合优度检验（Goodness of Fit）

这项检验是一个“现实核查”。它询问的是：“这组数据是否真的遵循某个特定的分布（如均匀分布、二项分布或泊松分布）？”

假设

\(H_0\)：数据符合 [模型名称]。
\(H_1\)：数据不符合 [模型名称]。

“期望频数过小”规则

重要！ 卡方检验只有在期望值 (\(E\)) 足够大时才准确。
规则： 如果任何 \(E < 5\)，你必须将该格子与邻近的格子合并。合并后记得重新调整你的类别总数 (\(n\))！

计算拟合优度检验的自由度

这是学生最容易出错的地方！公式为：

\[df = n - 1 - k\]

\(n\) = 类别数量（合并单元格后）。
\(k\) = 为了建立模型，你必须从数据中计算出的参数（Parameters）数量。

关于 \(k\) 的记忆小撇步：

如果模型是均匀分布（Uniform）：通常 \(k = 0\)。
如果你必须为泊松模型计算平均值（Mean）：\(k = 1\)。
如果你必须为二项模型计算概率（Probability, \(p\)）：\(k = 1\)。

重点总结： 拟合优度检验告诉我们，我们的数学模型是否准确地反映了真实世界。

4. 常见错误避坑指南

混淆 \(O\) 与 \(E\)： 务必将观测频数用于 \(O\)，将计算得出的概率/频数用于 \(E\)。
忘记合并： 如果期望值小于 5，你必须在计算 \(\chi^2\) 之前合并单元格。
错误的 \(df\)： 仔细检查你是否估算了任何参数（如平均值）。如果有，记得从 \(df\) 中减去它们。
使用百分比： 卡方检验必须使用计数/频数，绝对不要直接将百分比或概率代入 \(\chi^2\) 公式！

5. 考试实用技巧

你知道吗？ 你不需要展示每一次重复的计算过程。阅卷人想看到的是你掌握了方法。只需列出一个计算期望值的例子和一个计算贡献值的例子，然后可以直接列出其余的结果或给出总和。

关于 P 值（p-value）： 有时候计算机程序（或你的计算器）会给出一个 P 值而不是临界值。
经验法则： 如果 P 值 < 显著性水平（例如 0.05），则拒绝 \(H_0\)。
记住这句口诀：“P 值若过低， \(H_0\) 就得弃！”（If the p is low, the \(H_0\) must go!）

如果觉得很复杂也别担心！ 一旦你练习过几次列联表，整个过程是非常合乎逻辑的。记住四步骤：建立假设、求期望值、计算贡献总和，最后将其与“守门员”（临界值）进行比较。

总结检查清单

- 列联表（Contingency Table）： 使用 \(df = (r-1)(c-1)\)。
- 拟合优度（Goodness of Fit）： 使用 \(df = n - 1 - k\)。
- “5”的规则： 若 \(E < 5\)，合并单元格。
- 统计量公式： \(\chi^2 = \sum \frac{(O-E)^2}{E}\)。
- 结论： 最终结论必须结合题目背景来撰写（例如：“有证据显示年龄与音乐选择之间存在关联”）。

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。