Chi Squared Tests

欢迎来到卡方检验 (Chi-Squared Tests)！

在本章中，我们将探讨一种强大的统计工具：卡方 (\(\chi^2\)) 检验。你有没有想过六面骰子是否公平？或者足球比赛中的入球数是否遵循某种特定模式？这正是这些检验能帮我们解决的问题！我们使用它们来查看我们收集的“观察”数据是否符合数学模型所预期的“期望”数据。

如果起初觉得这些概念有点抽象，请不用担心。读完这些笔记后，你将能够判断一组数据是否“符合”模型，或者两个因素之间是否独立。

1. 基础概念：观察值与期望值

每一次卡方检验都围绕着比较两组数据：

观察频数 (\(O_i\))： 你从实验中实际数出来或收集到的数据。
期望频数 (\(E_i\))： 如果你的理论（即虚无假设）完全正确，你“应该”得到的数字。

卡方统计量

我们计算一个单一数值来衡量观察值与期望值之间的“差距”。公式如下：

\(\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}\)

可以这样想： 如果观察值与期望值非常接近，\((O - E)\) 就会很小，我们的 \(\chi^2\) 值也会很小。如果它们差异很大，\(\chi^2\) 值就会很大，这暗示我们的理论可能是错的！

关键法则：“5 的法则”(Rule of 5)

为了确保卡方检验的准确性，每一个单元格的期望频数 (\(E_i\)) 必须至少为 5。
常见错误： 学生经常去检查观察频数。千万不要这样做！请务必检查期望值。
如果小于 5 怎么办？ 你必须合并相邻的单元格，直到合并后的期望频数达到 5 或以上。当你合并单元格时，请记得你的类别数量 (\(n\)) 会随之减少！

重点总结： 大的 \(\chi^2\) = 理论与现实之间存在巨大差异。请务必确保 \(E_i \ge 5\)。

2. 拟合优度检验 (Goodness of Fit Tests)

拟合优度检验用于检查数据是否符合特定的概率分布。在 Edexcel FM1 课程中，你需要知道如何对以下分布进行检验：

离散均匀分布 (Discrete Uniform)： 每个结果发生的概率都相等（例如公平的骰子）。
二项分布 (Binomial distribution)： 在固定次数的试验中，成功/失败的次数。
泊松分布 (Poisson distribution)： 事件以恒定速率发生（例如放射性衰变）。
几何分布 (Geometric distribution)： 直到第一次成功所需的试验次数。

检验步骤

1. 建立假设：
\(H_0\)：数据可以用 [分布名称] 进行建模。
\(H_1\)：数据不可以用 [分布名称] 进行建模。

2. 计算期望频数：
\(E_i = \text{该类别的概率} \times \text{总频数}\)

3. 检查“5 的法则”： 必要时合并单元格。

4. 计算 \(\chi^2\)： 使用公式或计算器的列表功能。

自由度 (\(v\))

这是拟合优度检验中最棘手的部分！公式如下：

\(v = n - 1 - k\)

其中：
- \(n\) 是单元格的数量（合并后）。
- \(1\) 是因为总频数是固定的，所以必须减去 1。
- \(k\) 是你在计算期望值时，必须从数据中估计的参数数量。

什么时候 \(k > 0\)？

泊松分布： 如果你需要从表格中计算平均值 (\(\lambda\))，则 \(k = 1\)。如果题目直接给出 \(\lambda\)，则 \(k = 0\)。
二项分布： 如果你需要从表格中计算概率 \(p\)，则 \(k = 1\)。
均匀分布： 通常 \(k = 0\)，因为没有参数需要估计。

你知道吗？ “自由度”就像有人告诉你选 5 个数字，总和必须等于 20。你可以自由选择前 4 个数字，但第 5 个数字必须是固定的，才能凑成总和。这就是为什么我们通常要减去 1！

快速回顾： \(v = \text{单元格数} - 1 - \text{估计参数数}\)。请仔细阅读题目，确认参数是“给定的”还是“计算出来的”。

3. 列联表 (Contingency Tables，独立性检验)

当我们有两个不同因素（例如性别与科目选择）并想了解它们是否独立（无关联）时，我们就会使用列联表。

检验步骤

\(H_0\)：[因素 1] 与 [因素 2] 是独立的。
\(H_1\)：[因素 1] 与 [因素 2] 不是独立的（存在关联）。

计算期望频数

对于表中的每个单元格，期望频数为：
\(E_i = \frac{\text{行总计} \times \text{列总计}}{\text{总计}}\)

列联表的自由度

这比拟合优度检验简单得多！
\(v = (r - 1) \times (c - 1)\)
其中 \(r\) 是行数，\(c\) 是列数。这里你不需要担心 \(k\)！

记忆小撇步： 对于列联表，请记住“RC”（行/列）。自由度只是“减少后”的行数与列数的乘积。

重点总结： 列联表用于测试两个变量是否相关。计算期望值时，请使用“行 \(\times\) 列 / 总计”规则。

4. 结束检验

一旦你计算出 \(\chi^2\) 和自由度 (\(v\))，有两种方法可以完成检验：

临界值法： 使用 \(v\) 和显著性水平 (\(\alpha\)) 在统计表中查出临界值。如果计算出的 \(\chi^2\) > 临界值，则拒绝 \(H_0\)。
P 值法： 大多数现代计算机会直接给你 P 值。如果 P 值 < 显著性水平，则拒绝 \(H_0\)。

撰写结论

结论务必包含以下两部分：

统计结果： “拒绝 \(H_0\)”或“未能拒绝 \(H_0\)”。
情境结果： “在 5% 的显著性水平下，有足够的证据表明这颗骰子有偏差”或“没有足够的证据表明性别与科目选择之间存在关联”。

鼓励一下： 假设检验的结论有时看起来很冗长，但如果你每次都遵循这个“结果 + 情境”的模板，就能轻松拿到满分！

检查清单

这是拟合优度检验还是列联表？
我的假设清晰且包含情境了吗？
所有的期望频数都 \(\ge 5\) 吗？（如果不够，请合并！）
我正确计算了自由度吗？（注意估计参数的数量！）
我的结论是否同时具备统计结果与情境描述？

祝你练习顺利！做的 \(\chi^2\) 检验越多，这个过程就会变得越直观。

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。

欢迎来到卡方检验 (Chi-Squared Tests)！

1. 基础概念：观察值与期望值

卡方统计量

关键法则：“5 的法则”(Rule of 5)

2. 拟合优度检验 (Goodness of Fit Tests)

检验步骤

自由度 (\(v\))

什么时候 \(k > 0\)？

3. 列联表 (Contingency Tables，独立性检验)

检验步骤

计算期望频数

列联表的自由度

4. 结束检验

撰写结论

检查清单

准备好测试自己了吗？

更多Further Mathematics (9FM0)章节

立即实践所学