欢迎来到卡方检验 (Chi-Squared Tests)!

在本章中,我们将探讨一种强大的统计工具:卡方 (\(\chi^2\)) 检验。你有没有想过六面骰子是否公平?或者足球比赛中的入球数是否遵循某种特定模式?这正是这些检验能帮我们解决的问题!我们使用它们来查看我们收集的“观察”数据是否符合数学模型所预期的“期望”数据。

如果起初觉得这些概念有点抽象,请不用担心。读完这些笔记后,你将能够判断一组数据是否“符合”模型,或者两个因素之间是否独立。

1. 基础概念:观察值与期望值

每一次卡方检验都围绕着比较两组数据:

  1. 观察频数 (\(O_i\)): 你从实验中实际数出来或收集到的数据。
  2. 期望频数 (\(E_i\)): 如果你的理论(即虚无假设)完全正确,你“应该”得到的数字。

卡方统计量

我们计算一个单一数值来衡量观察值与期望值之间的“差距”。公式如下:

\(\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}\)

可以这样想: 如果观察值与期望值非常接近,\((O - E)\) 就会很小,我们的 \(\chi^2\) 值也会很小。如果它们差异很大,\(\chi^2\) 值就会很大,这暗示我们的理论可能是错的!

关键法则:“5 的法则”(Rule of 5)

为了确保卡方检验的准确性,每一个单元格的期望频数 (\(E_i\)) 必须至少为 5
常见错误: 学生经常去检查观察频数。千万不要这样做!请务必检查期望值。
如果小于 5 怎么办? 你必须合并相邻的单元格,直到合并后的期望频数达到 5 或以上。当你合并单元格时,请记得你的类别数量 (\(n\)) 会随之减少!

重点总结: 大的 \(\chi^2\) = 理论与现实之间存在巨大差异。请务必确保 \(E_i \ge 5\)。

2. 拟合优度检验 (Goodness of Fit Tests)

拟合优度检验用于检查数据是否符合特定的概率分布。在 Edexcel FM1 课程中,你需要知道如何对以下分布进行检验:

  • 离散均匀分布 (Discrete Uniform): 每个结果发生的概率都相等(例如公平的骰子)。
  • 二项分布 (Binomial distribution): 在固定次数的试验中,成功/失败的次数。
  • 泊松分布 (Poisson distribution): 事件以恒定速率发生(例如放射性衰变)。
  • 几何分布 (Geometric distribution): 直到第一次成功所需的试验次数。

检验步骤

1. 建立假设:
\(H_0\):数据可以用 [分布名称] 进行建模。
\(H_1\):数据不可以用 [分布名称] 进行建模。

2. 计算期望频数:
\(E_i = \text{该类别的概率} \times \text{总频数}\)

3. 检查“5 的法则”: 必要时合并单元格。

4. 计算 \(\chi^2\): 使用公式或计算器的列表功能。

自由度 (\(v\))

这是拟合优度检验中最棘手的部分!公式如下:

\(v = n - 1 - k\)

其中:
- \(n\) 是单元格的数量(合并后)。
- \(1\) 是因为总频数是固定的,所以必须减去 1。
- \(k\) 是你在计算期望值时,必须从数据中估计的参数数量

什么时候 \(k > 0\)?
  • 泊松分布: 如果你需要从表格中计算平均值 (\(\lambda\)),则 \(k = 1\)。如果题目直接给出 \(\lambda\),则 \(k = 0\)。
  • 二项分布: 如果你需要从表格中计算概率 \(p\),则 \(k = 1\)。
  • 均匀分布: 通常 \(k = 0\),因为没有参数需要估计。

你知道吗? “自由度”就像有人告诉你选 5 个数字,总和必须等于 20。你可以自由选择前 4 个数字,但第 5 个数字必须是固定的,才能凑成总和。这就是为什么我们通常要减去 1!

快速回顾: \(v = \text{单元格数} - 1 - \text{估计参数数}\)。请仔细阅读题目,确认参数是“给定的”还是“计算出来的”。

3. 列联表 (Contingency Tables,独立性检验)

当我们有两个不同因素(例如性别与科目选择)并想了解它们是否独立(无关联)时,我们就会使用列联表。

检验步骤

\(H_0\):[因素 1] 与 [因素 2] 是独立的
\(H_1\):[因素 1] 与 [因素 2] 不是独立的(存在关联)。

计算期望频数

对于表中的每个单元格,期望频数为:
\(E_i = \frac{\text{行总计} \times \text{列总计}}{\text{总计}}\)

列联表的自由度

这比拟合优度检验简单得多!
\(v = (r - 1) \times (c - 1)\)
其中 \(r\) 是行数,\(c\) 是列数。这里你不需要担心 \(k\)!

记忆小撇步: 对于列联表,请记住“RC”(行/列)。自由度只是“减少后”的行数与列数的乘积。

重点总结: 列联表用于测试两个变量是否相关。计算期望值时,请使用“行 \(\times\) 列 / 总计”规则。

4. 结束检验

一旦你计算出 \(\chi^2\) 和自由度 (\(v\)),有两种方法可以完成检验:

  1. 临界值法: 使用 \(v\) 和显著性水平 (\(\alpha\)) 在统计表中查出临界值。如果计算出的 \(\chi^2\) > 临界值,则拒绝 \(H_0\)
  2. P 值法: 大多数现代计算机会直接给你 P 值。如果 P 值 < 显著性水平,则拒绝 \(H_0\)

撰写结论

结论务必包含以下两部分:

  1. 统计结果: “拒绝 \(H_0\)”或“未能拒绝 \(H_0\)”。
  2. 情境结果: “在 5% 的显著性水平下,有足够的证据表明这颗骰子有偏差”或“没有足够的证据表明性别与科目选择之间存在关联”。

鼓励一下: 假设检验的结论有时看起来很冗长,但如果你每次都遵循这个“结果 + 情境”的模板,就能轻松拿到满分!

检查清单

  • 这是拟合优度检验还是列联表
  • 我的假设清晰且包含情境了吗?
  • 所有的期望频数都 \(\ge 5\) 吗?(如果不够,请合并!)
  • 我正确计算了自由度吗?(注意估计参数的数量!)
  • 我的结论是否同时具备统计结果情境描述

祝你练习顺利!做的 \(\chi^2\) 检验越多,这个过程就会变得越直观。