卡方 (\(\chi^2\)) 检验简介

欢迎来到进阶统计学中最实用的章节之一!你有没有想过一枚硬币是否真的公平,或者一间公司声称糖果包装内颜色分布是“随机”的说法是否属实?卡方检验 (Chi-squared tests) 就是数学家用来解答这些疑问的工具。

在本章中,我们基本上是在比较我们观察到的数值 (Observed values) 与基于数学模型预期会出现的数值 (Expected values)。如果两者差异巨大,我们就可能推论该模型是错误的!

1. 拟合优度检验 (Goodness of Fit Test)

“拟合优度”检验旨在检查特定的概率分布(例如离散均匀分布二项分布泊松分布)与实际数据的吻合程度。

零假设与对立假设

每次检验都从两个陈述开始:

\(H_0\) (零假设):数据符合该指定分布(例如:“数据服从泊松分布”)。
\(H_1\) (对立假设):数据不符合该指定分布。

检验统计量

为了衡量观察值与预期值之间的“差距”,我们使用卡方统计量

\(\chi^2_{calc} = \sum \frac{(O_i - E_i)^2}{E_i}\)

其中:
- \(O_i\) = 观察频率(实际发生次数)。
- \(E_i\) = 预期频率(数学模型预测发生的次数)。

类比:想象你预期每天会收到 10 条消息。如果收到 9 条,那没什么大不了;但如果你收到 200 条,肯定有什么地方不对劲!卡方统计量正是用来计算这种差异有多“异常”。

黄金法则:“5 的规则”

为了确保卡方检验的准确性,每个单元格的预期频率 (\(E_i\)) 必须至少为 5
常见错误:学生经常去检查观察值 (\(O_i\))。千万别这样做!一定要检查预期值 (\(E_i\))。如果某个数值小于 5,你必须将该单元格与相邻的单元格合并(并且记得随后要调整自由度!)。

快速复习箱:
1. 设定 \(H_0\) 与 \(H_1\)。
2. 计算预期频率 (\(E_i\))。
3. 检查是否有 \(E_i < 5\)。若有,请合并单元格。
4. 计算 \(\chi^2\) 统计量。

2. 自由度 (\(\nu\))

“自由度”(用希腊字母 nu, \(\nu\) 表示)告诉我们该使用哪条卡方曲线。这是最容易丢分的地方,所以务必留心!

对于拟合优度检验:

\(\nu = n - 1 - k\)

其中:
- \(n\) = 单元格总数(合并的数量)。
- \(1\) = 由于总频率固定,必须减去 1。
- \(k\) = 从数据中估计出的参数数量。

何时使用 \(k\)?
- 离散均匀分布:通常 \(k=0\)(没有参数需要估计)。
- 泊松分布:如果你已知 \(\lambda\),则 \(k=0\);如果你必须先从数据中计算平均值 (\(\bar{x}\)),则 \(k=1\)。
- 二项分布:如果你已知 \(p\),则 \(k=0\);如果你必须利用数据的平均值来计算 \(p\),则 \(k=1\)。

冷知识:“自由度”一词指的是系统中有多少数值可以自由变动。如果你知道总频率,且知道除最后一个外的所有单元格数值,那最后一个数值就“被锁定”了,这就是为什么我们要减去 1 的原因!

3. 列联表 (Contingency Tables)

列联表用于检验两个不同因素是否独立。例如:“学生的最爱科目与性别之间是否存在关联?”

列联表的假设:

\(H_0\):两个因素相互独立(无关联)。
\(H_1\):两个因素不独立(存在关联)。

计算预期频率:

对于表中的每个单元格,使用这个简单的公式:
\(E = \frac{\text{行总和} \times \text{列总和}}{\text{总计}}\)

列联表的自由度:

\(\nu = (r - 1)(c - 1)\)
其中 \(r\) 是行数,\(c\) 是列数。

提示:对于列联表,你不需要担心“估计参数”(\(k\)) 的问题,只需使用行/列公式即可!

4. 寻找临界值并作出结论

当你算出了 \(\chi^2\) 统计量与自由度 \(\nu\) 后,你需要判断结果是否显著。

步骤 1:利用你的显著性水平(通常为 5% 或 1%)与 \(\nu\),查阅考试提供的统计表以找出临界值 (Critical Value)
步骤 2:比较!
- 若计算出的 \(\chi^2\) > 临界值:差异大到不可能是巧合。拒绝 \(H_0\)
- 若计算出的 \(\chi^2\) < 临界值:差异小到可能是随机误差。无法拒绝 \(H_0\)(接受 \(H_0\))。

使用计算器:你的计算器通常可以给你一个 p-值 (p-value)
- 若 p-值 < 显著性水平(例如 0.03 < 0.05),则拒绝 \(H_0\)
- 如果觉得一开始很难理解也不用担心,记住这句口诀:“p 值若低,\(H_0\) 必去!”(If the p is low, the \(H_0\) must go!)

重点检查清单

核心重点:
- 观察 (\(O\)):真实数据。预期 (\(E\)):理论数据。
- 5 的规则:若 \(E < 5\),务必合并单元格。
- 拟合优度检验 \(\nu\): \(n - 1 - \text{估计参数数量}\)。
- 列联表 \(\nu\): \((r-1)(c-1)\)。
- 结论:巨大的 \(\chi^2\) 值会导致拒绝零假设。