简介:欢迎来到卡方检验(Chi-Squared Tests)的世界!

你有没有好奇过,两件事物之间是否存在真正的关联,还是你所看到的规律纯粹只是巧合?例如,你喜欢的音乐类型真的取决于你的年龄吗?还是这只是随机的?卡方检验(Chi-squared (\(\chi^2\)) tests)就是能帮助我们以统计信心来回答这些问题的数学工具!

在本章中,我们将学习如何运用这些检验来检查类别之间的关联性(Association),并验证我们收集的数据是否符合特定的概率模型(Probability model)(例如你之前学过的二项分布或泊松分布)。如果刚开始觉得这些概念有点深奥,别担心——我们会把它们拆解成简单且易于掌握的步骤。


1. 基础概念:列联表(Contingency Tables)

在进行任何检验之前,我们需要先整理数据。当我们处理的是类别数据(Categorical data)(即符合“红/蓝”或“合格/不合格”这类分组的数据)时,我们会使用列联表

例子: 假设我们访问了 100 名学生,询问他们喜欢喝茶还是咖啡,同时记录他们是中六还是中七的学生。列联表将会清晰地显示有多少名中六生喜欢喝茶、有多少名中七生喜欢喝咖啡,以此类推。

关键术语

  • 观测值(Observed Values, \(O\)): 这是你在数据表中看到的实际数字。
  • 期望值(Expected Values, \(E\)): 这是如果类别之间完全没有关联时,我们所“预期”会看到的数字。

2. 卡方关联性检验(独立性检验)

这项检验旨在检查两个因素是否为独立(Independent)(即没有关联),还是它们之间存在关联性(Association)

步骤 1:建立假设(Hypotheses)

我们总是从“虚无假设”(Null Hypothesis, \(H_0\))开始,它假设一个平淡无奇的选项——即没有发生任何有趣的事情。

\(H_0\):两个因素之间没有关联(它们是独立的)。
\(H_1\):两个因素之间存在关联

步骤 2:计算期望频数(Expected Frequencies, \(E\))

对于表格中的每个格子,如果 \(H_0\) 为真,我们使用以下公式来计算该格应该出现的数值:

\[E = \frac{\text{列总计} \times \text{行总计}}{\text{总计}}\]

步骤 3:求检验统计量(Test Statistic, \(\chi^2_{\text{calc}}\))

我们想知道观测值期望值之间的差异。我们使用以下公式:

\[\chi^2 = \sum \frac{(O - E)^2}{E}\]

小复习: 每一个 \(\frac{(O - E)^2}{E}\) 都被称为一个贡献值(Contribution)。将它们全部相加即得到最终的检验统计量。如果观测值与期望值非常接近,\(\chi^2\) 就会很小!

步骤 4:自由度(Degrees of Freedom, \(df\))

要从统计表找到“临界值(Critical Value)”,你需要自由度。对于一个有 \(r\) 行和 \(c\) 列的列联表:

\[df = (r - 1)(c - 1)\]

步骤 5:做出决策

将你计算出的 \(\chi^2\) 值与公式手册中的临界值进行比较(使用你的 \(df\) 和显著性水平):

  • 若 \(\chi^2_{\text{calc}} > \text{临界值}\):拒绝 \(H_0\)。有证据显示存在关联!
  • 若 \(\chi^2_{\text{calc}} < \text{临界值}\):不拒绝 \(H_0\)。没有足够的证据显示它们相关。

重点总结: 较大的 \(\chi^2\) 值意味着“我们看到的”与“我们预期的”之间的差异太大,不能单纯归咎于运气!


3. 卡方拟合优度检验(Goodness of Fit)

这项检验是一个“现实核查”。它询问的是:“这组数据是否真的遵循某个特定的分布(如均匀分布、二项分布或泊松分布)?”

假设

\(H_0\):数据符合 [模型名称]
\(H_1\):数据不符合 [模型名称]

“期望频数过小”规则

重要! 卡方检验只有在期望值 (\(E\)) 足够大时才准确。
规则: 如果任何 \(E < 5\),你必须将该格子与邻近的格子合并。合并后记得重新调整你的类别总数 (\(n\))!

计算拟合优度检验的自由度

这是学生最容易出错的地方!公式为:

\[df = n - 1 - k\]

  • \(n\) = 类别数量(合并单元格后)。
  • \(k\) = 为了建立模型,你必须从数据中计算出的参数(Parameters)数量。

关于 \(k\) 的记忆小撇步:

  • 如果模型是均匀分布(Uniform):通常 \(k = 0\)。
  • 如果你必须为泊松模型计算平均值(Mean):\(k = 1\)。
  • 如果你必须为二项模型计算概率(Probability, \(p\)):\(k = 1\)。

重点总结: 拟合优度检验告诉我们,我们的数学模型是否准确地反映了真实世界。


4. 常见错误避坑指南

  • 混淆 \(O\) 与 \(E\): 务必将观测频数用于 \(O\),将计算得出的概率/频数用于 \(E\)。
  • 忘记合并: 如果期望值小于 5,你必须在计算 \(\chi^2\) 之前合并单元格。
  • 错误的 \(df\): 仔细检查你是否估算了任何参数(如平均值)。如果有,记得从 \(df\) 中减去它们。
  • 使用百分比: 卡方检验必须使用计数/频数,绝对不要直接将百分比或概率代入 \(\chi^2\) 公式!

5. 考试实用技巧

你知道吗? 你不需要展示每一次重复的计算过程。阅卷人想看到的是你掌握了方法。只需列出一个计算期望值的例子和一个计算贡献值的例子,然后可以直接列出其余的结果或给出总和。

关于 P 值(p-value): 有时候计算机程序(或你的计算器)会给出一个 P 值而不是临界值。
经验法则: 如果 P 值 < 显著性水平(例如 0.05),则拒绝 \(H_0\)
记住这句口诀:“P 值若过低, \(H_0\) 就得弃!”(If the p is low, the \(H_0\) must go!)

如果觉得很复杂也别担心! 一旦你练习过几次列联表,整个过程是非常合乎逻辑的。记住四步骤:建立假设、求期望值、计算贡献总和,最后将其与“守门员”(临界值)进行比较。


总结检查清单

- 列联表(Contingency Table): 使用 \(df = (r-1)(c-1)\)。
- 拟合优度(Goodness of Fit): 使用 \(df = n - 1 - k\)。
- “5”的规则: 若 \(E < 5\),合并单元格。
- 统计量公式: \(\chi^2 = \sum \frac{(O-E)^2}{E}\)。
- 结论: 最终结论必须结合题目背景来撰写(例如:“有证据显示年龄与音乐选择之间存在关联”)。