χ2-test - Mathematics - Further (9231) - Cambridge International AS Level

简介：眼见是否为实？

欢迎来到 \(\chi^2\)-检验（读作 "Kai-square"，卡方检验）的世界。你有没有想过，一颗六面骰子是否真的公平？或者你最爱的糖果品牌，是否真的在每一包里都放了相同数量的每一种颜色？在统计学中，我们不只是“猜”，我们是要进行“检验”的！

\(\chi^2\)-检验是一个强大的工具，能帮助我们判断实验中收集到的观察值 (observed) 与我们预测的期望值 (expected) 是否足够“接近”。这本质上就是一个“差异测量器”。如果差异过大，我们就会得出结论：这不只是随机巧合，背后肯定有原因。

你知道吗？ \(\chi^2\)-检验是由卡尔·皮尔逊 (Karl Pearson) 于 1900 年开发的。它是科学、医学，甚至是市场营销中最广泛使用的统计检验之一！

1. 核心公式：衡量差异

要进行此检验，我们需要计算一个称为检验统计量 (test statistic) 的数值。别担心这个公式看起来很吓人，我们把它拆解开来！

\( \chi^2_{calc} = \sum \frac{(O_i - E_i)^2}{E_i} \)

让我们看看这个公式的组成部分：
• \(O_i\) (观察次数, Observed Frequency)： 这是你收集到的实际数据（“现实”情况）。
• \(E_i\) (期望次数, Expected Frequency)： 这是如果你的理论（零假设）成立，你预期会看到的数据。
• \(\sum\)： 这代表将每一个类别或格子的结果“全部相加”。

类比： 想象你在烘焙饼干。食谱上说它们应该都是 5cm 宽（期望值）。你测量后发现有些是 4cm，有些是 6cm（观察值）。\(\chi^2\) 公式就是在计算你的饼干与食谱要求的偏差程度！

重点总结： 如果观察值与期望值非常接近，\((O - E)\) 就会很小，最终的 \(\chi^2\) 值也会很小。一个较小的 \(\chi^2\) 意味着数据与我们的理论非常吻合。

2. 适合度检验 (Goodness-of-Fit Tests)

适合度检验是用来检查你的数据是否符合特定的概率分布，例如均匀分布 (Uniform)、二项分布 (Binomial)、泊松分布 (Poisson) 或正态分布 (Normal)。

设定基础：假设

每个检验都从两个陈述开始：
• \(H_0\) (零假设, Null Hypothesis)： “没什么特别”的说法。（例如：“数据符合泊松分布”）。
• \(H_1\) (备择假设, Alternative Hypothesis)： “有什么不同”的说法。（例如：“数据不符合泊松分布”）。

计算期望次数 (\(E\))

如何找到 \(E\) 取决于分布类型：
• 均匀分布： 将总次数除以类别总数。
• 二项/泊松/正态分布： 计算该类别的概率 \(P(X=x)\)，再乘以总样本数 (\(n\))。记住：\(E = n \times P\)。

“5 的规则”（非常重要！）

\(\chi^2\) 分布只有在期望次数够大时，才是一个好的近似值。
规则： 每一个期望次数 (\(E_i\)) 都必须至少为 5。
补救方法： 如果某个 \(E\) 值小于 5，你必须将该格与相邻的格子合并 (pool)。合并格子时，也必须同时合并它们对应的 \(O\) 值。

快速回顾：
1. 计算所有格子的 \(E\)。
2. 检查是否有任何 \(E < 5\)。
3. 必要时合并格子。
4. 之后才计算 \(\chi^2\) 统计量。

3. 自由度 (\(v\))

自由度 (Degrees of Freedom, \(v\)) 决定了我们使用哪一条 \(\chi^2\) 曲线来找临界值。你可以把它想成数据中“灵活变动的空间”。

对于适合度检验，公式为：
\( v = n - 1 - k \)

其中：
• \(n\)： 格子的数量（合并后）。
• \(k\)： 为计算期望次数，你从数据中估计的参数数量。

常见的 \(k\) 值：
• 均匀分布： \(k = 0\)（无需参数）。
• 二项分布： \(k = 1\)（如果你从数据中计算了 \(p\)）。
• 泊松分布： \(k = 1\)（如果你从数据中计算了 \(\lambda\)）。
• 正态分布： \(k = 2\)（如果你从数据中计算了 \(\mu\) 和 \(\sigma^2\)）。

重点总结： 永远先减 1，再减去任何估计的参数。如果题目直接给了参数（例如：“检验数据是否符合 \(\lambda = 3\) 的泊松分布”），那么 \(k = 0\)！

4. 列联表（独立性检验）

有时我们想知道两个因素是否有关联。例如：“发色与瞳孔颜色是否独立？”我们为此使用 \(r \times c\) 列联表 (contingency table)。

计算表中的期望次数

对于表中的某个特定格子：
\( E = \frac{\text{列总计} \times \text{行总计}}{\text{总计}} \)

列联表的自由度

这比较简单，因为我们不用计算参数：
\( v = (r - 1)(c - 1) \)

其中 \(r\) 是列数，\(c\) 是行数。

独立性检验的步骤：
1. \(H_0\)： 因素 A 与因素 B 是独立的。
2. \(H_1\)： 因素 A 与因素 B 不独立（存在相关性）。
3. 为每个格子计算 \(E\)。
4. 检查“5 的规则”（必要时合并列或行）。
5. 计算 \(\chi^2_{calc}\)。
6. 使用 \(v = (r-1)(c-1)\) 从表中对照临界值。

5. 做出最终决定

一旦你得到了计算出的 \(\chi^2_{calc}\) 和表中的临界值（通常会给出显著性水平，如 \(5\%\) 或 \(1\%\)）：

• 如果 \(\chi^2_{calc} > \text{临界值}\)：差异太大！拒绝 \(H_0\)。
• 如果 \(\chi^2_{calc} \leq \text{临界值}\)：差异小到可能是随机误差。接受 \(H_0\)（或称“未能拒绝 \(H_0\)”）。

鼓励的话： 将临界值想象成“边境管制”。如果你的计算值试图越过边境进入“拒绝区”，那是因为你的数据太反常，根本无法符合零假设！

6. 常见错误

• 忘记合并： 在做任何计算前，一定要检查是否有 \(E < 5\)。这是最容易丢分的地方！
• 用 \(O\) 而不是 \(E\) 来检查“5 的规则”： 只有期望次数需要考虑合并，观察次数是多少都可以。
• 自由度错误： 对于适合度检验，务必确认你是否从数据中估计了平均值或方差。如果题目已经给你平均值，就不要再为 \(k\) 多减 1。
• 假设的措辞： 对于列联表，请务必使用独立 (independent) 或相关 (association)。避免使用“有关联 (related)”，这对评分员来说太笼统了。

总结检查清单

在完成任何 \(\chi^2\) 问题前，问自己：

1. 我的假设是否写得清楚？(\(H_0\) 永远是“符合”或“独立”的叙述)。
2. 我计算了所有期望次数吗？
3. 是否每个 \(E \geq 5\)？(如果没有，我有合并吗？)
4. 对于这个特定的检验，我的 \(v\) (自由度) 正确吗？
5. 我是否将 \(\chi^2_{calc}\) 与正确的临界值进行了比较？
6. 我的结论是否结合了题目的具体情境？(例如：“有证据显示发色与瞳孔颜色并不独立。”)

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。