歡迎來到「適合度檢定」(Goodness of Fit)的世界!

你有沒有想過一枚硬幣是否「真的」公平,或者一場足球賽中的入球數是否真的遵循某種可預測的規律?在本章中,我們將學習如何使用適合度檢定(Goodness of Fit test)來驗證真實世界的數據是否符合特定的數學模型。

如果剛開始覺得有點抽象,別擔心!這就像試穿一條新牛仔褲:「適合度檢定」只不過是告訴我們「牛仔褲」(我們的數學模型)與「人」(我們的實際數據)有多合身。如果不合身,我們就需要換一個模型!

1. 核心概念:卡方(\(\chi^2\))檢定

為了衡量「合身程度」,我們使用卡方(\(\chi^2\))檢定。這項檢定會將我們實際觀察到的數值(觀察頻數,\(O$)與假設模型正確時我們預期會看到的數值(期望頻數,\(E$)進行比較。

\n\n

檢定統計量公式

\n

我們使用以下公式來計算檢定統計量:

\n

\[ \chi^2 = \sum \frac{(O - E)^2}{E} \]

\n\n

公式拆解:
\n1. \(O - E\): 計算實際發生數與預期數之間的差異。
2. \((O - E)^2\): 將差異平方(這樣可以確保所有數值變為正數,避免正負抵消!)。
3. \(/ E\): 除以期望值,將差異進行標準化(scale)。
4. \(\sum\): 將所有類別的結果加總。

快速回顧:
如果總 \(\chi^2\) 值很,表示模型非常合適(牛仔褲很合身!)。
如果總 \(\chi^2\) 值很大,表示模型不合適(牛仔褲太緊或太鬆了!)。

2. 「黃金法則」:數據合併(Pooling)

要讓卡方檢定有效,你必須記住一條非常重要的規則:每一個期望頻數(\(E\))都必須至少為 5。

為什麼? 因為我們的公式需要除以 \(E\)。如果 \(E\) 非常小(例如 0.5),即使差異並不顯著,也會讓 \(\chi^2\) 值變得極大。這會導致檢定失效!

如果 \(E < 5\) 怎麼辦?

如果期望頻數小於 5,你必須將該類別與鄰近的類別進行合併(pool)。
例如:如果你正在觀察入球數(0, 1, 2, 3, 4+),而「4+ 球」的期望值只有 2,你就應該將「3 球」和「4+ 球」合併為一個「3 球或以上」的類別。

重點提示: 在開始計算前,務必先檢查你的 \(E\) 值。如果小於 5,請合併它們!

3. 自由度(Degrees of Freedom, \(v\))

在統計學中,「自由度」(以希臘字母 \(v\) 表示,讀作 'nu')告訴我們數據有多少「活動空間」。為了從公式手冊中找到臨界值(critical value),你必須正確計算出這個數值。

適合度檢定的一般公式為:
\(v = n - 1 - k\)

其中:
- \(n\): 類別數量(合併後的數量)。
- \(1\): 我們總是減去 1,因為總頻數是固定的。
- \(k\): 我們從樣本數據中估計出來以計算期望頻數的參數數量。

我應該減去多少參數(\(k\))?

這是學生最容易出錯的地方,以下是一份實用指南:

- 均勻/指定分佈(Uniform/Specified Distribution): \(k = 0\)(通常無需估計參數)。
- 二項分佈(Binomial, \(B(n, p)\)): \(k = 1\)(如果我們必須從數據中計算 \(p$)。
\n- 卜瓦松分佈(Poisson, \(Po(\lambda)\)): \(k = 1\)(如果我們必須從數據中計算平均值 \(\lambda$)。
\n- 指數分佈(Exponential, \(Exp(\lambda)\)): \(k = 1\)(如果我們必須從數據中計算 \(\lambda$)。
\n- 常態分佈(Normal, \(N(\mu, \sigma^2)\)): \(k = 2\)(如果我們必須從數據中計算平均值 \(\mu\) 和變異數 \(\sigma^2$)。\n

\n\n

你知道嗎? 如果題目直接給了你參數(例如:「檢定數據是否符合平均值為 3 的卜瓦松分佈」),那麼 \(k = 0$,因為你不需要自己進行估計!

\n\n

4. 逐步執行檢定

\n

遵循以下步驟,確保不會失分:

\n\n
    \n
  1. 陳述你的假設(Hypotheses):
    \n \(H_0\):該[分佈]與數據吻合。
    \(H_1\):該[分佈]與數據不吻合
  2. 計算期望頻數(\(E\)): 將總頻數乘以該分佈下每個類別發生的機率。
  3. 檢查是否需要合併: 如果任何 \(E < 5\),合併相關類別。
  4. 計算檢定統計量: 使用 \(\sum \frac{(O - E)^2}{E}\)。
  5. 決定自由度: \(v = n - 1 - k\)(記得 \(n\) 是合併後的組數)。
  6. 尋找臨界值: 使用 \(v\) 和顯著水準(通常為 5%)在 \(\chi^2\) 表中查詢。
  7. 做出決定:
    - 如果你計算出的 \(\chi^2\) 大於臨界值,拒絕 \(H_0\)
    - 如果你計算出的 \(\chi^2\) 小於臨界值,不拒絕 \(H_0\)
  8. 情境結論: 「有足夠/不足夠的證據顯示該[分佈]與數據吻合……」

5. 常見陷阱

- 忘記合併: 這是最常見的錯誤。務必先檢查 \(E\) 值!
- 分母使用 \(O\): 公式除以的是 \(E\),不是 \(O\)。記住:「\(O\) 減去 \(E\) 的平方,除以 \(E\)」。
- \(n\) 值錯誤: 計算自由度時,使用了合併前的類別數量,而非合併後的數量。
- 葉氏校正(Yates' Correction): 你可能會在舊教科書或其他課程中看到,但在 Pearson Edexcel 9ST0 課程中,不需要使用葉氏校正,請忽略它!

6. 參數(\(k\))摘要表

如果你不確定該使用什麼 \(k\),請參考此「快速回顧」框:

快速回顧:估計參數
1. 我是否從原始數據計算了平均值?(卜瓦松/指數/二項/常態) \( \rightarrow \) 減 1
2. 我是否從原始數據計算了標準差?(僅限常態分佈) \( \rightarrow \) 再減 1
3. 如果題目已經直接給我數值 \( \rightarrow \) 減 0

例如:你正在檢定 100 個觀測值是否符合卜瓦松分佈。你計算出樣本平均值為 2.4,並用它來計算期望值。你有 6 個類別,且不需要合併。
你的自由度將會是:\(v = 6 - 1 - 1 = 4\)。

最後鼓勵: 「適合度檢定」是一個結構非常明確的題目。一旦你掌握了標準程序,並記住合併數據的「5 之法則」,你會發現這些題目是 Paper 2 中拿分的好機會!