Goodness of fit

歡迎來到「適合度檢定」（Goodness of Fit）的世界！

你有沒有想過一枚硬幣是否「真的」公平，或者一場足球賽中的入球數是否真的遵循某種可預測的規律？在本章中，我們將學習如何使用適合度檢定（Goodness of Fit test）來驗證真實世界的數據是否符合特定的數學模型。

如果剛開始覺得有點抽象，別擔心！這就像試穿一條新牛仔褲：「適合度檢定」只不過是告訴我們「牛仔褲」（我們的數學模型）與「人」（我們的實際數據）有多合身。如果不合身，我們就需要換一個模型！

1. 核心概念：卡方（$\chi^2$）檢定

為了衡量「合身程度」，我們使用卡方（$\chi^2$）檢定。這項檢定會將我們實際觀察到的數值（觀察頻數，\(O$）與假設模型正確時我們預期會看到的數值（期望頻數，\(E$）進行比較。

\n\n

檢定統計量公式

我們使用以下公式來計算檢定統計量：

\[ \chi^2 = \sum \frac{(O - E)^2}{E} \]

\n\n

公式拆解：
\n1. $O - E$： 計算實際發生數與預期數之間的差異。
2. $(O - E)^2$： 將差異平方（這樣可以確保所有數值變為正數，避免正負抵消！）。
3. $/ E$： 除以期望值，將差異進行標準化（scale）。
4. $\sum$： 將所有類別的結果加總。

快速回顧：
如果總 $\chi^2$ 值很小，表示模型非常合適（牛仔褲很合身！）。
如果總 $\chi^2$ 值很大，表示模型不合適（牛仔褲太緊或太鬆了！）。

2. 「黃金法則」：數據合併（Pooling）

要讓卡方檢定有效，你必須記住一條非常重要的規則：每一個期望頻數（$E$）都必須至少為 5。

為什麼？ 因為我們的公式需要除以 $E$。如果 $E$ 非常小（例如 0.5），即使差異並不顯著，也會讓 $\chi^2$ 值變得極大。這會導致檢定失效！

如果 $E < 5$ 怎麼辦？

如果期望頻數小於 5，你必須將該類別與鄰近的類別進行合併（pool）。
例如：如果你正在觀察入球數（0, 1, 2, 3, 4+），而「4+ 球」的期望值只有 2，你就應該將「3 球」和「4+ 球」合併為一個「3 球或以上」的類別。

重點提示： 在開始計算前，務必先檢查你的 $E$ 值。如果小於 5，請合併它們！

3. 自由度（Degrees of Freedom, $v$）

在統計學中，「自由度」（以希臘字母 $v$ 表示，讀作 'nu'）告訴我們數據有多少「活動空間」。為了從公式手冊中找到臨界值（critical value），你必須正確計算出這個數值。

適合度檢定的一般公式為：
$v = n - 1 - k$

其中：
- $n$： 類別數量（合併後的數量）。
- $1$： 我們總是減去 1，因為總頻數是固定的。
- $k$： 我們從樣本數據中估計出來以計算期望頻數的參數數量。

我應該減去多少參數（$k$）？

這是學生最容易出錯的地方，以下是一份實用指南：

- 均勻/指定分佈（Uniform/Specified Distribution）： $k = 0$（通常無需估計參數）。
- 二項分佈（Binomial, $B(n, p)$）： $k = 1$（如果我們必須從數據中計算 $p$）。
\n- 卜瓦松分佈（Poisson, \(Po(\lambda)$）： $k = 1$（如果我們必須從數據中計算平均值 $\lambda$）。
\n- 指數分佈（Exponential, \(Exp(\lambda)$）： $k = 1$（如果我們必須從數據中計算 $\lambda$）。
\n- 常態分佈（Normal, \(N(\mu, \sigma^2)$）： $k = 2$（如果我們必須從數據中計算平均值 $\mu$ 和變異數 \(\sigma^2$）。\n

\n\n

你知道嗎？ 如果題目直接給了你參數（例如：「檢定數據是否符合平均值為 3 的卜瓦松分佈」），那麼 \(k = 0$，因為你不需要自己進行估計！

\n\n

4. 逐步執行檢定

遵循以下步驟，確保不會失分：

\n\n

陳述你的假設（Hypotheses）：
\n $H_0$：該[分佈]與數據吻合。
$H_1$：該[分佈]與數據不吻合。
計算期望頻數（$E$）： 將總頻數乘以該分佈下每個類別發生的機率。
檢查是否需要合併： 如果任何 $E < 5$，合併相關類別。
計算檢定統計量： 使用 $\sum \frac{(O - E)^2}{E}$。
決定自由度： $v = n - 1 - k$（記得 $n$ 是合併後的組數）。
尋找臨界值： 使用 $v$ 和顯著水準（通常為 5%）在 $\chi^2$ 表中查詢。
做出決定：
- 如果你計算出的 $\chi^2$ 大於臨界值，拒絕 $H_0$。
- 如果你計算出的 $\chi^2$ 小於臨界值，不拒絕 $H_0$。
情境結論： 「有足夠/不足夠的證據顯示該[分佈]與數據吻合……」

5. 常見陷阱

- 忘記合併： 這是最常見的錯誤。務必先檢查 $E$ 值！
- 分母使用 $O$： 公式除以的是 $E$，不是 $O$。記住：「$O$ 減去 $E$ 的平方，除以 $E$」。
- $n$ 值錯誤： 計算自由度時，使用了合併前的類別數量，而非合併後的數量。
- 葉氏校正（Yates' Correction）： 你可能會在舊教科書或其他課程中看到，但在 Pearson Edexcel 9ST0 課程中，不需要使用葉氏校正，請忽略它！

6. 參數（$k$）摘要表

如果你不確定該使用什麼 $k$，請參考此「快速回顧」框：

快速回顧：估計參數
1. 我是否從原始數據計算了平均值？（卜瓦松/指數/二項/常態） $ \rightarrow $ 減 1。
2. 我是否從原始數據計算了標準差？（僅限常態分佈） $ \rightarrow $ 再減 1。
3. 如果題目已經直接給我數值 $ \rightarrow $ 減 0。

例如：你正在檢定 100 個觀測值是否符合卜瓦松分佈。你計算出樣本平均值為 2.4，並用它來計算期望值。你有 6 個類別，且不需要合併。
你的自由度將會是：$v = 6 - 1 - 1 = 4$。

最後鼓勵： 「適合度檢定」是一個結構非常明確的題目。一旦你掌握了標準程序，並記住合併數據的「5 之法則」，你會發現這些題目是 Paper 2 中拿分的好機會！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。

歡迎來到「適合度檢定」（Goodness of Fit）的世界！

1. 核心概念：卡方（\(\chi^2\)）檢定

檢定統計量公式

2. 「黃金法則」：數據合併（Pooling）

如果 \(E < 5\) 怎麼辦？

3. 自由度（Degrees of Freedom, \(v\)）

我應該減去多少參數（\(k\)）？

4. 逐步執行檢定

5. 常見陷阱

6. 參數（\(k\)）摘要表

立即實踐所學