Chi-squared tests - Further Mathematics B (MEI) - H645 - Cambridge OCR A Level

簡介：歡迎來到卡方檢定（Chi-Squared Tests）的世界！

你有沒有好奇過，兩件事物之間是否存在真正的關聯，還是你所看到的規律純粹只是巧合？例如，你喜歡聽的音樂類型真的取決於你的年齡嗎？還是這只是隨機的？卡方檢定（Chi-squared (\(\chi^2\)) tests）就是能幫助我們以統計信心來回答這些問題的數學工具！

在本章中，我們將學習如何運用這些檢定來檢查類別之間的關聯性（Association），並驗證我們收集的數據是否符合特定的概率模型（Probability model）（例如你之前學過的二項分佈或卜瓦松分佈）。如果剛開始覺得這些概念有點深奧，別擔心——我們會把它們拆解成簡單且易於掌握的步驟。

1. 基礎概念：列聯表（Contingency Tables）

在進行任何檢定之前，我們需要先整理數據。當我們處理的是類別數據（Categorical data）（即符合「紅/藍」或「合格/不合格」這類分組的數據）時，我們會使用列聯表。

例子： 假設我們訪問了 100 名學生，詢問他們喜歡喝茶還是咖啡，同時記錄他們是中六還是中七的學生。列聯表將會清晰地顯示有多少名中六生喜歡喝茶、有多少名中七生喜歡喝咖啡，以此類推。

關鍵術語

觀測值（Observed Values, \(O\)）： 這是你在數據表中看到的實際數字。
期望值（Expected Values, \(E\)）： 這是如果類別之間完全沒有關聯時，我們所「預期」會看到的數字。

2. 卡方關聯性檢定（獨立性檢定）

這項檢定旨在檢查兩個因素是否為獨立（Independent）（即沒有關聯），還是它們之間存在關聯性（Association）。

步驟 1：建立假設（Hypotheses）

我們總是從「虛無假設」（Null Hypothesis, \(H_0\)）開始，它假設一個平淡無奇的選項——即沒有發生任何有趣的事情。

\(H_0\)：兩個因素之間沒有關聯（它們是獨立的）。
\(H_1\)：兩個因素之間存在關聯。

步驟 2：計算期望頻數（Expected Frequencies, \(E\)）

對於表格中的每個格子，如果 \(H_0\) 為真，我們使用以下公式來計算該格應該出現的數值：

\[E = \frac{\text{列總計} \times \text{行總計}}{\text{總計}}\]

步驟 3：求檢定統計量（Test Statistic, \(\chi^2_{\text{calc}}\)）

我們想知道觀測值與期望值之間的差異。我們使用以下公式：

\[\chi^2 = \sum \frac{(O - E)^2}{E}\]

小複習： 每一個 \(\frac{(O - E)^2}{E}\) 都被稱為一個貢獻值（Contribution）。將它們全部相加即得到最終的檢定統計量。如果觀測值與期望值非常接近，\(\chi^2\) 就會很小！

步驟 4：自由度（Degrees of Freedom, \(df\)）

要從統計表找到「臨界值（Critical Value）」，你需要自由度。對於一個有 \(r\) 行和 \(c\) 列的列聯表：

\[df = (r - 1)(c - 1)\]

步驟 5：做出決策

將你計算出的 \(\chi^2\) 值與公式手冊中的臨界值進行比較（使用你的 \(df\) 和顯著水準）：

若 \(\chi^2_{\text{calc}} > \text{臨界值}\)：拒絕 \(H_0\)。有證據顯示存在關聯！
若 \(\chi^2_{\text{calc}} < \text{臨界值}\)：不拒絕 \(H_0\)。沒有足夠的證據顯示它們相關。

重點總結： 較大的 \(\chi^2\) 值意味著「我們看到的」與「我們預期的」之間的差異太大，不能單純歸咎於運氣！

3. 卡方適合度檢定（Goodness of Fit）

這項檢定是一個「現實檢核」。它詢問的是：「這組數據是否真的遵循某個特定的分佈（如均勻分佈、二項分佈或卜瓦松分佈）？」

假設

\(H_0\)：數據符合 [模型名稱]。
\(H_1\)：數據不符合 [模型名稱]。

「期望頻數過小」規則

重要！ 卡方檢定只有在期望值 (\(E\)) 足夠大時才準確。
規則： 如果任何 \(E < 5\)，你必須將該格子與鄰近的格子合併。合併後記得重新調整你的類別總數 (\(n\))！

計算適合度檢定的自由度

這是學生最容易出錯的地方！公式為：

\[df = n - 1 - k\]

\(n\) = 類別數量（合併單元格後）。
\(k\) = 為了建立模型，你必須從數據中計算出的參數（Parameters）數量。

關於 \(k\) 的記憶小撇步：

如果模型是均勻分佈（Uniform）：通常 \(k = 0\)。
如果你必須為卜瓦松模型計算平均值（Mean）：\(k = 1\)。
如果你必須為二項模型計算概率（Probability, \(p\)）：\(k = 1\)。

重點總結： 適合度檢定告訴我們，我們的數學模型是否準確地反映了真實世界。

4. 常見錯誤避坑指南

混淆 \(O\) 與 \(E\)： 務必將觀測頻數用於 \(O\)，將計算得出的概率/頻數用於 \(E\)。
忘記合併： 如果期望值小於 5，你必須在計算 \(\chi^2\) 之前合併單元格。
錯誤的 \(df\)： 仔細檢查你是否估算了任何參數（如平均值）。如果有，記得從 \(df\) 中減去它們。
使用百分比： 卡方檢定必須使用計數/頻數，絕對不要直接將百分比或概率代入 \(\chi^2\) 公式！

5. 考試實用技巧

你知道嗎？ 你不需要展示每一次重複的計算過程。閱卷員想看到的是你掌握了方法。只需列出一個計算期望值的例子和一個計算貢獻值的例子，然後可以直接列出其餘的結果或給出總和。

關於 P 值（p-value）： 有時候電腦程式（或你的計算機）會給出一個 P 值而不是臨界值。
經驗法則： 如果 P 值 < 顯著水準（例如 0.05），則拒絕 \(H_0\)。
記住這句口訣：「P 值若過低， \(H_0\) 就得棄！」（If the p is low, the \(H_0\) must go!）

如果覺得很複雜也別擔心！ 一旦你練習過幾次列聯表，整個過程是非常合乎邏輯的。記住四步驟：建立假設、求期望值、計算貢獻總和，最後將其與「守門員」（臨界值）進行比較。

總結檢查清單

- 列聯表（Contingency Table）： 使用 \(df = (r-1)(c-1)\)。
- 適合度（Goodness of Fit）： 使用 \(df = n - 1 - k\)。
- 「5」的規則： 若 \(E < 5\)，合併單元格。
- 統計量公式： \(\chi^2 = \sum \frac{(O-E)^2}{E}\)。
- 結論： 最終結論必須結合題目背景來撰寫（例如：「有證據顯示年齡與音樂選擇之間存在關聯」）。

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。