簡介:歡迎來到卡方檢定(Chi-Squared Tests)的世界!
你有沒有好奇過,兩件事物之間是否存在真正的關聯,還是你所看到的規律純粹只是巧合?例如,你喜歡聽的音樂類型真的取決於你的年齡嗎?還是這只是隨機的?卡方檢定(Chi-squared (\(\chi^2\)) tests)就是能幫助我們以統計信心來回答這些問題的數學工具!
在本章中,我們將學習如何運用這些檢定來檢查類別之間的關聯性(Association),並驗證我們收集的數據是否符合特定的概率模型(Probability model)(例如你之前學過的二項分佈或卜瓦松分佈)。如果剛開始覺得這些概念有點深奧,別擔心——我們會把它們拆解成簡單且易於掌握的步驟。
1. 基礎概念:列聯表(Contingency Tables)
在進行任何檢定之前,我們需要先整理數據。當我們處理的是類別數據(Categorical data)(即符合「紅/藍」或「合格/不合格」這類分組的數據)時,我們會使用列聯表。
例子: 假設我們訪問了 100 名學生,詢問他們喜歡喝茶還是咖啡,同時記錄他們是中六還是中七的學生。列聯表將會清晰地顯示有多少名中六生喜歡喝茶、有多少名中七生喜歡喝咖啡,以此類推。
關鍵術語
- 觀測值(Observed Values, \(O\)): 這是你在數據表中看到的實際數字。
- 期望值(Expected Values, \(E\)): 這是如果類別之間完全沒有關聯時,我們所「預期」會看到的數字。
2. 卡方關聯性檢定(獨立性檢定)
這項檢定旨在檢查兩個因素是否為獨立(Independent)(即沒有關聯),還是它們之間存在關聯性(Association)。
步驟 1:建立假設(Hypotheses)
我們總是從「虛無假設」(Null Hypothesis, \(H_0\))開始,它假設一個平淡無奇的選項——即沒有發生任何有趣的事情。
\(H_0\):兩個因素之間沒有關聯(它們是獨立的)。
\(H_1\):兩個因素之間存在關聯。
步驟 2:計算期望頻數(Expected Frequencies, \(E\))
對於表格中的每個格子,如果 \(H_0\) 為真,我們使用以下公式來計算該格應該出現的數值:
\[E = \frac{\text{列總計} \times \text{行總計}}{\text{總計}}\]
步驟 3:求檢定統計量(Test Statistic, \(\chi^2_{\text{calc}}\))
我們想知道觀測值與期望值之間的差異。我們使用以下公式:
\[\chi^2 = \sum \frac{(O - E)^2}{E}\]
小複習: 每一個 \(\frac{(O - E)^2}{E}\) 都被稱為一個貢獻值(Contribution)。將它們全部相加即得到最終的檢定統計量。如果觀測值與期望值非常接近,\(\chi^2\) 就會很小!
步驟 4:自由度(Degrees of Freedom, \(df\))
要從統計表找到「臨界值(Critical Value)」,你需要自由度。對於一個有 \(r\) 行和 \(c\) 列的列聯表:
\[df = (r - 1)(c - 1)\]
步驟 5:做出決策
將你計算出的 \(\chi^2\) 值與公式手冊中的臨界值進行比較(使用你的 \(df\) 和顯著水準):
- 若 \(\chi^2_{\text{calc}} > \text{臨界值}\):拒絕 \(H_0\)。有證據顯示存在關聯!
- 若 \(\chi^2_{\text{calc}} < \text{臨界值}\):不拒絕 \(H_0\)。沒有足夠的證據顯示它們相關。
重點總結: 較大的 \(\chi^2\) 值意味著「我們看到的」與「我們預期的」之間的差異太大,不能單純歸咎於運氣!
3. 卡方適合度檢定(Goodness of Fit)
這項檢定是一個「現實檢核」。它詢問的是:「這組數據是否真的遵循某個特定的分佈(如均勻分佈、二項分佈或卜瓦松分佈)?」
假設
\(H_0\):數據符合 [模型名稱]。
\(H_1\):數據不符合 [模型名稱]。
「期望頻數過小」規則
重要! 卡方檢定只有在期望值 (\(E\)) 足夠大時才準確。
規則: 如果任何 \(E < 5\),你必須將該格子與鄰近的格子合併。合併後記得重新調整你的類別總數 (\(n\))!
計算適合度檢定的自由度
這是學生最容易出錯的地方!公式為:
\[df = n - 1 - k\]
- \(n\) = 類別數量(合併單元格後)。
- \(k\) = 為了建立模型,你必須從數據中計算出的參數(Parameters)數量。
關於 \(k\) 的記憶小撇步:
- 如果模型是均勻分佈(Uniform):通常 \(k = 0\)。
- 如果你必須為卜瓦松模型計算平均值(Mean):\(k = 1\)。
- 如果你必須為二項模型計算概率(Probability, \(p\)):\(k = 1\)。
重點總結: 適合度檢定告訴我們,我們的數學模型是否準確地反映了真實世界。
4. 常見錯誤避坑指南
- 混淆 \(O\) 與 \(E\): 務必將觀測頻數用於 \(O\),將計算得出的概率/頻數用於 \(E\)。
- 忘記合併: 如果期望值小於 5,你必須在計算 \(\chi^2\) 之前合併單元格。
- 錯誤的 \(df\): 仔細檢查你是否估算了任何參數(如平均值)。如果有,記得從 \(df\) 中減去它們。
- 使用百分比: 卡方檢定必須使用計數/頻數,絕對不要直接將百分比或概率代入 \(\chi^2\) 公式!
5. 考試實用技巧
你知道嗎? 你不需要展示每一次重複的計算過程。閱卷員想看到的是你掌握了方法。只需列出一個計算期望值的例子和一個計算貢獻值的例子,然後可以直接列出其餘的結果或給出總和。
關於 P 值(p-value): 有時候電腦程式(或你的計算機)會給出一個 P 值而不是臨界值。
經驗法則: 如果 P 值 < 顯著水準(例如 0.05),則拒絕 \(H_0\)。
記住這句口訣:「P 值若過低, \(H_0\) 就得棄!」(If the p is low, the \(H_0\) must go!)
如果覺得很複雜也別擔心! 一旦你練習過幾次列聯表,整個過程是非常合乎邏輯的。記住四步驟:建立假設、求期望值、計算貢獻總和,最後將其與「守門員」(臨界值)進行比較。
總結檢查清單
- 列聯表(Contingency Table): 使用 \(df = (r-1)(c-1)\)。
- 適合度(Goodness of Fit): 使用 \(df = n - 1 - k\)。
- 「5」的規則: 若 \(E < 5\),合併單元格。
- 統計量公式: \(\chi^2 = \sum \frac{(O-E)^2}{E}\)。
- 結論: 最終結論必須結合題目背景來撰寫(例如:「有證據顯示年齡與音樂選擇之間存在關聯」)。