歡迎來到卡方檢定 (Chi-Squared Tests)!

在本章中,我們將探討一種強大的統計工具:卡方 (\(\chi^2\)) 檢定。你有沒有想過六面骰子是否公平?或者足球比賽中的入球數是否遵循某種特定模式?這正是這些檢定能幫我們解決的問題!我們使用它們來查看我們收集的「觀察」數據是否符合數學模型所預期的「期望」數據。

如果起初覺得這些概念有點抽象,請不用擔心。讀完這些筆記後,你將能夠判斷一組數據是否「符合」模型,或者兩個因素之間是否獨立。

1. 基礎概念:觀察值與期望值

每一次卡方檢定都圍繞著比較兩組數據:

  1. 觀察頻數 (\(O_i\)): 你從實驗中實際數出來或收集到的數據。
  2. 期望頻數 (\(E_i\)): 如果你的理論(即虛無假設)完全正確,你「應該」得到的數字。

卡方統計量

我們計算一個單一數值來衡量觀察值與期望值之間的「差距」。公式如下:

\(\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}\)

可以這樣想: 如果觀察值與期望值非常接近,\((O - E)\) 就會很小,我們的 \(\chi^2\) 值也會很小。如果它們差異很大,\(\chi^2\) 值就會很大,這暗示我們的理論可能是錯的!

關鍵法則:「5 的法則」(Rule of 5)

為了確保卡方檢定的準確性,每一個儲存格的期望頻數 (\(E_i\)) 必須至少為 5
常見錯誤: 學生經常去檢查觀察頻數。千萬不要這樣做!請務必檢查期望值。
如果小於 5 怎麼辦? 你必須合併相鄰的儲存格,直到合併後的期望頻數達到 5 或以上。當你合併儲存格時,請記得你的類別數量 (\(n\)) 會隨之減少!

重點總結: 大的 \(\chi^2\) = 理論與現實之間存在巨大差異。請務必確保 \(E_i \ge 5\)。

2. 適配度檢定 (Goodness of Fit Tests)

適配度檢定用於檢查數據是否符合特定的機率分佈。在 Edexcel FM1 課程中,你需要知道如何對以下分佈進行檢定:

  • 離散均勻分佈 (Discrete Uniform): 每個結果發生的機率都相等(例如公平的骰子)。
  • 二項分佈 (Binomial distribution): 在固定次數的試驗中,成功/失敗的次數。
  • 卜瓦松分佈 (Poisson distribution): 事件以恆定速率發生(例如放射性衰變)。
  • 幾何分佈 (Geometric distribution): 直到第一次成功所需的試驗次數。

檢定步驟

1. 建立假設:
\(H_0\):數據可以用 [分佈名稱] 進行建模。
\(H_1\):數據不可以用 [分佈名稱] 進行建模。

2. 計算期望頻數:
\(E_i = \text{該類別的機率} \times \text{總頻數}\)

3. 檢查「5 的法則」: 必要時合併儲存格。

4. 計算 \(\chi^2\): 使用公式或計算機的列表功能。

自由度 (\(v\))

這是適配度檢定中最棘手的部分!公式如下:

\(v = n - 1 - k\)

其中:
- \(n\) 是儲存格的數量(合併後)。
- \(1\) 是因為總頻數是固定的,所以必須減去 1。
- \(k\) 是你在計算期望值時,必須從數據中估計的參數數量

什麼時候 \(k > 0\)?
  • 卜瓦松分佈: 如果你需要從表格中計算平均值 (\(\lambda\)),則 \(k = 1\)。如果題目直接給出 \(\lambda\),則 \(k = 0\)。
  • 二項分佈: 如果你需要從表格中計算機率 \(p\),則 \(k = 1\)。
  • 均勻分佈: 通常 \(k = 0\),因為沒有參數需要估計。

你知道嗎? 「自由度」就像有人告訴你選 5 個數字,總和必須等於 20。你可以自由選擇前 4 個數字,但第 5 個數字必須是固定的,才能湊成總和。這就是為什麼我們通常要減去 1!

快速回顧: \(v = \text{儲存格數} - 1 - \text{估計參數數}\)。請仔細閱讀題目,確認參數是「給定的」還是「計算出來的」。

3. 列聯表 (Contingency Tables,獨立性檢定)

當我們有兩個不同因素(例如性別與科目選擇)並想了解它們是否獨立(無關聯)時,我們就會使用列聯表。

檢定步驟

\(H_0\):[因素 1] 與 [因素 2] 是獨立的
\(H_1\):[因素 1] 與 [因素 2] 不是獨立的(存在關聯)。

計算期望頻數

對於表中的每個儲存格,期望頻數為:
\(E_i = \frac{\text{行總計} \times \text{列總計}}{\text{總計}}\)

列聯表的自由度

這比適配度檢定簡單得多!
\(v = (r - 1) \times (c - 1\))
其中 \(r\) 是列數,\(c\) 是行數。這裡你不需要擔心 \(k\)!

記憶小撇步: 對於列聯表,請記住「RC」(行/列)。自由度只是「減少後」的行數與列數的乘積。

重點總結: 列聯表用於測試兩個變數是否相關。計算期望值時,請使用「行 \(\times\) 列 / 總計」規則。

4. 結束檢定

一旦你計算出 \(\chi^2\) 和自由度 (\(v\)),有兩種方法可以完成檢定:

  1. 臨界值法: 使用 \(v\) 和顯著水準 (\(\alpha\)) 在統計表中查出臨界值。如果計算出的 \(\chi^2\) > 臨界值,則拒絕 \(H_0\)
  2. P 值法: 大多數現代計算機會直接給你 P 值。如果 P 值 < 顯著水準,則拒絕 \(H_0\)

撰寫結論

結論務必包含以下兩部分:

  1. 統計結果: 「拒絕 \(H_0\)」或「未能拒絕 \(H_0\)」。
  2. 情境結果: 「在 5% 的顯著水準下,有足夠的證據表明這顆骰子有偏差」或「沒有足夠的證據表明性別與科目選擇之間存在關聯」。

鼓勵一下: 假設檢定的結論有時看起來很冗長,但如果你每次都遵循這個「結果 + 情境」的模板,就能輕鬆拿到滿分!

檢查清單

  • 這是適配度檢定還是列聯表
  • 我的假設清晰且包含情境了嗎?
  • 所有的期望頻數都 \(\ge 5\) 嗎?(如果不夠,請合併!)
  • 我正確計算了自由度嗎?(注意估計參數的數量!)
  • 我的結論是否同時具備統計結果情境描述

祝你練習順利!做的 \(\chi^2\) 檢定越多,這個過程就會變得越直觀。