χ2-test - Mathematics - Further (9231) - Cambridge International AS Level

簡介：眼見是否為實？

歡迎來到 \(\chi^2\)-檢定（讀作 "Kai-square"，卡方檢定）的世界。你有沒有想過，一顆六面骰子是否真的公平？或者你最愛的糖果品牌，是否真的在每一包裡都放了相同數量的每一種顏色？在統計學中，我們不只是「猜」，我們是要進行「檢定」的！

\(\chi^2\)-檢定是一個強大的工具，能幫助我們判斷實驗中收集到的觀察值 (observed) 與我們預測的期望值 (expected) 是否足夠「接近」。這本質上就是一個「差異測量器」。如果差異過大，我們就會得出結論：這不只是隨機巧合，背後肯定有原因。

你知道嗎？ \(\chi^2\)-檢定是由卡爾·皮爾遜 (Karl Pearson) 於 1900 年開發的。它是科學、醫學，甚至是市場營銷中最廣泛使用的統計檢定之一！

1. 核心公式：衡量差異

要進行此檢定，我們需要計算一個稱為檢定統計量 (test statistic) 的數值。別擔心這個公式看起來很嚇人，我們把它拆解開來！

\( \chi^2_{calc} = \sum \frac{(O_i - E_i)^2}{E_i} \)

讓我們看看這個公式的組成部分：
• \(O_i\) (觀察次數, Observed Frequency)： 這是你收集到的實際數據（「現實」情況）。
• \(E_i\) (期望次數, Expected Frequency)： 這是如果你的理論（虛無假設）成立，你預期會看到的數據。
• \(\sum\)： 這代表將每一個類別或格子的結果「全部相加」。

類比： 想像你在烘焙餅乾。食譜上說它們應該都是 5cm 寬（期望值）。你測量後發現有些是 4cm，有些是 6cm（觀察值）。\(\chi^2\) 公式就是在計算你的餅乾與食譜要求的偏差程度！

重點總結： 如果觀察值與期望值非常接近，\((O - E)\) 就會很小，最終的 \(\chi^2\) 值也會很小。一個較小的 \(\chi^2\) 意味著數據與我們的理論非常吻合。

2. 適合度檢定 (Goodness-of-Fit Tests)

適合度檢定是用來檢查你的數據是否符合特定的機率分佈，例如均勻分佈 (Uniform)、二項分佈 (Binomial)、卜瓦松分佈 (Poisson) 或常態分佈 (Normal)。

設定基礎：假設

每個檢定都從兩個陳述開始：
• \(H_0\) (虛無假設, Null Hypothesis)： 「沒什麼特別」的說法。（例如：「數據符合卜瓦松分佈」）。
• \(H_1\) (對立假設, Alternative Hypothesis)： 「有什麼不同」的說法。（例如：「數據不符合卜瓦松分佈」）。

計算期望次數 (\(E\))

如何找到 \(E\) 取決於分佈類型：
• 均勻分佈： 將總次數除以類別總數。
• 二項/卜瓦松/常態分佈： 計算該類別的機率 \(P(X=x)\)，再乘以總樣本數 (\(n\))。記住：\(E = n \times P\)。

「5 的規則」（非常重要！）

\(\chi^2\) 分佈只有在期望次數夠大時，才是一個好的近似值。
規則： 每一個期望次數 (\(E_i\)) 都必須至少為 5。
補救方法： 如果某個 \(E\) 值小於 5，你必須將該格與相鄰的格子合併 (pool)。合併格子時，也必須同時合併它們對應的 \(O\) 值。

快速回顧：
1. 計算所有格子的 \(E\)。
2. 檢查是否有任何 \(E < 5\)。
3. 必要時合併格子。
4. 之後才計算 \(\chi^2\) 統計量。

3. 自由度 (\(v\))

自由度 (Degrees of Freedom, \(v\)) 決定了我們使用哪一條 \(\chi^2\) 曲線來找臨界值。你可以把它想成數據中「靈活變動的空間」。

對於適合度檢定，公式為：
\( v = n - 1 - k \)

其中：
• \(n\)： 格子的數量（合併後）。
• \(k\)： 為計算期望次數，你從數據中估計的參數數量。

常見的 \(k\) 值：
• 均勻分佈： \(k = 0\)（無需參數）。
• 二項分佈： \(k = 1\)（如果你從數據中計算了 \(p\)）。
• 卜瓦松分佈： \(k = 1\)（如果你從數據中計算了 \(\lambda\)）。
• 常態分佈： \(k = 2\)（如果你從數據中計算了 \(\mu\) 和 \(\sigma^2\)）。

重點總結： 永遠先減 1，再減去任何估計的參數。如果題目直接給了參數（例如：「檢定數據是否符合 \(\lambda = 3\) 的卜瓦松分佈」），那麼 \(k = 0\)！

4. 列聯表（獨立性檢定）

有時我們想知道兩個因素是否有關聯。例如：「髮色與瞳孔顏色是否獨立？」我們為此使用 \(r \times c\) 列聯表 (contingency table)。

計算表中的期望次數

對於表中的某個特定格子：
\( E = \frac{\text{列總計} \times \text{行總計}}{\text{總計}} \)

列聯表的自由度

這比較簡單，因為我們不用計算參數：
\( v = (r - 1)(c - 1) \)

其中 \(r\) 是列數，\(c\) 是行數。

獨立性檢定的步驟：
1. \(H_0\)： 因素 A 與因素 B 是獨立的。
2. \(H_1\)： 因素 A 與因素 B 不獨立（存在相關性）。
3. 為每個格子計算 \(E\)。
4. 檢查「5 的規則」（必要時合併列或行）。
5. 計算 \(\chi^2_{calc}\)。
6. 使用 \(v = (r-1)(c-1)\) 從表中對照臨界值。

5. 做出最終決定

一旦你得到了計算出的 \(\chi^2_{calc}\) 和表中的臨界值（通常會給出顯著性水準，如 \(5\%\) 或 \(1\%\)）：

• 如果 \(\chi^2_{calc} > \text{臨界值}\)：差異太大！拒絕 \(H_0\)。
• 如果 \(\chi^2_{calc} \leq \text{臨界值}\)：差異小到可能是隨機誤差。接受 \(H_0\)（或稱「未能拒絕 \(H_0\)」）。

鼓勵的話： 將臨界值想像成「邊境管制」。如果你的計算值試圖越過邊境進入「拒絕區」，那是因為你的數據太反常，根本無法符合虛無假設！

6. 常見錯誤

• 忘記合併： 在做任何計算前，一定要檢查是否有 \(E < 5\)。這是最容易丟分的地方！
• 用 \(O\) 而不是 \(E\) 來檢查「5 的規則」： 只有期望次數需要考慮合併，觀察次數是多少都可以。
• 自由度錯誤： 對於適合度檢定，務必確認你是否從數據中估計了平均值或變異數。如果題目已經給你平均值，就不要再為 \(k\) 多減 1。
• 假設的措辭： 對於列聯表，請務必使用獨立 (independent) 或相關 (association)。避免使用「有關聯 (related)」，這對評分員來說太籠統了。

總結檢查清單

在完成任何 \(\chi^2\) 問題前，問自己：

1. 我的假設是否寫得清楚？(\(H_0\) 永遠是「符合」或「獨立」的敘述)。
2. 我計算了所有期望次數嗎？
3. 是否每個 \(E \geq 5\)？(如果沒有，我有合併嗎？)
4. 對於這個特定的檢定，我的 \(v\) (自由度) 正確嗎？
5. 我是否將 \(\chi^2_{calc}\) 與正確的臨界值進行了比較？
6. 我的結論是否結合了題目的具體情境？(例如：「有證據顯示髮色與瞳孔顏色並不獨立。」)

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。