簡介:眼見是否為實?
歡迎來到 \(\chi^2\)-檢定(讀作 "Kai-square",卡方檢定)的世界。你有沒有想過,一顆六面骰子是否真的公平?或者你最愛的糖果品牌,是否真的在每一包裡都放了相同數量的每一種顏色?在統計學中,我們不只是「猜」,我們是要進行「檢定」的!
\(\chi^2\)-檢定是一個強大的工具,能幫助我們判斷實驗中收集到的觀察值 (observed) 與我們預測的期望值 (expected) 是否足夠「接近」。這本質上就是一個「差異測量器」。如果差異過大,我們就會得出結論:這不只是隨機巧合,背後肯定有原因。
你知道嗎? \(\chi^2\)-檢定是由卡爾·皮爾遜 (Karl Pearson) 於 1900 年開發的。它是科學、醫學,甚至是市場營銷中最廣泛使用的統計檢定之一!
1. 核心公式:衡量差異
要進行此檢定,我們需要計算一個稱為檢定統計量 (test statistic) 的數值。別擔心這個公式看起來很嚇人,我們把它拆解開來!
\( \chi^2_{calc} = \sum \frac{(O_i - E_i)^2}{E_i} \)
讓我們看看這個公式的組成部分:
• \(O_i\) (觀察次數, Observed Frequency): 這是你收集到的實際數據(「現實」情況)。
• \(E_i\) (期望次數, Expected Frequency): 這是如果你的理論(虛無假設)成立,你預期會看到的數據。
• \(\sum\): 這代表將每一個類別或格子的結果「全部相加」。
類比: 想像你在烘焙餅乾。食譜上說它們應該都是 5cm 寬(期望值)。你測量後發現有些是 4cm,有些是 6cm(觀察值)。\(\chi^2\) 公式就是在計算你的餅乾與食譜要求的偏差程度!
重點總結: 如果觀察值與期望值非常接近,\((O - E)\) 就會很小,最終的 \(\chi^2\) 值也會很小。一個較小的 \(\chi^2\) 意味著數據與我們的理論非常吻合。
2. 適合度檢定 (Goodness-of-Fit Tests)
適合度檢定是用來檢查你的數據是否符合特定的機率分佈,例如均勻分佈 (Uniform)、二項分佈 (Binomial)、卜瓦松分佈 (Poisson) 或常態分佈 (Normal)。
設定基礎:假設
每個檢定都從兩個陳述開始:
• \(H_0\) (虛無假設, Null Hypothesis): 「沒什麼特別」的說法。(例如:「數據符合卜瓦松分佈」)。
• \(H_1\) (對立假設, Alternative Hypothesis): 「有什麼不同」的說法。(例如:「數據不符合卜瓦松分佈」)。
計算期望次數 (\(E\))
如何找到 \(E\) 取決於分佈類型:
• 均勻分佈: 將總次數除以類別總數。
• 二項/卜瓦松/常態分佈: 計算該類別的機率 \(P(X=x)\),再乘以總樣本數 (\(n\))。記住:\(E = n \times P\)。
「5 的規則」(非常重要!)
\(\chi^2\) 分佈只有在期望次數夠大時,才是一個好的近似值。
規則: 每一個期望次數 (\(E_i\)) 都必須至少為 5。
補救方法: 如果某個 \(E\) 值小於 5,你必須將該格與相鄰的格子合併 (pool)。合併格子時,也必須同時合併它們對應的 \(O\) 值。
快速回顧:
1. 計算所有格子的 \(E\)。
2. 檢查是否有任何 \(E < 5\)。
3. 必要時合併格子。
4. 之後才計算 \(\chi^2\) 統計量。
3. 自由度 (\(v\))
自由度 (Degrees of Freedom, \(v\)) 決定了我們使用哪一條 \(\chi^2\) 曲線來找臨界值。你可以把它想成數據中「靈活變動的空間」。
對於適合度檢定,公式為:
\( v = n - 1 - k \)
其中:
• \(n\): 格子的數量(合併後)。
• \(k\): 為計算期望次數,你從數據中估計的參數數量。
常見的 \(k\) 值:
• 均勻分佈: \(k = 0\)(無需參數)。
• 二項分佈: \(k = 1\)(如果你從數據中計算了 \(p\))。
• 卜瓦松分佈: \(k = 1\)(如果你從數據中計算了 \(\lambda\))。
• 常態分佈: \(k = 2\)(如果你從數據中計算了 \(\mu\) 和 \(\sigma^2\))。
重點總結: 永遠先減 1,再減去任何估計的參數。如果題目直接給了參數(例如:「檢定數據是否符合 \(\lambda = 3\) 的卜瓦松分佈」),那麼 \(k = 0\)!
4. 列聯表(獨立性檢定)
有時我們想知道兩個因素是否有關聯。例如:「髮色與瞳孔顏色是否獨立?」我們為此使用 \(r \times c\) 列聯表 (contingency table)。
計算表中的期望次數
對於表中的某個特定格子:
\( E = \frac{\text{列總計} \times \text{行總計}}{\text{總計}} \)
列聯表的自由度
這比較簡單,因為我們不用計算參數:
\( v = (r - 1)(c - 1) \)
其中 \(r\) 是列數,\(c\) 是行數。
獨立性檢定的步驟:
1. \(H_0\): 因素 A 與因素 B 是獨立的。
2. \(H_1\): 因素 A 與因素 B 不獨立(存在相關性)。
3. 為每個格子計算 \(E\)。
4. 檢查「5 的規則」(必要時合併列或行)。
5. 計算 \(\chi^2_{calc}\)。
6. 使用 \(v = (r-1)(c-1)\) 從表中對照臨界值。
5. 做出最終決定
一旦你得到了計算出的 \(\chi^2_{calc}\) 和表中的臨界值(通常會給出顯著性水準,如 \(5\%\) 或 \(1\%\)):
• 如果 \(\chi^2_{calc} > \text{臨界值}\):差異太大!拒絕 \(H_0\)。
• 如果 \(\chi^2_{calc} \leq \text{臨界值}\):差異小到可能是隨機誤差。接受 \(H_0\)(或稱「未能拒絕 \(H_0\)」)。
鼓勵的話: 將臨界值想像成「邊境管制」。如果你的計算值試圖越過邊境進入「拒絕區」,那是因為你的數據太反常,根本無法符合虛無假設!
6. 常見錯誤
• 忘記合併: 在做任何計算前,一定要檢查是否有 \(E < 5\)。這是最容易丟分的地方!
• 用 \(O\) 而不是 \(E\) 來檢查「5 的規則」: 只有期望次數需要考慮合併,觀察次數是多少都可以。
• 自由度錯誤: 對於適合度檢定,務必確認你是否從數據中估計了平均值或變異數。如果題目已經給你平均值,就不要再為 \(k\) 多減 1。
• 假設的措辭: 對於列聯表,請務必使用獨立 (independent) 或相關 (association)。避免使用「有關聯 (related)」,這對評分員來說太籠統了。
總結檢查清單
在完成任何 \(\chi^2\) 問題前,問自己:
1. 我的假設是否寫得清楚?(\(H_0\) 永遠是「符合」或「獨立」的敘述)。
2. 我計算了所有期望次數嗎?
3. 是否每個 \(E \geq 5\)?(如果沒有,我有合併嗎?)
4. 對於這個特定的檢定,我的 \(v\) (自由度) 正確嗎?
5. 我是否將 \(\chi^2_{calc}\) 與正確的臨界值進行了比較?
6. 我的結論是否結合了題目的具體情境?(例如:「有證據顯示髮色與瞳孔顏色並不獨立。」)