非參數檢定簡介
歡迎來到統計學 A Level 中最實用的章節之一!到目前為止,你可能已經花了很多時間處理常態分佈。雖然常態分佈非常好用,但它有嚴格的「規則」——它假設你的數據是完美對稱且呈鐘形分佈的。
但如果你的數據雜亂、偏態,或者包含極端的異常值時該怎麼辦呢?這就是非參數檢定 (non-parametric tests) 大顯身手的時候了。你可以把它們想像成統計學界的「越野登山車」。無論路面多麼崎嶇,或者數據分佈形狀多麼怪異,它們都能完成任務。在本章中,我們將專注於檢定母體的中位數 (median),而不是平均值。
快速回顧:請記住,中位數是指數據按順序排列後的中間值。它比平均值更具穩定性,因為它不會被極端異常值拉偏。
1. 何時該使用「非參數檢定」?
當標準檢定(如 z 檢定或 t 檢定)的假設條件無法滿足時,我們就會使用非參數檢定。
需要記住的關鍵差異:
- 參數檢定 (Parametric Tests): 假設數據遵循特定的分佈(通常是常態分佈)。它們檢定的是平均值 (\(\mu\))。
- 非參數檢定 (Non-Parametric Tests): 不假設特定的分佈形狀。它們檢定的是母體中位數。
你知道嗎? 非參數檢定通常被稱為「無分佈」檢定,因為它們不依賴數據去符合特定的曲線。
2. 符號檢定 (Sign Test)(單樣本與配對樣本)
符號檢定是最簡單的非參數檢定。它簡單到甚至不需要看具體的數值——它只關注數值是在特定點的「上方」還是「下方」。
檢定單一母體中位數
想像一家鞋廠聲稱其顧客的腳長中位數為 8 號。你懷疑實際情況更高。要檢定這一點,你不需要知道腳具體大了多少;你只需要計算有多少人的腳大於 8 號(標記為 +),有多少人小於 8 號(標記為 -)即可。
檢定配對數據
對於配對數據(例如同一組人的「前後」測量值),我們觀察兩個數值之間的差異。如果「後」的數值較高,我們標記為 (+)。如果較低,我們標記為 (-)。
步驟流程:
- 陳述你的虛無假設 (null hypothesis) \(H_0\):中位數 = 數值。
- 將每個數據點減去假設的中位數。
- 記錄結果的符號 (+ 或 -)。如果數值等於中位數(差異為零),則將其剔除並減少樣本量 \(n\)。
- 你的檢定統計量 \(X\) 是出現次數較少的符號的數量。
- 在 \(H_0\) 成立的情況下,正號的數量遵循二項分佈:\(X \sim B(n, 0.5)\)。
有效性條件: 符號檢定對母體分佈沒有任何假設。這使得它使用起來非常「安全」,但它的檢定力 (power) 比其他檢定低,因為它丟棄了大量資訊(即差異的具體大小)。
重點總結: 當你不確定數據的分佈形狀,只想看看是否有整體的「上升」或「下降」趨勢時,請使用符號檢定。
3. 威爾科克森符號等級檢定 (Wilcoxon Signed-Rank Test)
不用擔心這個名字聽起來很嚇人!威爾科克森符號等級檢定只是符號檢定的「智慧升級版」。符號檢定只關心差異的方向(+ 或 -),而威爾科克森檢定也關心差異的大小(即差距有多大)。
運作原理(等級排序技巧)
我們不只是看符號,而是先忽略正負號,將差異從最小到最大進行等級排序 (rank)。
步驟流程:
- 計算每個觀察值與假設中位數之間的差異。
- 剔除所有為零的差異。
- 對絕對差異進行排序(忽略符號)。最小的差異排名第 1,次小的排名第 2,以此類推。
- 如果出現數值相同 (tied values) 的情況,給予它們排名平均值(例如,如果第 3 和第 4 名相同,則它們都獲得 3.5 的排名)。
- 將原始的正負號 (+) 或 (-) 加回對應的排名。
- 計算 \(W_+\)(正排名的總和)和 \(W_-\)(負排名的總和)。
- 檢定統計量 \(T\) 通常是這兩個總和中較小的一個。將此值與公式手冊中的臨界值進行比較。
關鍵假設: 為了使威爾科克森符號等級檢定有效,我們必須假設母體分佈是對稱的(或者配對數據的差異分佈是對稱的)。
類比: 如果符號檢定是電燈開關(開/關),那麼威爾科克森符號等級檢定就是調光開關(它能告訴你光線有多亮!)。
重點總結: 威爾科克森符號等級檢定比符號檢定更有檢定力,但它要求數據必須對稱。
4. 威爾科克森等級和檢定 (Wilcoxon Rank-Sum Test)(兩個獨立樣本)
當你想比較兩個不同且獨立的群體(例如比較 A 校與 B 校學生的身高)時,會使用此檢定。它是獨立樣本 t 檢定的非參數替代方案。它也被稱為曼-惠特尼 U 檢定 (Mann-Whitney U test)。
步驟流程:
- 將兩個群體合併成一個大列表。
- 對整個合併列表中從小到大的所有數值進行排名。
- 對樣本較小的群體進行排名求和(我們稱此總和為 \(R_1\))。
- 使用手冊中提供的檢定統計量 \(W\) 公式,來看看兩個群體是否有顯著差異。
常見錯誤: 在對合併數據進行排名時,學生常會忘記追蹤該數據點屬於哪個群體。請使用不同顏色的筆或標籤(如 "A" 和 "B")來保持條理!
重點總結: 對於兩個不相關的群體,請使用等級和檢定來查看一個母體是否普遍具有比另一個更高的數值。
5. 選擇正確的檢定:快速指南
選擇正確的檢定是考試的重要部分。使用此清單來幫助你決定:
Q1:樣本是配對(相關)的還是獨立的?
- 獨立: 使用威爾科克森等級和 (Rank-Sum) 檢定。
- 配對或單一樣本: 前往 Q2。
Q2:分佈是對稱的嗎?
- 是: 使用威爾科克森符號等級 (Signed-Rank) 檢定(它的檢定力更強)。
- 否(或我們不知道): 使用符號檢定 (Sign Test)(這是最安全的做法)。
快速回顧箱:
- 符號檢定: 無假設,使用二項分佈 \(B(n, 0.5)\)。
- 威爾科克森符號等級: 需要對稱性,使用差異的排名。
- 威爾科克森等級和: 透過對合併數據進行排名來比較兩個獨立群體。
總結檢查清單
要精通本章,請確保你能:
- 解釋為何對於偏態數據,非參數檢定優於參數檢定。
- 利用二項分佈進行符號檢定。
- 正確地對數據進行排名,包括如何處理相同數值 (ties)。
- 清楚陳述每個檢定的假設條件(特別是威爾科克森檢定所需的對稱性)。
- 使用你的統計表來查找 \(W\) 和 \(T\) 的臨界值。
如果剛開始覺得排名過程很慢,別擔心!經過一點練習,這將成為你在 Paper 2 考試中取得分數的一種非常機械化且可靠的方法。