歡迎來到無母數檢定 (Non-Parametric Tests)!
在之前的統計學課程中,你可能使用過像 t 檢定這類假設數據遵循特定規律(通常是常態分佈)的檢定方法。但如果你的數據雜亂無章、呈偏態,或者你根本不知道它的分佈情況時該怎麼辦呢?這就是無母數檢定 (Non-Parametric Tests) 發揮作用的時候了!你可以把它們想像成假設檢定的「靈活版」。它們不在乎母體分佈的形狀,而是專注於數據的中位數 (median) 和排名 (ranks)。
快速回顧:在開始之前,請記住假設檢定總是從虛無假設 (\(H_0\)) 和對立假設 (\(H_1\)) 開始。在本章中,我們通常是在檢定母體中位數 (\(M\))。
1. 為何要採用無母數檢定?
無母數檢定通常被稱為無分佈檢定 (distribution-free tests)。當遇到以下情況時,你應該選擇使用它們:
- 樣本量非常小。
- 數據呈偏態(不對稱)。
- 數據為序位數據 (ordinal)(你可以將其排名,例如「第一、第二、第三」,但它們之間的間隔並不一定相等)。
- 你無法假設母體遵循常態分佈。
主要區別:參數檢定使用實際數值(算術平均數),而無母數檢定使用數值的排名(它們從小到大排列時的位置)。
重點總結:無母數檢定是統計學中的「叛逆者」——即使「常態分佈」的標準規則被打破,它們依然有效!
2. 單樣本符號檢定 (Single-Sample Sign Test)
這是最簡單的檢定。它只關心觀察值是高於 (+) 還是低於 (-) 假設的中位數。
運作步驟:
- 寫出 \(H_0\)(例如 \(M = 50\))和 \(H_1\)(例如 \(M > 50\))。
- 針對每個數據點,如果它大於假設的中位數,記錄為 +;如果較小,則記錄為 -。
- 忽略任何與假設中位數完全相等的數值。
- 設 \(X\) 為正號的數量(若為雙尾檢定,則取正號或負號中數量較少者)。
- 在 \(H_0\) 成立的前提下,正號的數量遵循二項分佈 (Binomial Distribution):\(X \sim B(n, 0.5)\),其中 \(n\) 是正號和負號的總數。
- 使用計算機計算機率(p值)並與顯著水準進行比較。
類比:想像一個以中位數為平衡點的蹺蹺板。如果真實的中位數是 50,你會預期坐在「較高」一側和「較低」一側的人數各佔一半。如果有遠多於一半的人坐在「較高」的一側,蹺蹺板就會傾斜,我們就會拒絕平衡點為 50 的假設!
3. 單樣本威爾卡森符號等級檢定 (Single-Sample Wilcoxon Signed-Rank Test)
符號檢定雖然簡單,但它丟棄了部分資訊(它不在乎數值到底「大了多少」)。威爾卡森符號等級檢定更強大,因為它考慮了差異的程度。
檢定流程:
- 計算每個觀察值與假設中位數之間的差值:\(d_i = x_i - M_0\)。
- 對這些差值進行排名,從小到大排列,暫時忽略正負號。(絕對值最小的差值獲得第 1 名)。
- 將原始差值的正負號加回每個排名中(例如,如果差值是 -2 且獲得了第 3 名,它就變成負向排名)。
- 計算正向排名的總和 (\(W_+\)) 和負向排名的總和 (\(W_-\))。
- 你的檢定統計量 \(T\) 通常取 \(W_+\) 和 \(W_-\) 中的較小值。
- 將 \(T\) 與威爾卡森單樣本表 (Wilcoxon Single-Sample table) 中的臨界值進行比較。
常見錯誤:別忘了忽略差值為零的情況!如果某個觀察值等於假設中位數,請剔除該數據並相應地減少 \(n\)。
重點總結:對於非常混亂的數據使用符號檢定,但如果你想要一個考慮到差異大小、更「敏感」的檢定,請使用威爾卡森符號等級檢定。
4. 比較兩個樣本:配對與非配對
在進行檢定之前,你必須決定你的數據集是「相關」的還是獨立的。
配對樣本 (Paired-Sample/Matched Pairs)
例子:測量 10 名學生運動前和運動後的脈搏。「前」和「後」的數據屬於同一個人。我們使用符號檢定或威爾卡森符號等級檢定來檢定差值(就像上面的單樣本檢定一樣,只是檢定中位數差值是否為 0)。
兩樣本 (Two-Sample/Unpaired)
例子:比較 10 名男生和 12 名女生的身高。這是兩組獨立的數據。我們使用威爾卡森秩和檢定 (Wilcoxon Rank-Sum Test)(也稱為曼-惠特尼 U 檢定 (Mann-Whitney U Test))。
5. 威爾卡森秩和檢定 (Mann-Whitney U)
此檢定用於判斷兩個獨立的母體是否相同。
運作步驟:
- 將兩個樣本合併成一個大小為 \(N = m + n\) 的大清單。
- 將所有數值從 1 到 \(N\) 進行排名。
- 計算樣本較小組的排名總和(設此總和為 \(R_m\))。
- 檢定統計量 \(W\) 就是該組的排名總和。
- 將 \(W\) 與威爾卡森秩和表 (Wilcoxon Rank-Sum tables) 進行比較。
你知道嗎?統計表通常提供較小樣本量 \(m\) 的臨界值。如果你的組別大小不同,請務必按照表格說明來選取正確的數值!
6. 大樣本的常態近似 (Normal Approximations)
當樣本量 \(n\) 變大(通常 \(n > 20\))時,威爾卡森表就不夠用了。幸運的是,檢定統計量開始遵循常態分佈!
對於威爾卡森符號等級檢定 (\(T\)):
平均數 \( \mu = \frac{1}{4}n(n+1) \)
變異數 \( \sigma^2 = \frac{1}{24}n(n+1)(2n+1) \)
\( T \sim N(\mu, \sigma^2) \)
對於威爾卡森秩和檢定 (\(W\)):
平均數 \( \mu = \frac{1}{2}m(m+n+1) \)
變異數 \( \sigma^2 = \frac{1}{12}mn(m+n+1) \)
\( W \sim N(\mu, \sigma^2) \)
別擔心,這看起來可能有點棘手!這些公式都會提供在你的公式手冊中。只需記住,在計算 z 分數時要使用 0.5 的連續性修正 (continuity correction),因為你正從離散的排名轉向連續的常態曲線。
快速回顧欄
我該用哪個檢定?
- 單樣本(中位數):符號檢定或威爾卡森符號等級檢定。
- 配對數據(前後對比):使用差值進行符號檢定或威爾卡森符號等級檢定。
- 兩組獨立數據:威爾卡森秩和檢定(曼-惠特尼 U 檢定)。
- 大樣本:使用常態近似公式。
記憶小撇步:Signed-Rank (符號等級) 用於 Same (相同) 的人(配對)。Rank-Sum (秩和) 用於 Separate (分開) 的組別。
總結清單
1. 排名:你排名正確嗎?絕對差值最小的 = 第 1 名。
2. 假設:你的假設是關於中位數 (\(M\)) 而不是算術平均數嗎?
3. 同分值:請記住,本課程的教學大綱排除了排名相同或觀察值與中位數重合的問題,這讓你的計算輕鬆不少!
4. 結論:務必將最終結論寫在題目語境中。「有足夠的證據顯示在 5% 顯著水準下,中位數分數有所增加。」