歡迎來到無母數檢定(Non-parametric Tests)的世界!
在你的 H2 數學旅程中,你可能已經花了很多時間與「常態分佈」打交道。它是一條漂亮的鐘形曲線,但現實世界的數據並不總是那麼整齊!有時候,數據會出現偏態(skewed),或者我們的樣本數太小,導致無法確定其背後的母體分佈。
這就是無母數檢定(Non-parametric tests)派上用場的時候了。你可以把它們想像成統計學界的「全地形車」。雖然母數檢定(如 t-檢定)需要一條平坦的「柏油路」(常態分佈)才能順暢運作,但無母數檢定卻能應付「崎嶇地形」(任何形狀的數據)。在本章中,我們將學習如何在不假設數據遵循特定分佈的情況下進行假設檢定。
1. 理解無母數檢定
無母數檢定通常被稱為「無分佈」檢定(distribution-free tests),因為它們不依賴於數據來自特定機率分佈(如常態分佈)的假設。
無母數檢定的優點:
• 靈活性: 它們可以用於非常態分佈的數據。
• 簡單性: 它們通常基於數據的秩(ranks)或簡單的符號(+ 或 -),而不是平均值或變異數等複雜的母數。
• 穩健性: 它們較少受到極端值(outliers)的影響,因為它們關注的是數據的順序而非精確數值。
無母數檢定的缺點:
• 檢定力較低(Lower Power): 如果數據確實是常態分佈的,無母數檢定的「檢定力」會比母數檢定低。這意味著它們較難偵測出錯誤的虛無假設。
• 資訊量較少: 由於它們使用秩或符號,因此會「捨棄」了包含在原始數值中的部分特定資訊。
快速複習小盒子:
如果你確定數據符合常態分佈,請使用母數檢定(如 t-檢定)。
如果分佈未知或明顯不是常態分佈,請使用無母數檢定。
2. 符號檢定(The Sign Test)
符號檢定(Sign Test)是最簡單的無母數檢定。我們用它來檢定關於母體中位數(population median,記為 \( m \))的假設。它被稱為符號檢定,是因為我們只關心數據點是在假設中位數的上方(+)還是下方(-)。
設立假設
虛無假設 \( H_0 \):母體中位數等於特定值 \( m_0 \)。
\( H_0: m = m_0 \)
對立假設 \( H_1 \):
• \( H_1: m \neq m_0 \)(雙尾檢定)
• \( H_1: m > m_0 \)(右尾檢定)
• \( H_1: m < m_0 \)(左尾檢定)
檢定步驟(Step-by-Step)
1. 將樣本中的每個數據值與假設的中位數 \( m_0 \) 進行比較。
2. 如果數值大於 \( m_0 \),記錄一個加號(+)。
3. 如果數值小於 \( m_0 \),記錄一個減號(-)。
4. 如果數值剛好等於 \( m_0 \),我們忽略它,並相應地縮減樣本大小 \( n \)。
5. 令 \( X \) 為加號的數量。在 \( H_0 \) 成立下,每個數值位於中位數上方或下方的機率均等。因此,檢定統計量 \( X \) 遵循二項分佈(Binomial Distribution):
\( X \sim B(n, 0.5) \)
例子:假設你認為某咖啡店的中位數等待時間是 10 分鐘。你觀察了 10 位顧客,其中 8 人的等待時間超過 10 分鐘(+),2 人少於 10 分鐘(-)。由於 8 遠大於預期的 5,你可能會拒絕 \( H_0 \)。
如果一開始覺得困難,別擔心! 只要記住:我們只是在計算有多少人落在圍欄的哪一邊。如果圍欄真的是中位數,那應該會是一個 50/50 的比例。
3. Wilcoxon 配對樣本符號秩檢定(Wilcoxon Matched-Pair Signed Rank Test)
Wilcoxon 配對樣本符號秩檢定用於配對數據(例如對同一群人的「前後」測量)。它比符號檢定更強大,因為它同時考慮了差異的方向(+ 或 -)和幅度(大小)。
假設
對於此檢定,我們假設兩個母體的分佈形狀相同,僅在位置上有所偏移。這意味著差異的分佈是對稱的。
設立假設
\( H_0 \):兩種處理方式之間沒有差異(差異的母體中位數為零)。
\( H_1 \):存在差異(差異的母體中位數不為零)。
檢定步驟
1. 計算每對數據的差異 \( d_i \)(例如:後測減前測)。
2. 忽略任何差異為零的配對。
3. 取差異的絕對值 \( |d_i| \),並由小到大進行排序(秩)(1, 2, 3...)。
課程筆記:本課程將排除秩數相同(tied)的情況。
4. 將原始符號(+ 或 -)重新分配回每個秩。
5. 計算 \( T^+ \)(正秩和)與 \( T^- \)(負秩和)。
6. 檢定統計量 \( T \) 通常取 \( T^+ \) 和 \( T^- \) 中的較小值。將其與 Wilcoxon 臨界值表進行比較。
類比: 想像兩位運動員。符號檢定只問「誰贏得比較多場比賽?」,而 Wilcoxon 檢定則問「誰贏得比較多場比賽,且贏了多少距離?」。這使得它成為一個更精明的裁判!
重點總結: Wilcoxon 檢定使用差異的秩,而不僅僅是方向。這使它能夠比簡單的符號檢定捕捉到更多的資訊。
4. 選擇檢定方法的總結
選擇正確的檢定方法就等於成功了一半。以下是快速指南:
1. 檢定單一母體中位數?
使用符號檢定(Sign Test)。
2. 檢定配對樣本的差異?
使用Wilcoxon 配對樣本符號秩檢定。
3. 數據符合常態分佈且樣本數小?
使用 t-檢定(母數檢定 - 在 3.3 節介紹)。
4. 數據不符合常態分佈?
務必使用無母數選項(符號檢定或 Wilcoxon 檢定)。
你知道嗎? 無母數檢定廣泛應用於心理學和醫學領域,研究人員經常使用「李克特量表」(如 1 到 5 星評分)。由於 1 星與 2 星之間的「差距」可能與 4 星和 5 星之間的「差距」不完全相同,這些檢定非常適合用於分析此類數據!
成功檢查清單
• 務必使用中位數一詞清晰地陳述你的虛無假設 \( H_0 \) 和對立假設 \( H_1 \)。
• 對於符號檢定,識別你的 \( n \) 以及檢定統計量 \( X \sim B(n, 0.5) \)。
• 對於 Wilcoxon 檢定,記住先對絕對差異進行排序,再放回符號。
• 始終在問題的情境下做出結論(例如:「在 5% 的顯著水準下,有足夠證據顯示中位數體重已經增加」)。
避免常見錯誤: 別忘了在符號檢定和 Wilcoxon 檢定中捨棄「零差異」!如果一個數據點等於假設的中位數,或者某個配對沒有變化,這對我們判斷數據傾向哪一方沒有幫助,所以我們將其剔除並縮減 \( n \)。