Non-parametric tests - Further Mathematics A - H245 - Cambridge OCR A Level

歡迎來到無母數檢定 (Non-Parametric Tests)！

在之前的統計學課程中，你可能使用過像 t 檢定這類假設數據遵循特定規律（通常是常態分佈）的檢定方法。但如果你的數據雜亂無章、呈偏態，或者你根本不知道它的分佈情況時該怎麼辦呢？這就是無母數檢定 (Non-Parametric Tests) 發揮作用的時候了！你可以把它們想像成假設檢定的「靈活版」。它們不在乎母體分佈的形狀，而是專注於數據的中位數 (median) 和排名 (ranks)。

快速回顧：在開始之前，請記住假設檢定總是從虛無假設 (\(H_0\)) 和對立假設 (\(H_1\)) 開始。在本章中，我們通常是在檢定母體中位數 (\(M\))。

1. 為何要採用無母數檢定？

無母數檢定通常被稱為無分佈檢定 (distribution-free tests)。當遇到以下情況時，你應該選擇使用它們：

樣本量非常小。
數據呈偏態（不對稱）。
數據為序位數據 (ordinal)（你可以將其排名，例如「第一、第二、第三」，但它們之間的間隔並不一定相等）。
你無法假設母體遵循常態分佈。

主要區別：參數檢定使用實際數值（算術平均數），而無母數檢定使用數值的排名（它們從小到大排列時的位置）。

重點總結：無母數檢定是統計學中的「叛逆者」——即使「常態分佈」的標準規則被打破，它們依然有效！

2. 單樣本符號檢定 (Single-Sample Sign Test)

這是最簡單的檢定。它只關心觀察值是高於 (+) 還是低於 (-) 假設的中位數。

運作步驟：

寫出 \(H_0\)（例如 \(M = 50\)）和 \(H_1\)（例如 \(M > 50\)）。
針對每個數據點，如果它大於假設的中位數，記錄為 +；如果較小，則記錄為 -。
忽略任何與假設中位數完全相等的數值。
設 \(X\) 為正號的數量（若為雙尾檢定，則取正號或負號中數量較少者）。
在 \(H_0\) 成立的前提下，正號的數量遵循二項分佈 (Binomial Distribution)：\(X \sim B(n, 0.5)\)，其中 \(n\) 是正號和負號的總數。
使用計算機計算機率（p值）並與顯著水準進行比較。

類比：想像一個以中位數為平衡點的蹺蹺板。如果真實的中位數是 50，你會預期坐在「較高」一側和「較低」一側的人數各佔一半。如果有遠多於一半的人坐在「較高」的一側，蹺蹺板就會傾斜，我們就會拒絕平衡點為 50 的假設！

3. 單樣本威爾卡森符號等級檢定 (Single-Sample Wilcoxon Signed-Rank Test)

符號檢定雖然簡單，但它丟棄了部分資訊（它不在乎數值到底「大了多少」）。威爾卡森符號等級檢定更強大，因為它考慮了差異的程度。

檢定流程：

計算每個觀察值與假設中位數之間的差值：\(d_i = x_i - M_0\)。
對這些差值進行排名，從小到大排列，暫時忽略正負號。（絕對值最小的差值獲得第 1 名）。
將原始差值的正負號加回每個排名中（例如，如果差值是 -2 且獲得了第 3 名，它就變成負向排名）。
計算正向排名的總和 (\(W_+\)) 和負向排名的總和 (\(W_-\))。
你的檢定統計量 \(T\) 通常取 \(W_+\) 和 \(W_-\) 中的較小值。
將 \(T\) 與威爾卡森單樣本表 (Wilcoxon Single-Sample table) 中的臨界值進行比較。

常見錯誤：別忘了忽略差值為零的情況！如果某個觀察值等於假設中位數，請剔除該數據並相應地減少 \(n\)。

重點總結：對於非常混亂的數據使用符號檢定，但如果你想要一個考慮到差異大小、更「敏感」的檢定，請使用威爾卡森符號等級檢定。

4. 比較兩個樣本：配對與非配對

在進行檢定之前，你必須決定你的數據集是「相關」的還是獨立的。

配對樣本 (Paired-Sample/Matched Pairs)

例子：測量 10 名學生運動前和運動後的脈搏。「前」和「後」的數據屬於同一個人。我們使用符號檢定或威爾卡森符號等級檢定來檢定差值（就像上面的單樣本檢定一樣，只是檢定中位數差值是否為 0）。

兩樣本 (Two-Sample/Unpaired)

例子：比較 10 名男生和 12 名女生的身高。這是兩組獨立的數據。我們使用威爾卡森秩和檢定 (Wilcoxon Rank-Sum Test)（也稱為曼-惠特尼 U 檢定 (Mann-Whitney U Test)）。

5. 威爾卡森秩和檢定 (Mann-Whitney U)

此檢定用於判斷兩個獨立的母體是否相同。

運作步驟：

將兩個樣本合併成一個大小為 \(N = m + n\) 的大清單。
將所有數值從 1 到 \(N\) 進行排名。
計算樣本較小組的排名總和（設此總和為 \(R_m\)）。
檢定統計量 \(W\) 就是該組的排名總和。
將 \(W\) 與威爾卡森秩和表 (Wilcoxon Rank-Sum tables) 進行比較。

你知道嗎？統計表通常提供較小樣本量 \(m\) 的臨界值。如果你的組別大小不同，請務必按照表格說明來選取正確的數值！

6. 大樣本的常態近似 (Normal Approximations)

當樣本量 \(n\) 變大（通常 \(n > 20\)）時，威爾卡森表就不夠用了。幸運的是，檢定統計量開始遵循常態分佈！

對於威爾卡森符號等級檢定 (\(T\))：

平均數 \( \mu = \frac{1}{4}n(n+1) \)
變異數 \( \sigma^2 = \frac{1}{24}n(n+1)(2n+1) \)
\( T \sim N(\mu, \sigma^2) \)

對於威爾卡森秩和檢定 (\(W\))：

平均數 \( \mu = \frac{1}{2}m(m+n+1) \)
變異數 \( \sigma^2 = \frac{1}{12}mn(m+n+1) \)
\( W \sim N(\mu, \sigma^2) \)

別擔心，這看起來可能有點棘手！這些公式都會提供在你的公式手冊中。只需記住，在計算 z 分數時要使用 0.5 的連續性修正 (continuity correction)，因為你正從離散的排名轉向連續的常態曲線。

快速回顧欄

我該用哪個檢定？

單樣本（中位數）：符號檢定或威爾卡森符號等級檢定。
配對數據（前後對比）：使用差值進行符號檢定或威爾卡森符號等級檢定。
兩組獨立數據：威爾卡森秩和檢定（曼-惠特尼 U 檢定）。
大樣本：使用常態近似公式。

記憶小撇步：Signed-Rank (符號等級) 用於 Same (相同) 的人（配對）。Rank-Sum (秩和) 用於 Separate (分開) 的組別。

總結清單

1. 排名：你排名正確嗎？絕對差值最小的 = 第 1 名。
2. 假設：你的假設是關於中位數 (\(M\)) 而不是算術平均數嗎？
3. 同分值：請記住，本課程的教學大綱排除了排名相同或觀察值與中位數重合的問題，這讓你的計算輕鬆不少！
4. 結論：務必將最終結論寫在題目語境中。「有足夠的證據顯示在 5% 顯著水準下，中位數分數有所增加。」

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。

歡迎來到無母數檢定 (Non-Parametric Tests)！

1. 為何要採用無母數檢定？

2. 單樣本符號檢定 (Single-Sample Sign Test)

運作步驟：

3. 單樣本威爾卡森符號等級檢定 (Single-Sample Wilcoxon Signed-Rank Test)

檢定流程：

4. 比較兩個樣本：配對與非配對

配對樣本 (Paired-Sample/Matched Pairs)

兩樣本 (Two-Sample/Unpaired)

5. 威爾卡森秩和檢定 (Mann-Whitney U)

運作步驟：

6. 大樣本的常態近似 (Normal Approximations)

對於威爾卡森符號等級檢定 (\(T\))：

對於威爾卡森秩和檢定 (\(W\))：

快速回顧欄

總結清單

立即實踐所學