Non-parametric tests - Further Mathematics (9649) - GCE A-Level - Higher 2 (H2)

歡迎來到無母數檢定（Non-parametric Tests）的世界！

在你的 H2 數學旅程中，你可能已經花了很多時間與「常態分佈」打交道。它是一條漂亮的鐘形曲線，但現實世界的數據並不總是那麼整齊！有時候，數據會出現偏態（skewed），或者我們的樣本數太小，導致無法確定其背後的母體分佈。

這就是無母數檢定（Non-parametric tests）派上用場的時候了。你可以把它們想像成統計學界的「全地形車」。雖然母數檢定（如 t-檢定）需要一條平坦的「柏油路」（常態分佈）才能順暢運作，但無母數檢定卻能應付「崎嶇地形」（任何形狀的數據）。在本章中，我們將學習如何在不假設數據遵循特定分佈的情況下進行假設檢定。

1. 理解無母數檢定

無母數檢定通常被稱為「無分佈」檢定（distribution-free tests），因為它們不依賴於數據來自特定機率分佈（如常態分佈）的假設。

無母數檢定的優點：

• 靈活性： 它們可以用於非常態分佈的數據。
• 簡單性： 它們通常基於數據的秩（ranks）或簡單的符號（+ 或 -），而不是平均值或變異數等複雜的母數。
• 穩健性： 它們較少受到極端值（outliers）的影響，因為它們關注的是數據的順序而非精確數值。

無母數檢定的缺點：

• 檢定力較低（Lower Power）： 如果數據確實是常態分佈的，無母數檢定的「檢定力」會比母數檢定低。這意味著它們較難偵測出錯誤的虛無假設。
• 資訊量較少： 由於它們使用秩或符號，因此會「捨棄」了包含在原始數值中的部分特定資訊。

快速複習小盒子：
如果你確定數據符合常態分佈，請使用母數檢定（如 t-檢定）。
如果分佈未知或明顯不是常態分佈，請使用無母數檢定。

2. 符號檢定（The Sign Test）

符號檢定（Sign Test）是最簡單的無母數檢定。我們用它來檢定關於母體中位數（population median，記為 \( m \)）的假設。它被稱為符號檢定，是因為我們只關心數據點是在假設中位數的上方（+）還是下方（-）。

設立假設

虛無假設 \( H_0 \)：母體中位數等於特定值 \( m_0 \)。
\( H_0: m = m_0 \)

對立假設 \( H_1 \)：
• \( H_1: m \neq m_0 \)（雙尾檢定）
• \( H_1: m > m_0 \)（右尾檢定）
• \( H_1: m < m_0 \)（左尾檢定）

檢定步驟（Step-by-Step）

1. 將樣本中的每個數據值與假設的中位數 \( m_0 \) 進行比較。
2. 如果數值大於 \( m_0 \)，記錄一個加號（+）。
3. 如果數值小於 \( m_0 \)，記錄一個減號（-）。
4. 如果數值剛好等於 \( m_0 \)，我們忽略它，並相應地縮減樣本大小 \( n \)。
5. 令 \( X \) 為加號的數量。在 \( H_0 \) 成立下，每個數值位於中位數上方或下方的機率均等。因此，檢定統計量 \( X \) 遵循二項分佈（Binomial Distribution）：
\( X \sim B(n, 0.5) \)

例子：假設你認為某咖啡店的中位數等待時間是 10 分鐘。你觀察了 10 位顧客，其中 8 人的等待時間超過 10 分鐘（+），2 人少於 10 分鐘（-）。由於 8 遠大於預期的 5，你可能會拒絕 \( H_0 \)。

如果一開始覺得困難，別擔心！ 只要記住：我們只是在計算有多少人落在圍欄的哪一邊。如果圍欄真的是中位數，那應該會是一個 50/50 的比例。

3. Wilcoxon 配對樣本符號秩檢定（Wilcoxon Matched-Pair Signed Rank Test）

Wilcoxon 配對樣本符號秩檢定用於配對數據（例如對同一群人的「前後」測量）。它比符號檢定更強大，因為它同時考慮了差異的方向（+ 或 -）和幅度（大小）。

假設

對於此檢定，我們假設兩個母體的分佈形狀相同，僅在位置上有所偏移。這意味著差異的分佈是對稱的。

設立假設

\( H_0 \)：兩種處理方式之間沒有差異（差異的母體中位數為零）。
\( H_1 \)：存在差異（差異的母體中位數不為零）。

檢定步驟

1. 計算每對數據的差異 \( d_i \)（例如：後測減前測）。
2. 忽略任何差異為零的配對。
3. 取差異的絕對值 \( |d_i| \)，並由小到大進行排序（秩）（1, 2, 3...）。
課程筆記：本課程將排除秩數相同（tied）的情況。
4. 將原始符號（+ 或 -）重新分配回每個秩。
5. 計算 \( T^+ \)（正秩和）與 \( T^- \)（負秩和）。
6. 檢定統計量 \( T \) 通常取 \( T^+ \) 和 \( T^- \) 中的較小值。將其與 Wilcoxon 臨界值表進行比較。

類比： 想像兩位運動員。符號檢定只問「誰贏得比較多場比賽？」，而 Wilcoxon 檢定則問「誰贏得比較多場比賽，且贏了多少距離？」。這使得它成為一個更精明的裁判！

重點總結： Wilcoxon 檢定使用差異的秩，而不僅僅是方向。這使它能夠比簡單的符號檢定捕捉到更多的資訊。

4. 選擇檢定方法的總結

選擇正確的檢定方法就等於成功了一半。以下是快速指南：

1. 檢定單一母體中位數？
使用符號檢定（Sign Test）。

2. 檢定配對樣本的差異？
使用Wilcoxon 配對樣本符號秩檢定。

3. 數據符合常態分佈且樣本數小？
使用 t-檢定（母數檢定 - 在 3.3 節介紹）。

4. 數據不符合常態分佈？
務必使用無母數選項（符號檢定或 Wilcoxon 檢定）。

你知道嗎？ 無母數檢定廣泛應用於心理學和醫學領域，研究人員經常使用「李克特量表」（如 1 到 5 星評分）。由於 1 星與 2 星之間的「差距」可能與 4 星和 5 星之間的「差距」不完全相同，這些檢定非常適合用於分析此類數據！

成功檢查清單

• 務必使用中位數一詞清晰地陳述你的虛無假設 \( H_0 \) 和對立假設 \( H_1 \)。
• 對於符號檢定，識別你的 \( n \) 以及檢定統計量 \( X \sim B(n, 0.5) \)。
• 對於 Wilcoxon 檢定，記住先對絕對差異進行排序，再放回符號。
• 始終在問題的情境下做出結論（例如：「在 5% 的顯著水準下，有足夠證據顯示中位數體重已經增加」）。

避免常見錯誤： 別忘了在符號檢定和 Wilcoxon 檢定中捨棄「零差異」！如果一個數據點等於假設的中位數，或者某個配對沒有變化，這對我們判斷數據傾向哪一方沒有幫助，所以我們將其剔除並縮減 \( n \)。

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。

歡迎來到無母數檢定（Non-parametric Tests）的世界！

1. 理解無母數檢定

無母數檢定的優點：

無母數檢定的缺點：

2. 符號檢定（The Sign Test）

設立假設

檢定步驟（Step-by-Step）

3. Wilcoxon 配對樣本符號秩檢定（Wilcoxon Matched-Pair Signed Rank Test）

假設

設立假設

檢定步驟

4. 選擇檢定方法的總結

成功檢查清單

立即實踐所學