配對檢定導論
歡迎來到配對檢定 (paired tests) 的世界!如果你曾經好奇一種新的能量飲品是否真的能讓人跑得更快,或者補習班是否真的能提升學生的成績,那你來對地方了。這些檢定是 Paper 2: Statistical Inference(統計推論) 的一部分。
在統計學中,我們經常需要比較兩組數據。有時候這兩組數據是完全獨立的(例如比較倫敦學生與曼徹斯特學生的身高)。但數據通常以配對 (pairs) 的形式出現。這發生在我們對同一個人進行兩次測量(例如「之前」與「之後」)或使用「匹配對」(matched pairs)(例如同卵雙胞胎)的情況下。
為什麼要使用配對檢定? 它們非常強大,因為它們能「抵消」個體差異。如果我們對你進行藥物測試,我們是將你的結果與你自己的基準線進行比較,而不是與一個可能擁有完全不同新陳代謝能力的陌生人進行比較!
1. 核心概念:處理差值
所有配對檢定的「秘密武器」在於,我們實際上不會分開看待兩組原始數據,而是建立一個名為差值 (Differences) (\(d\)) 的新數據集。
例子: 如果一名學生在課程前的分數是 60 分,課程後是 65 分,那麼他們的差值就是 \(65 - 60 = 5\)。我們對研究中的每一對數據執行此操作,然後對這些數字進行檢定。
快速回顧:
1. 從兩列相關數據開始。
2. 計算每一對的差值:\(d = x_1 - x_2\)。
3. 對這些差值 (\(d\)) 進行假設檢定。
2. 符號檢定 (Sign Test)(非參數)
符號檢定是最簡單的配對檢定。它不在乎某人改善了多少;它只關心變化的方向。
何時使用: 當你擁有配對數據,但不想對分佈形態做任何假設時,請使用此檢定。它非常適合小樣本或數據較「亂」的情況。
運作方式(步驟說明):
1. 計算每一對的差值。
2. 如果差值為正,則賦予加號 (+);如果為負,則賦予減號 (-)。
3. 忽略任何差值為零的對(它們會從樣本大小 \(n\) 中剔除)。
4. 你的檢定統計量通常是出現次數較少的符號數量。
5. 將此值與二項分佈表中的臨界值進行比較,其中 \(n\) 是你非零對的數量,\(p = 0.5\)。
比喻: 想像一個「讚 / 倒讚」系統。我們不在乎某人是稍微喜歡還是非常喜歡這部電影;我們只統計有多少人給它「讚」。
重點總結: 符號檢定比較「弱」(不太容易找到顯著結果),因為它捨棄了關於差值大小的資訊,但它非常穩健 (robust),因為它適用於任何數據。
3. 威爾科克森符號秩檢定 (Wilcoxon Signed-Rank Test)(非參數)
威爾科克森符號秩檢定比符號檢定進階了一步。它不僅看方向 (+) 或 (-),還透過排序來考慮差值的相對大小。
假設: 為了使此檢定有效,你必須假設差值的分佈是對稱的。
運作方式(步驟說明):
1. 計算所有對的差值。
2. 暫時忽略符號,將差值按絕對值從小到大排序(1 為最小差值)。
3. 如果出現平手(數值相同),則給予它們排名平均值。
4. 現在,將符號放回排名中(例如,如果 +5 的差值排在第 3 名,則保持為 3;如果 -5 的差值排在第 3 名,則變成「負秩」)。
5. 將正秩 (\(W_+\)) 和負秩 (\(W_-\)) 分別求和。
6. 你的檢定統計量 \(T\) 是這兩個總和中的較小者。
常見錯誤: 學生經常忘記忽略差值為零的數據。如果「之前」和「之後」相同,那麼在開始排名之前,該對數據必須被刪除!
你知道嗎? 此檢定比符號檢定強大得多,因為它認可巨大的改善應比微小的改善更具權重。
4. 配對 t 檢定 (Paired t-test)(參數)
當你的數據「表現良好」時,配對 t 檢定是「黃金標準」。它使用差值的實際數值,而不僅僅是排名。
假設: 此檢定僅在差值的總體呈常態分佈時有效:\(d \sim N(\mu_d, \sigma_d^2)\)。
假設:
通常我們檢定是否存在任何變化。
\(H_0: \mu_d = 0\)(平均差值為零)
\(H_1: \mu_d \neq 0\)(雙尾)或 \(\mu_d > 0 / \mu_d < 0\)(單尾)
公式:
檢定統計量計算如下:\(t = \frac{\bar{d} - \mu_d}{s_d / \sqrt{n}}\)
其中:
- \(\bar{d}\) 是樣本差值的平均值。
- \(s_d\) 是這些差值的標準差。
- \(n\) 是配對的數量。
記憶小撇步: 將 t 檢定中的 "t" 想像成代表 "Typical"(典型) 或 "Top-tier"(頂級)。它是最精確的檢定,但要求數據必須呈常態分佈。
5. 選擇正確的檢定
考試中最大的挑戰之一是決定使用哪種檢定。別擔心,如果這看起來很棘手,只需遵循這個邏輯路徑:
第 1 步:它是配對的嗎?
是否對一個人有兩次測量?或者是匹配對(如雙胞胎)?如果是,那就是配對檢定。
第 2 步:檢查差值的分佈
- 它是常態的嗎? 使用 配對 t 檢定 (Paired t-test)。
- 它不是常態,但對稱嗎? 使用 威爾科克森符號秩檢定 (Wilcoxon Signed-Rank Test)。
- 兩者皆非,或者資訊極少? 使用 符號檢定 (Sign Test)。
快速回顧表:
符號檢定: 無假設。僅使用符號 (+/-)。檢定力較低。
威爾科克森: 假設對稱性。使用排名。檢定力中等至高。
配對 t 檢定: 假設常態性。使用實際數值。檢定力最高。
6. 在情境中解釋結果
一旦你得到 \(p\)-value 或將檢定統計量與臨界值進行比較,就必須寫出結論。Pearson Edexcel 的考官非常看重情境!
好的結論範例:
「在 5% 的顯著性水平下,有足夠的證據顯示運動員在冥想練習後,平均心率有所下降 (\(p = 0.032 < 0.05\))。我們拒絕虛無假設。」
糟糕的結論範例:
「拒絕 H0。結果是顯著的。」(這會因為缺乏情境描述而失分!)
重點提示:
- 始終說明你所使用的顯著性水平。
- 始終回顧題目中的現實世界對象(例如:「藥物」、「學生」、「反應時間」)。
- 永遠不要說結果是「確定的」——使用如「顯示出」、「有證據表明」等措辭。
總結檢查清單
在你繼續之前,請確保你能:
1. 從兩列數據中計算出一組差值。
2. 辨識數據何時為「配對」與「獨立」。
3. 說明威爾科克森(對稱性)和配對 t 檢定(常態性)的具體假設。
4. 正確地對數據進行排名,並透過平均處理平手情況。
5. 為符號檢定使用二項分佈表。