Paired tests - Statistics (9ST0) - Pearson Edexcel A Level

配對檢定導論

歡迎來到配對檢定 (paired tests) 的世界！如果你曾經好奇一種新的能量飲品是否真的能讓人跑得更快，或者補習班是否真的能提升學生的成績，那你來對地方了。這些檢定是 Paper 2: Statistical Inference（統計推論） 的一部分。

在統計學中，我們經常需要比較兩組數據。有時候這兩組數據是完全獨立的（例如比較倫敦學生與曼徹斯特學生的身高）。但數據通常以配對 (pairs) 的形式出現。這發生在我們對同一個人進行兩次測量（例如「之前」與「之後」）或使用「匹配對」(matched pairs)（例如同卵雙胞胎）的情況下。

為什麼要使用配對檢定？ 它們非常強大，因為它們能「抵消」個體差異。如果我們對你進行藥物測試，我們是將你的結果與你自己的基準線進行比較，而不是與一個可能擁有完全不同新陳代謝能力的陌生人進行比較！

1. 核心概念：處理差值

所有配對檢定的「秘密武器」在於，我們實際上不會分開看待兩組原始數據，而是建立一個名為差值 (Differences) (\(d\)) 的新數據集。

例子： 如果一名學生在課程前的分數是 60 分，課程後是 65 分，那麼他們的差值就是 \(65 - 60 = 5\)。我們對研究中的每一對數據執行此操作，然後對這些數字進行檢定。

快速回顧：
1. 從兩列相關數據開始。
2. 計算每一對的差值：\(d = x_1 - x_2\)。
3. 對這些差值 (\(d\)) 進行假設檢定。

2. 符號檢定 (Sign Test)（非參數）

符號檢定是最簡單的配對檢定。它不在乎某人改善了多少；它只關心變化的方向。

何時使用： 當你擁有配對數據，但不想對分佈形態做任何假設時，請使用此檢定。它非常適合小樣本或數據較「亂」的情況。

運作方式（步驟說明）：

1. 計算每一對的差值。
2. 如果差值為正，則賦予加號 (+)；如果為負，則賦予減號 (-)。
3. 忽略任何差值為零的對（它們會從樣本大小 \(n\) 中剔除）。
4. 你的檢定統計量通常是出現次數較少的符號數量。
5. 將此值與二項分佈表中的臨界值進行比較，其中 \(n\) 是你非零對的數量，\(p = 0.5\)。

比喻： 想像一個「讚 / 倒讚」系統。我們不在乎某人是稍微喜歡還是非常喜歡這部電影；我們只統計有多少人給它「讚」。

重點總結： 符號檢定比較「弱」（不太容易找到顯著結果），因為它捨棄了關於差值大小的資訊，但它非常穩健 (robust)，因為它適用於任何數據。

3. 威爾科克森符號秩檢定 (Wilcoxon Signed-Rank Test)（非參數）

威爾科克森符號秩檢定比符號檢定進階了一步。它不僅看方向 (+) 或 (-)，還透過排序來考慮差值的相對大小。

假設： 為了使此檢定有效，你必須假設差值的分佈是對稱的。

運作方式（步驟說明）：

1. 計算所有對的差值。
2. 暫時忽略符號，將差值按絕對值從小到大排序（1 為最小差值）。
3. 如果出現平手（數值相同），則給予它們排名平均值。
4. 現在，將符號放回排名中（例如，如果 +5 的差值排在第 3 名，則保持為 3；如果 -5 的差值排在第 3 名，則變成「負秩」）。
5. 將正秩 (\(W_+\)) 和負秩 (\(W_-\)) 分別求和。
6. 你的檢定統計量 \(T\) 是這兩個總和中的較小者。

常見錯誤： 學生經常忘記忽略差值為零的數據。如果「之前」和「之後」相同，那麼在開始排名之前，該對數據必須被刪除！

你知道嗎？ 此檢定比符號檢定強大得多，因為它認可巨大的改善應比微小的改善更具權重。

4. 配對 t 檢定 (Paired t-test)（參數）

當你的數據「表現良好」時，配對 t 檢定是「黃金標準」。它使用差值的實際數值，而不僅僅是排名。

假設： 此檢定僅在差值的總體呈常態分佈時有效：\(d \sim N(\mu_d, \sigma_d^2)\)。

假設：

通常我們檢定是否存在任何變化。
\(H_0: \mu_d = 0\)（平均差值為零）
\(H_1: \mu_d \neq 0\)（雙尾）或 \(\mu_d > 0 / \mu_d < 0\)（單尾）

公式：

檢定統計量計算如下：\(t = \frac{\bar{d} - \mu_d}{s_d / \sqrt{n}}\)
其中：
- \(\bar{d}\) 是樣本差值的平均值。
- \(s_d\) 是這些差值的標準差。
- \(n\) 是配對的數量。

記憶小撇步： 將 t 檢定中的 "t" 想像成代表 "Typical"（典型） 或 "Top-tier"（頂級）。它是最精確的檢定，但要求數據必須呈常態分佈。

5. 選擇正確的檢定

考試中最大的挑戰之一是決定使用哪種檢定。別擔心，如果這看起來很棘手，只需遵循這個邏輯路徑：

第 1 步：它是配對的嗎？

是否對一個人有兩次測量？或者是匹配對（如雙胞胎）？如果是，那就是配對檢定。

第 2 步：檢查差值的分佈

它是常態的嗎？ 使用 配對 t 檢定 (Paired t-test)。
它不是常態，但對稱嗎？ 使用 威爾科克森符號秩檢定 (Wilcoxon Signed-Rank Test)。
兩者皆非，或者資訊極少？ 使用 符號檢定 (Sign Test)。

快速回顧表：
符號檢定： 無假設。僅使用符號 (+/-)。檢定力較低。
威爾科克森： 假設對稱性。使用排名。檢定力中等至高。
配對 t 檢定： 假設常態性。使用實際數值。檢定力最高。

6. 在情境中解釋結果

一旦你得到 \(p\)-value 或將檢定統計量與臨界值進行比較，就必須寫出結論。Pearson Edexcel 的考官非常看重情境！

好的結論範例：
「在 5% 的顯著性水平下，有足夠的證據顯示運動員在冥想練習後，平均心率有所下降 (\(p = 0.032 < 0.05\))。我們拒絕虛無假設。」

糟糕的結論範例：
「拒絕 H0。結果是顯著的。」（這會因為缺乏情境描述而失分！）

重點提示：
- 始終說明你所使用的顯著性水平。
- 始終回顧題目中的現實世界對象（例如：「藥物」、「學生」、「反應時間」）。
- 永遠不要說結果是「確定的」——使用如「顯示出」、「有證據表明」等措辭。

總結檢查清單

在你繼續之前，請確保你能：
1. 從兩列數據中計算出一組差值。
2. 辨識數據何時為「配對」與「獨立」。
3. 說明威爾科克森（對稱性）和配對 t 檢定（常態性）的具體假設。
4. 正確地對數據進行排名，並透過平均處理平手情況。
5. 為符號檢定使用二項分佈表。

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。

配對檢定導論

1. 核心概念：處理差值

2. 符號檢定 (Sign Test)（非參數）

運作方式（步驟說明）：

3. 威爾科克森符號秩檢定 (Wilcoxon Signed-Rank Test)（非參數）

運作方式（步驟說明）：

4. 配對 t 檢定 (Paired t-test)（參數）

假設：

公式：

5. 選擇正確的檢定

第 1 步：它是配對的嗎？

第 2 步：檢查差值的分佈

6. 在情境中解釋結果

總結檢查清單

立即實踐所學