Hypothesis testing for 1 and 2 samples - Statistics (9ST0) - Pearson Edexcel A Level

歡迎來到 1 個及 2 個樣本的假設檢定！

在之前的學習中，你可能接觸過各種條件都十分「完美」的假設檢定——例如已知母體變異數，或者樣本數非常大。但在現實世界中，我們很少能掌握所有事實。本章的主旨是讓你化身為統計偵探，在資訊不足，或想要比較兩組不同數據（例如評估新藥是否比舊藥更有效）時，懂得如何分析問題。

別擔心這看起來比基礎檢定複雜。我們會一步步拆解，並使用你已經熟悉的邏輯：虛無假設 (Null Hypothesis)、檢定統計量 (Test Statistic) 和 結論 (Conclusion)。

1. 單一平均數的檢定：t 分佈

(課程大綱 16.1)

在之前的章節中，你使用了常態 (\(z\)) 分佈。但如果你不知道母體變異數 (\(\sigma^2\))，而且樣本數又很少呢？這就是 t 分佈 大顯身手的時候了。

何時使用 t 檢定：

當以下情況滿足時，請使用單一樣本 t 檢定：
1. 母體 變異數未知。
2. 樣本數較小 (通常 \(n < 30\))。
3. 母體本身符合 常態分佈（這是一個至關重要的假設！）。

「安全邊際」的類比

你可以把 \(t\) 分佈想像成一個「更謹慎」版本的常態分佈。由於我們是從少量樣本中估算變異數，因此我們無法百分之百確定其精確度。與常態分佈相比，\(t\) 分佈有「更肥的尾部」(fatter tails)，這意味著除非證據非常強烈，否則很難拒絕虛無假設。隨著樣本數 (\(n\)) 增加，\(t\) 分佈會變得越來越像常態分佈！

關鍵公式：

檢定統計量的計算方式為：
\(t = \frac{\bar{x} - \mu}{s / \sqrt{n}}\)
其中 \(s\) 是你的樣本標準差。你還需要知道 自由度 (degrees of freedom) (\(v\))，計算方式很簡單：\(v = n - 1\)。

快速複習箱：
小樣本 + 變異數未知 + 母體常態 = 使用 t 檢定！

2. 比較兩個平均數（獨立樣本）

(課程大綱 16.2 & 16.3)

有時我們想知道兩組之間是否有差異。例如：「A 校學生的成績是否比 B 校學生高？」

情境 A：已知變異數（z 檢定）

如果你真的知道兩個母體的變異數 (\(\sigma_1^2\) 和 \(\sigma_2^2\))，則使用 \(z\) 分佈。
檢定統計量：
\(z = \frac{(\bar{x}_1 - \bar{x}_2) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}}\)
通常我們的虛無假設是兩者無差異，因此 \((\mu_1 - \mu_2) = 0\)。

情境 B：變異數未知但相等（合併 t 檢定 - Pooled t-test）

這在現實中更常見。如果我們不知道變異數，但假設兩組的變異數相同，我們會將數據「合併」(pool) 起來，以獲得對該共同變異數更好的估計。

你知道嗎？ 只有在兩個母體都符合常態分佈且變異數相等時，此檢定才有效。在考試中你不需要證明變異數相等，但你必須將其明確列為假設條件！

「合併」步驟：

首先，計算 合併變異數估計值 (\(s_p^2\))：
\(s_p^2 = \frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2}\)

然後，求出檢定統計量：
\(t = \frac{\bar{x}_1 - \bar{x}_2}{s_p \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}\)
對於此檢定，自由度為 \(v = n_1 + n_2 - 2\)。

記憶小撇步： 把「合併」(Pooling) 想像成百家宴 (potluck dinner)。與其每個人吃自己的食物（分開的變異數），不如把所有食物放進一個大碗裡（合併變異數）共同分享！

重點提示： 如果你在關於兩個平均數的題目中看到「假設變異數相等」(assume equal variances)，記得去查閱小冊子中的 合併變異數 (pooled variance) 公式。

3. 兩個二項比例的差異

(課程大綱 16.4)

如果數據不是「平均數」而是「比例」怎麼辦？例如：「城鎮 A 和城鎮 B 支持某項法律的人口比例是否不同？」

方法：

就像處理平均數一樣，如果我們在虛無假設下假設兩個比例相等，我們就使用比例 (\(p\)) 的 合併估計值。
合併比例 (\(\hat{p}\))：
\(\hat{p} = \frac{x_1 + x_2}{n_1 + n_2}\) (總成功次數除以總試驗次數)

檢定統計量：

\(z = \frac{p_1 - p_2}{\sqrt{\hat{p}(1 - \hat{p})(\frac{1}{n_1} + \frac{1}{n_2})}}\)

常見錯誤： 千萬別忘記這是 \(z\) 檢定，不是 \(t\) 檢定！對於比例問題，我們使用常態近似法。

4. 在情境中詮釋結果

(課程大綱 16.5)

統計學中最重要的一環就是解釋你的數字代表什麼。如果你算對了所有數學結果，卻沒有解釋答案，你會損失很多不該失的分數！

如何撰寫結論：

1. 比較： 說明你的檢定統計量是否落在拒絕域內 (例如：「由於 2.45 > 1.96...」)，或是 p-value 是否小於顯著水準。
2. 決策： 表明你是「拒絕 \(H_0\)」還是「無法拒絕 \(H_0\)」。
3. 情境： 使用題目中的關鍵字。避免過於「武斷」。
不要寫： 「這證明了藥物有效。」
要寫： 「在 5% 的顯著水準下，有 顯著證據 表明平均康復時間已縮短。」

關鍵點： 統計學講的是 證據 (evidence)，而非 證明 (proof)。永遠使用像「顯示」(suggests that) 或「跡象表明」(evidence to indicate) 之類的詞彙。

總結檢查表

- 單一平均數（小樣本，\(\sigma\) 未知）： 使用 \(t\) 檢定，自由度 \(v = n - 1\)。
- 兩個平均數（已知 \(\sigma\)）： 使用 \(z\) 檢定。
- 兩個平均數（未知但相等 \(\sigma\)）： 使用合併 \(t\) 檢定，自由度 \(v = n_1 + n_2 - 2\)。
- 兩個比例： 使用合併 \(z\) 檢定。
- 有效性： 進行 \(t\) 檢定時，務必確認母體是否為 常態分佈！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。