歡迎來到 1 個及 2 個樣本的假設檢定!

在之前的學習中,你可能接觸過各種條件都十分「完美」的假設檢定——例如已知母體變異數,或者樣本數非常大。但在現實世界中,我們很少能掌握所有事實。本章的主旨是讓你化身為統計偵探,在資訊不足,或想要比較兩組不同數據(例如評估新藥是否比舊藥更有效)時,懂得如何分析問題。

別擔心這看起來比基礎檢定複雜。我們會一步步拆解,並使用你已經熟悉的邏輯:虛無假設 (Null Hypothesis)檢定統計量 (Test Statistic)結論 (Conclusion)

1. 單一平均數的檢定:t 分佈

(課程大綱 16.1)

在之前的章節中,你使用了常態 (\(z\)) 分佈。但如果你不知道母體變異數 (\(\sigma^2\)),而且樣本數又很少呢?這就是 t 分佈 大顯身手的時候了。

何時使用 t 檢定:

當以下情況滿足時,請使用單一樣本 t 檢定
1. 母體 變異數未知
2. 樣本數 較小 (通常 \(n < 30\))。
3. 母體本身符合 常態分佈(這是一個至關重要的假設!)。

「安全邊際」的類比

你可以把 \(t\) 分佈想像成一個「更謹慎」版本的常態分佈。由於我們是從少量樣本中估算變異數,因此我們無法百分之百確定其精確度。與常態分佈相比,\(t\) 分佈有「更肥的尾部」(fatter tails),這意味著除非證據非常強烈,否則很難拒絕虛無假設。隨著樣本數 (\(n\)) 增加,\(t\) 分佈會變得越來越像常態分佈!

關鍵公式:

檢定統計量的計算方式為:
\(t = \frac{\bar{x} - \mu}{s / \sqrt{n}}\)
其中 \(s\) 是你的樣本標準差。你還需要知道 自由度 (degrees of freedom) (\(v\)),計算方式很簡單:\(v = n - 1\)。

快速複習箱:
小樣本 + 變異數未知 + 母體常態 = 使用 t 檢定!

2. 比較兩個平均數(獨立樣本)

(課程大綱 16.2 & 16.3)

有時我們想知道兩組之間是否有差異。例如:「A 校學生的成績是否比 B 校學生高?」

情境 A:已知變異數(z 檢定)

如果你真的知道兩個母體的變異數 (\(\sigma_1^2\) 和 \(\sigma_2^2\)),則使用 \(z\) 分佈。
檢定統計量:
\(z = \frac{(\bar{x}_1 - \bar{x}_2) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}}\)
通常我們的虛無假設是兩者無差異,因此 \((\mu_1 - \mu_2) = 0\)。

情境 B:變異數未知但相等(合併 t 檢定 - Pooled t-test)

這在現實中更常見。如果我們不知道變異數,但假設兩組的變異數 相同,我們會將數據「合併」(pool) 起來,以獲得對該共同變異數更好的估計。

你知道嗎? 只有在兩個母體都符合常態分佈且變異數相等時,此檢定才有效。在考試中你不需要證明變異數相等,但你必須將其明確列為假設條件!

「合併」步驟:

首先,計算 合併變異數估計值 (\(s_p^2\)):
\(s_p^2 = \frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2}\)

然後,求出檢定統計量:
\(t = \frac{\bar{x}_1 - \bar{x}_2}{s_p \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}\)
對於此檢定,自由度為 \(v = n_1 + n_2 - 2\)。

記憶小撇步: 把「合併」(Pooling) 想像成百家宴 (potluck dinner)。與其每個人吃自己的食物(分開的變異數),不如把所有食物放進一個大碗裡(合併變異數)共同分享!

重點提示: 如果你在關於兩個平均數的題目中看到「假設變異數相等」(assume equal variances),記得去查閱小冊子中的 合併變異數 (pooled variance) 公式。

3. 兩個二項比例的差異

(課程大綱 16.4)

如果數據不是「平均數」而是「比例」怎麼辦?例如:「城鎮 A 和城鎮 B 支持某項法律的人口比例是否不同?」

方法:

就像處理平均數一樣,如果我們在虛無假設下假設兩個比例相等,我們就使用比例 (\(p\)) 的 合併估計值
合併比例 (\(\hat{p}\)):
\(\hat{p} = \frac{x_1 + x_2}{n_1 + n_2}\) (總成功次數除以總試驗次數)

檢定統計量:

\(z = \frac{p_1 - p_2}{\sqrt{\hat{p}(1 - \hat{p})(\frac{1}{n_1} + \frac{1}{n_2})}}\)

常見錯誤: 千萬別忘記這是 \(z\) 檢定,不是 \(t\) 檢定!對於比例問題,我們使用常態近似法。

4. 在情境中詮釋結果

(課程大綱 16.5)

統計學中最重要的一環就是解釋你的數字代表什麼。如果你算對了所有數學結果,卻沒有解釋答案,你會損失很多不該失的分數!

如何撰寫結論:

1. 比較: 說明你的檢定統計量是否落在拒絕域內 (例如:「由於 2.45 > 1.96...」),或是 p-value 是否小於顯著水準。
2. 決策: 表明你是「拒絕 \(H_0\)」還是「無法拒絕 \(H_0\)」。
3. 情境: 使用題目中的關鍵字。避免過於「武斷」。
不要寫: 「這證明了藥物有效。」
要寫: 「在 5% 的顯著水準下,有 顯著證據 表明平均康復時間已縮短。」

關鍵點: 統計學講的是 證據 (evidence),而非 證明 (proof)。永遠使用像「顯示」(suggests that) 或「跡象表明」(evidence to indicate) 之類的詞彙。

總結檢查表

- 單一平均數(小樣本,\(\sigma\) 未知): 使用 \(t\) 檢定,自由度 \(v = n - 1\)。
- 兩個平均數(已知 \(\sigma\)): 使用 \(z\) 檢定。
- 兩個平均數(未知但相等 \(\sigma\)): 使用合併 \(t\) 檢定,自由度 \(v = n_1 + n_2 - 2\)。
- 兩個比例: 使用合併 \(z\) 檢定。
- 有效性: 進行 \(t\) 檢定時,務必確認母體是否為 常態分佈