歡迎來到 1 個及 2 個樣本的假設檢定!
在之前的學習中,你可能接觸過各種條件都十分「完美」的假設檢定——例如已知母體變異數,或者樣本數非常大。但在現實世界中,我們很少能掌握所有事實。本章的主旨是讓你化身為統計偵探,在資訊不足,或想要比較兩組不同數據(例如評估新藥是否比舊藥更有效)時,懂得如何分析問題。
別擔心這看起來比基礎檢定複雜。我們會一步步拆解,並使用你已經熟悉的邏輯:虛無假設 (Null Hypothesis)、檢定統計量 (Test Statistic) 和 結論 (Conclusion)。
1. 單一平均數的檢定:t 分佈
(課程大綱 16.1)
在之前的章節中,你使用了常態 (\(z\)) 分佈。但如果你不知道母體變異數 (\(\sigma^2\)),而且樣本數又很少呢?這就是 t 分佈 大顯身手的時候了。
何時使用 t 檢定:
當以下情況滿足時,請使用單一樣本 t 檢定:
1. 母體 變異數未知。
2. 樣本數 較小 (通常 \(n < 30\))。
3. 母體本身符合 常態分佈(這是一個至關重要的假設!)。
「安全邊際」的類比
你可以把 \(t\) 分佈想像成一個「更謹慎」版本的常態分佈。由於我們是從少量樣本中估算變異數,因此我們無法百分之百確定其精確度。與常態分佈相比,\(t\) 分佈有「更肥的尾部」(fatter tails),這意味著除非證據非常強烈,否則很難拒絕虛無假設。隨著樣本數 (\(n\)) 增加,\(t\) 分佈會變得越來越像常態分佈!
關鍵公式:
檢定統計量的計算方式為:
\(t = \frac{\bar{x} - \mu}{s / \sqrt{n}}\)
其中 \(s\) 是你的樣本標準差。你還需要知道 自由度 (degrees of freedom) (\(v\)),計算方式很簡單:\(v = n - 1\)。
快速複習箱:
小樣本 + 變異數未知 + 母體常態 = 使用 t 檢定!
2. 比較兩個平均數(獨立樣本)
(課程大綱 16.2 & 16.3)
有時我們想知道兩組之間是否有差異。例如:「A 校學生的成績是否比 B 校學生高?」
情境 A:已知變異數(z 檢定)
如果你真的知道兩個母體的變異數 (\(\sigma_1^2\) 和 \(\sigma_2^2\)),則使用 \(z\) 分佈。
檢定統計量:
\(z = \frac{(\bar{x}_1 - \bar{x}_2) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}}\)
通常我們的虛無假設是兩者無差異,因此 \((\mu_1 - \mu_2) = 0\)。
情境 B:變異數未知但相等(合併 t 檢定 - Pooled t-test)
這在現實中更常見。如果我們不知道變異數,但假設兩組的變異數 相同,我們會將數據「合併」(pool) 起來,以獲得對該共同變異數更好的估計。
你知道嗎? 只有在兩個母體都符合常態分佈且變異數相等時,此檢定才有效。在考試中你不需要證明變異數相等,但你必須將其明確列為假設條件!
「合併」步驟:
首先,計算 合併變異數估計值 (\(s_p^2\)):
\(s_p^2 = \frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2}\)
然後,求出檢定統計量:
\(t = \frac{\bar{x}_1 - \bar{x}_2}{s_p \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}\)
對於此檢定,自由度為 \(v = n_1 + n_2 - 2\)。
記憶小撇步: 把「合併」(Pooling) 想像成百家宴 (potluck dinner)。與其每個人吃自己的食物(分開的變異數),不如把所有食物放進一個大碗裡(合併變異數)共同分享!
重點提示: 如果你在關於兩個平均數的題目中看到「假設變異數相等」(assume equal variances),記得去查閱小冊子中的 合併變異數 (pooled variance) 公式。
3. 兩個二項比例的差異
(課程大綱 16.4)
如果數據不是「平均數」而是「比例」怎麼辦?例如:「城鎮 A 和城鎮 B 支持某項法律的人口比例是否不同?」
方法:
就像處理平均數一樣,如果我們在虛無假設下假設兩個比例相等,我們就使用比例 (\(p\)) 的 合併估計值。
合併比例 (\(\hat{p}\)):
\(\hat{p} = \frac{x_1 + x_2}{n_1 + n_2}\) (總成功次數除以總試驗次數)
檢定統計量:
\(z = \frac{p_1 - p_2}{\sqrt{\hat{p}(1 - \hat{p})(\frac{1}{n_1} + \frac{1}{n_2})}}\)
常見錯誤: 千萬別忘記這是 \(z\) 檢定,不是 \(t\) 檢定!對於比例問題,我們使用常態近似法。
4. 在情境中詮釋結果
(課程大綱 16.5)
統計學中最重要的一環就是解釋你的數字代表什麼。如果你算對了所有數學結果,卻沒有解釋答案,你會損失很多不該失的分數!
如何撰寫結論:
1. 比較: 說明你的檢定統計量是否落在拒絕域內 (例如:「由於 2.45 > 1.96...」),或是 p-value 是否小於顯著水準。
2. 決策: 表明你是「拒絕 \(H_0\)」還是「無法拒絕 \(H_0\)」。
3. 情境: 使用題目中的關鍵字。避免過於「武斷」。
不要寫: 「這證明了藥物有效。」
要寫: 「在 5% 的顯著水準下,有 顯著證據 表明平均康復時間已縮短。」
關鍵點: 統計學講的是 證據 (evidence),而非 證明 (proof)。永遠使用像「顯示」(suggests that) 或「跡象表明」(evidence to indicate) 之類的詞彙。
總結檢查表
- 單一平均數(小樣本,\(\sigma\) 未知): 使用 \(t\) 檢定,自由度 \(v = n - 1\)。
- 兩個平均數(已知 \(\sigma\)): 使用 \(z\) 檢定。
- 兩個平均數(未知但相等 \(\sigma\)): 使用合併 \(t\) 檢定,自由度 \(v = n_1 + n_2 - 2\)。
- 兩個比例: 使用合併 \(z\) 檢定。
- 有效性: 進行 \(t\) 檢定時,務必確認母體是否為 常態分佈!