引言:為什麼要關注變異數?
你好!歡迎來到 Further Statistics 2 中最實用的章節之一。到目前為止,你可能已經花了很多時間在處理平均值 (means) 的檢定。但在現實世界中,變異數 (variance,即「離散程度」或一致性) 往往同樣重要,甚至更重要!
想像一間製造飛機引擎螺栓的工廠。如果螺栓的平均尺寸正確,但變異數很大,那麼有些螺栓會太大,有些則太小。這會導致它們無法裝配!在本章中,我們將學習如何檢定母體變異數是否符合特定數值,以及如何比較兩個不同組別的變異數。如果這些符號一開始讓你感到困惑,請別擔心,我們會一步一步為你拆解。
1. 常態分佈的變異數檢定
當我們想要檢定單一母體的變異數 (\(\sigma^2\)) 時,我們會使用 卡方 (\(\chi^2\)) 分佈。這個分佈特別用於處理「平方」的數值,這非常合理,因為變異數本質上就是一種平方後的量度!
檢定統計量 (Test Statistic)
要進行這項檢定,我們使用以下公式計算 \(\chi^2\) 值:
\(\chi^2 = \frac{(n-1)S^2}{\sigma^2}\)
其中:
- \(n\) 是你的樣本大小。
- \(S^2\) 是你從樣本中算出的不偏估計量 (unbiased estimate)。
- \(\sigma^2\) 是你用來進行檢定的母體變異數(來自你的虛無假設)。
自由度 (Degrees of Freedom)
對於這項檢定,自由度 (df) 總是 \(n - 1\)。你可以把它想像成你的「靈活空間」。如果你有 10 個數據點,你就有 9 個自由度。
逐步假設檢定
1. 設定假設: \(H_0: \sigma^2 = \text{數值}\) 以及 \(H_1: \sigma^2 \neq, <, \text{ 或 } > \text{數值}\)。
2. 計算檢定統計量: 使用上述的 \(\chi^2\) 公式。
3. 找出臨界值 (critical value): 根據你的顯著水準和 \(df = n-1\),在 \(\chi^2\) 分佈表中查出數值。
4. 比較並得出結論: 如果你算出的值落在「拒絕域」(critical region)(即極端的尾部區域),就拒絕 \(H_0\)。
變異數的信賴區間 (Confidence Intervals)
你也可以估計真實的母體變異數落在哪個範圍。信賴區間的公式為:
\( \left( \frac{(n-1)S^2}{\chi^2_{\text{upper}}}, \frac{(n-1)S^2}{\chi^2_{\text{lower}}} \right) \)
注意:由於 \(\chi^2\) 分佈不是對稱的,所以從表中查出的「上限」和「下限」數值會不同!
快速複習箱:
- 使用 \(\chi^2\) 進行單一變異數檢定。
- 自由度 = \(n-1\)。
- 務必使用不偏估計量 \(S^2\)。
重點總結: \(\chi^2\) 檢定能幫助我們判斷數據的「離散程度」是否與我們預期的有顯著差異。
2. 比較兩個變異數:F 檢定
如果想知道兩部不同的機器是否同樣穩定?或者一種新的培訓方法是否能比舊方法減少測驗分數的變異數?這時,我們需要使用 F 分佈來比較兩個獨立樣本。
F 統計量
F 檢定基本上就是兩個變異數的比率。計算起來非常簡單:
\(F = \frac{S_1^2}{S_2^2}\)
黃金法則: 為了方便起見,請務必將較大的樣本變異數放在分子 (\(S_1^2 > S_2^2\))。這樣可以確保你的 \(F\) 值永遠大於 1,這也符合統計表的一般編排方式。
F 檢定的自由度
F 分佈有兩組自由度:
- \(\nu_1 = n_1 - 1\)(對應分子中的變異數)
- \(\nu_2 = n_2 - 1\)(對應分母中的變異數)
查表時,你必須確保這兩組自由度的順序正確!
現實生活範例
想像比較兩個品牌的燈泡。品牌 A 的壽命樣本變異數為 100 小時,品牌 B 為 250 小時。為了查看品牌 B 是否顯著地更「不可靠」(變異更大),你會計算 \(F = \frac{250}{100} = 2.5\)。然後你再檢查在給定的樣本大小下,2.5 是否為一個異常大的比率。
常見錯誤避坑指南
- 混淆 \(S^2\) 與 \(\sigma^2\): 記住,\(S^2\) 來自你的數據,而 \(\sigma^2\) 是理論上的母體數值。
- 忘記平方: 如果題目給你的是標準差 (\(s\)),你必須先將其平方得到變異數 (\(S^2\)),才能使用公式!
- 雙尾檢定: 如果你進行的是 \(H_1: \sigma_1^2 \neq \sigma_2^2\),記得將顯著水準除以 2(例如,進行 5% 的檢定時,在表中要查 0.025)。
你知道嗎? F 分佈是以現代統計學創始人之一羅納德·費雪 (Sir Ronald Fisher) 的名字命名的。他開發這個分佈是為了協助分析農業實驗數據!
重點總結: F 檢定是一個比值。如果比值接近 1,則兩者的變異數可能相等;如果比值非常大,則表示其中一組的變異程度顯著大於另一組。
3. 總結檢查清單
在進入考場前,請確保你能做到以下幾點:
1. 辨別何時使用 \(\chi^2\) (單一樣本) 而何時使用 \(F\) (兩個樣本)。
2. 從原始數據中計算變異數的不偏估計量 \(S^2\)。
3. 找出正確的自由度 (\(n-1\))。
4. 正確使用兩種分佈的統計表。
5. 在題目情境中解釋結果(例如:「有證據顯示機器 A 比機器 B 更穩定」)。
如果一開始覺得困難,別擔心! 統計學最重要的就是練習。只要你親手做過三到四次假設檢定,模式就會變得非常清晰。你一定能行的!