歡迎來到 t 分佈的世界!

在你之前的統計學學習中,你可能已經使用過常態分佈(即 \(z\)-檢定)來進行母體平均值的假設檢定。但這有一個前提:你必須知道母體變異數 (\(\sigma^2\))。

在現實世界中,我們很少能得知整個母體的確切變異數。如果我們只有一個小樣本且不知道母體變異數,常態分佈就顯得不夠精確。這時,t 分佈(也稱為學生 t 分佈)就能派上用場了!本章將帶你學習如何在資訊有限的情況下進行假設檢定並求出信賴區間。

1. 為什麼要使用 t 分佈?

你可以把 \(t\)-分佈想像成常態分佈的「謹慎表親」。因為我們是根據小樣本來估計變異數,所以我們對結果的確定性較低。為了反映這種不確定性,\(t\)-分佈的「尾部」比常態分佈更肥厚

我們什麼時候使用它?
當符合以下條件時,請使用 \(t\)-分佈:
1. 母體呈現常態分佈(或近似常態)。
2. 母體變異數 (\(\sigma^2\)) 未知
3. 樣本大小 (\(n\)) 較小(通常 \(n < 30\)),儘管對於較大的樣本它同樣適用!

類比:想像你試圖猜測學校學生的平均身高。如果你測量了 1,000 名學生,你可以非常有信心(使用常態分佈)。如果你只測量了 5 名學生,你需要為你的猜測預留更多的「誤差空間」——而 \(t\)-分佈那肥厚的尾部,正是提供了額外的誤差空間。

快速複習:如果你知道 \(\sigma^2\),就用 \(z\);如果你不知道 \(\sigma^2\),就用 \(t\)!

2. 核心概念:自由度與變異數

變異數的不偏估計 (\(s^2\))

由於我們不知道母體變異數 (\(\sigma^2\)),我們必須從樣本數據中計算出一個不偏估計值。我們使用符號 \(s^2\) 來表示。
其公式為:
\( s^2 = \frac{\sum (x - \bar{x})^2}{n - 1} \) 或 \( s^2 = \frac{1}{n-1} (\sum x^2 - \frac{(\sum x)^2}{n}) \)

常見錯誤:千萬別除以 \(n\)!在 \(t\)-分佈中,我們總是除以 \(n - 1\),這是為了修正小樣本傾向於低估真實母體離散程度的事實。

自由度 (\(\nu\))

t 分佈的形狀會隨著數據量的不同而改變,這由自由度決定,以希臘字母 nu (\(\nu\)) 表示。
對於單樣本檢定:
\( \nu = n - 1 \)

你知道嗎?隨著自由度的增加(樣本變得越大),\(t\)-分佈看起來就越趨近於標準常態分佈!

重點提示:在查閱機率表之前,務必先計算好 \(s^2\) 和 \(\nu = n-1\)。

3. 進行假設檢定

我們的目標是檢定母體平均值 (\(\mu\)) 是否等於某個特定值 (\(\mu_0\))。

步驟詳解:

1. 陳述你的假設:
\(H_0: \mu = \mu_0\)
\(H_1: \mu \neq \mu_0\)(雙尾檢定)或 \(\mu > \mu_0\) / \(\mu < \mu_0\)(單尾檢定)。

2. 計算檢定統計量 (\(t\)):
使用公式:
\( t = \frac{\bar{x} - \mu}{s / \sqrt{n}} \)
其中 \(\bar{x}\) 是樣本平均值,\(\mu\) 是假設的平均值,而 \(s\) 是你計算出的不偏變異數估計值的平方根。

3. 尋找臨界值:
使用你的自由度 (\(\nu\)) 和顯著水準 (\(\alpha\)),在統計表中查出 \(t\)-分佈的臨界值。

4. 比較並下結論:
如果計算出的 \(t\) 值距離零比臨界值更遠,則拒絕 \(H_0\)。否則,不拒絕 \(H_0\)

結論常用句型:「在 5% 的顯著水準下,有足夠的證據表明蘋果的平均重量已經發生了變化。」

4. 平均值的信賴區間

有時候,我們不是要檢定特定的數值,而是想找出一個區間,讓我們有 95%(或 99%)的把握認為真實的母體平均值落在其中。

對稱信賴區間的公式為:
\( \bar{x} \pm t_{\nu}(\alpha) \times \frac{s}{\sqrt{n}} \)

公式拆解:
- \(\bar{x}\):樣本平均值(區間的中心)。
- \(t_{\nu}(\alpha)\):對應 \(\nu = n-1\) 時的 \(t\)-分佈查表值。對於 95% 的信賴區間,你要查的是 2.5% 的尾部(0.025),因為 5% 的機率被分配在兩端。
- \(\frac{s}{\sqrt{n}}\):這被稱為標準誤 (Standard Error)

記憶小撇步:將信賴區間想像成:結果 \(\pm\) (安全係數 \(\times\) 精確度)

5. 總結與成功秘訣

快速檢視表:
- 標準差:使用 \(s\)(包含 \(n-1\) 的版本)。
- 自由度:\(\nu = n-1\)。
- 檢定統計量:\( t = \frac{\bar{x} - \mu}{s / \sqrt{n}} \)。
- 前提條件:原始母體必須是常態分佈

避免常見陷阱:

1. 漏掉 \(n-1\):學生常常忘記在查表時使用 \(n-1\)。一定要先寫下 \(\nu = \dots\)!
2. 單尾 vs 雙尾:仔細閱讀題目。如果題目說「平均值是否改變」,那就是雙尾;如果題目說「平均值是否大於」,那就是單尾。
3. 變異數 vs 標準差:確認題目給的是 \(s^2\) 還是 \(s\)。如果題目給的是變異數,記得在套用公式前先將其開根號!

如果起初覺得這些概念有些棘手也不用擔心!它的邏輯與你之前做過的 \(z\)-檢定完全相同,我們只是換了一張不同的表,並用稍微不同的方式來計算離散程度。多練習幾題,規律自然就會變得清晰明瞭!