🚀 使用常態分佈與 t 分佈進行推論:學習筆記 (9231 Further Statistics)
歡迎來到進階統計學中最實用且強大的章節之一!本單元的主旨是即使在只有少量數據(樣本)的情況下,也能對龐大的母體做出穩健的決策與預測。
在之前的學習中,你已經廣泛運用了常態分佈(Z 檢定),通常是假設已知母體變異數 (\(\sigma^2\)) 或樣本數足夠大。但在現實世界中,我們往往不知道 \(\sigma^2\),且數據集可能非常小。這時候,t 分佈就能派上用場了!
你將學會如何選擇正確的檢定方法(Z 或 t),並利用它來進行假設檢定,以及建立母體平均值的信賴區間。
1. 快速複習:何時使用 Z 檢定 vs. T 檢定
選擇常態分佈(Z 檢定)還是 t 分佈,取決於兩件事:樣本數 (\(n\)) 以及你是否知道 母體變異數 (\(\sigma^2\))。
常態分佈(Z 檢定):黃金標準
當我們對母體參數有充分的了解時,我們會依賴標準常態分佈 (Z)。
- 情況 1:已知母體變異數(無論樣本數 \(n\) 為何)。
- 情況 2:樣本數很大 (\(n \ge 30\)),即使母體變異數未知。為什麼?因為中央極限定理 (Central Limit Theorem);當 \(n\) 很大時,樣本變異數 (\(s^2\)) 是母體變異數 (\(\sigma^2\)) 的極佳估計值,且抽樣分佈會趨近於常態分佈。
t 分佈:小樣本專家
當我們面臨真正的不確定性時,就會使用 t 分佈。
- 情況 3:母體變異數未知 且 樣本數很小 (\(n < 30\))。
💡 比喻: 將 Z 檢定想像成一把鋒利且精準的刀,當你清楚知道自己在切什麼時使用;t 分佈則是一把稍微鈍一點的刀,因為你對估計的精確度較沒把握,所以它給出的誤差範圍會稍大一些。
2. 理解 t 分佈
a) 什麼是 t 分佈?
t 分佈(或學生 t 分佈)與常態分佈相似:它也是對稱的鐘形曲線,中心點為零。然而,它通常比標準常態分佈 (Z) 更平坦,且尾部更厚 (heavier tails)。這是為了說明在使用樣本變異數 \(s^2\) 來估計 \(\sigma^2\) 時所引入的額外不確定性。
b) 自由度 (\(\nu\))
t 分佈的形狀會根據其自由度 (\(\nu\)) 而改變。
- 對於大小為 \(n\) 的單一樣本,自由度永遠是:\(\nu = n - 1\)。
- 隨著 \(\nu\) 增加(即樣本數 \(n\) 變大),t 分佈會變得更窄,並逐漸接近標準常態分佈 (Z)。
為什麼是 \(n-1\)? 當我們計算樣本平均值 (\(\bar{x}\)) 來估計變異數時,我們消耗了一個資訊單位(一個自由度)。如果你已經知道 \(\bar{x}\) 和 \(n-1\) 個數據值,那麼最後一個數值就已經被固定了。因此,只有 \(n-1\) 個數值是「可以自由變動的」。
3. 單一母體平均值 (\(\mu\)) 的推論
當我們從未知變異數 (\(\sigma^2\)) 的常態母體中取得小樣本 (\(n < 30\)) 時,我們使用 t 檢定。
a) 假設檢定 (t 檢定)
檢定統計量 \(T\) 用來測量樣本平均值 (\(\bar{x}\)) 與虛無假設 \(H_0\) 中設定的預期母體平均值 (\(\mu_0\)) 之間相差幾個標準誤。
步驟 1:建立假設
範例:\(H_0: \mu = 50\) 對應 \(H_1: \mu \ne 50\)(雙尾檢定)。
步驟 2:計算變異數的無偏估計值 (\(s^2\))
母體變異數 \(\sigma^2\) 是由無偏樣本變異數 \(s^2\) 來估計的。如果你拿到的是原始數據,必須先計算它:
$$s^2 = \frac{1}{n-1} \sum (x - \bar{x})^2$$
步驟 3:計算檢定統計量 T
$$T = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}$$
其中 \(s / \sqrt{n}\) 是估計的平均值標準誤。
步驟 4:決定自由度與臨界值
自由度:\(\nu = n - 1\)。根據 \(\nu\) 和顯著水準 (\(\alpha\)),在統計表(MF19 第 41 頁)中查出臨界 t 值。
步驟 5:結論
將計算出的 \(T\) 與臨界值比較,或將 p 值與 \(\alpha\) 比較。若 \(|T| > t_{\text{crit}}\),則拒絕 \(H_0\)。
b) \(\mu\) 的信賴區間 (CI)
信賴區間提供了一個範圍,真實的母體平均值 \(\mu\) 很可能落在其中。由於 \(\sigma^2\) 未知且 \(n\) 很小,我們使用 t 分佈的臨界值。
\(\mu\) 的 CI 公式為:
$$\bar{x} \pm t_{\text{crit}} \times \frac{s}{\sqrt{n}}$$
- \(\bar{x}\) 是樣本平均值。
- \(t_{\text{crit}}\) 是使用 \(\nu = n - 1\) 和所需的信賴水準查出的臨界 t 值(例如,對於 95% CI,使用 MF19 t 表中的 0.975 欄位)。
- \(\frac{s}{\sqrt{n}}\) 是估計的標準誤。
4. 兩個母體平均值之差 (\(\mu_1 - \mu_2\)) 的推論
這部分至關重要,要求你正確判斷樣本是獨立 (independent) 還是 相依 (dependent/paired) 的,以及樣本數是大還是小。
情境 A:大樣本 (Z 檢定)
如果兩個樣本數 \(n_1\) 和 \(n_2\) 都很大 (\(\ge 30\)),我們使用常態 (Z) 分佈,並以樣本變異數 \(s_1^2\) 和 \(s_2^2\) 代替 \(\sigma_1^2\) 和 \(\sigma_2^2\)。
檢定統計量:
$$Z = \frac{(\bar{x}_1 - \bar{x}_2) - 0}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}$$
信賴區間:
$$(\bar{x}_1 - \bar{x}_2) \pm Z_{\text{crit}} \times \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}$$
情境 B:小獨立樣本 (雙樣本 t 檢定)
當我們有兩個來自常態母體的小型獨立樣本,且假設兩母體擁有相同的未知變異數 (\(\sigma_1^2 = \sigma_2^2 = \sigma^2\)) 時,使用此檢定。
步驟 1:計算合併變異數估計值 (\(s_p^2\))
由於我們假設變異數相同,我們將數據「合併 (pool)」以獲得這個共同變異數更好的單一估計值。MF19(第 39 頁)提供的公式為:
$$s_p^2 = \frac{\sum(x_1 - \bar{x}_1)^2 + \sum(x_2 - \bar{x}_2)^2}{n_1 + n_2 - 2}$$
注意:\(\sum(x - \bar{x})^2\) 通常稱為離均差平方和 (Sum of Squares, SS)。此公式本質上就是 \((SS_1 + SS_2) / (n_1 + n_2 - 2)\)。
步驟 2:計算檢定統計量 T
$$T = \frac{(\bar{x}_1 - \bar{x}_2) - 0}{\sqrt{s_p^2 \left(\frac{1}{n_1} + \frac{1}{n_2}\right)}}$$
步驟 3:自由度 (\(\nu\))
當合併兩個獨立樣本時,自由度為個別自由度的總和:
$$\nu = (n_1 - 1) + (n_2 - 1) = n_1 + n_2 - 2$$
步驟 4:\(\mu_1 - \mu_2\) 的信賴區間
$$(\bar{x}_1 - \bar{x}_2) \pm t_{\text{crit}} \times \sqrt{s_p^2 \left(\frac{1}{n_1} + \frac{1}{n_2}\right)}$$
別擔心,這剛開始看起來可能有點複雜! 最困難的部分是計算 \(s_p^2\)。一旦算出來,其餘步驟就只是將數值代入標準 t 公式,並使用對應的自由度即可。
情境 C:配對樣本 t 檢定 (相依樣本)
當測量結果自然連結(例如比較同一組人的「前」與「後」分數,或比較同卵雙胞胎)時,使用此檢定。
這裡的巧妙技巧是,我們不把它看作兩個獨立的群體;我們將配對分數的差值 (difference) 視為單一樣本。
配對 t 檢定的步驟:
- 計算每一對的差值 \(d\) (\(d = x_1 - x_2\))。
- 計算差值的平均值 \(\bar{d}\) 以及差值的標準差 \(s_d\)。
- 假設檢定簡化為對差值的單一樣本 t 檢定,檢定平均差值 \(\mu_d\) 是否為零(即 \(H_0: \mu_d = 0\))。
檢定統計量:
$$T = \frac{\bar{d} - 0}{s_d / \sqrt{n}}$$
其中 \(n\) 是配對的數量。
自由度:
$$\nu = n - 1$$
\(\mu_d\) 的信賴區間:
$$\bar{d} \pm t_{\text{crit}} \times \frac{s_d}{\sqrt{n}}$$
- 單一樣本,\(\sigma^2\) 已知或 \(n\) 大: Z 檢定 (常態)
- 單一樣本,\(\sigma^2\) 未知,\(n\) 小: T 檢定 (\(\nu = n-1\))
- 雙樣本,獨立,\(n\) 大: Z 檢定 (常態近似)
- 雙樣本,獨立,\(n\) 小: 雙樣本 T 檢定 (合併變異數,\(\nu = n_1 + n_2 - 2\))
- 雙樣本,相依/配對: 配對 T 檢定 (對差值進行單樣本檢定,\(\nu = n-1\))
5. 使用信賴區間 (CI)
信賴區間其實就是假設檢定的補充。如果假設的平均值(\(\mu_0\) 或 \(\mu_1 - \mu_2 = 0\))落在計算出的信賴區間之外,那麼你就會在相應的顯著水準下拒絕虛無假設。
a) 決定正確的 CI 公式
尋找 CI 的過程與選擇假設檢定的過程一致:
- 識別參數: 你是在估計單一平均值 (\(\mu\)) 還是平均值之差 (\(\mu_1 - \mu_2\))?
- 識別分佈: 是常態 (Z) 還是 t (T)?(基於 \(n\) 的大小及 \(\sigma^2\) 的已知情況)。
- 識別臨界值: 查出 \(Z_{\text{crit}}\)(從常態分佈表的臨界值部分)或 \(t_{\text{crit}}\)(從 t 表中使用對應的自由度)。
任何信賴區間的結構都是:
$$(\text{點估計值}) \pm (\text{臨界值}) \times (\text{標準誤})$$
b) 解讀信賴區間
95% 信賴區間並不代表真實母體平均值有 95% 的機率落在此特定區間內。相反地,它代表如果我們重複抽樣程序多次,所構建的 95% 的信賴區間都將包含真實的母體平均值。
範例:如果方法 A 與方法 B 之間平均值差的 95% CI 為 (2.5, 4.1),由於此區間不包含零,我們可以有 95% 的信心認為方法 A 優於方法 B。
c) 你知道嗎?
t 分佈是由 William Sealy Gosset 於 1908 年首次開發的。他在健力士 (Guinness) 釀酒廠工作,並利用小樣本來監控啤酒的品質。由於公司規定禁止他以本名發表研究,他便以筆名「學生」(Student) 發表,這就是「學生 t 分佈」一詞的由來。
為了在本章取得成功,請確保你能快速辨識任何問題中的三件事:
- 樣本是大還是小?
- \(\sigma^2\) 是已知還是未知?
- 樣本是獨立還是配對的?
回答這些問題,能立即指引你選擇正確的檢定統計量 (Z 或 T) 以及正確的自由度 (\(\nu\))。
持續練習選擇正確的程序,你一定能掌握這個主題!