Inference using normal and t-distributions

🚀 使用常態分佈與 t 分佈進行推論：學習筆記 (9231 Further Statistics)

歡迎來到進階統計學中最實用且強大的章節之一！本單元的主旨是即使在只有少量數據（樣本）的情況下，也能對龐大的母體做出穩健的決策與預測。

在之前的學習中，你已經廣泛運用了常態分佈（Z 檢定），通常是假設已知母體變異數 ($\sigma^2$) 或樣本數足夠大。但在現實世界中，我們往往不知道 $\sigma^2$，且數據集可能非常小。這時候，t 分佈就能派上用場了！

你將學會如何選擇正確的檢定方法（Z 或 t），並利用它來進行假設檢定，以及建立母體平均值的信賴區間。

1. 快速複習：何時使用 Z 檢定 vs. T 檢定

選擇常態分佈（Z 檢定）還是 t 分佈，取決於兩件事：樣本數 ($n$) 以及你是否知道 母體變異數 ($\sigma^2$)。

常態分佈（Z 檢定）：黃金標準

當我們對母體參數有充分的了解時，我們會依賴標準常態分佈 (Z)。

情況 1：已知母體變異數（無論樣本數 $n$ 為何）。
情況 2：樣本數很大 ($n \ge 30$)，即使母體變異數未知。為什麼？因為中央極限定理 (Central Limit Theorem)；當 $n$ 很大時，樣本變異數 ($s^2$) 是母體變異數 ($\sigma^2$) 的極佳估計值，且抽樣分佈會趨近於常態分佈。

t 分佈：小樣本專家

當我們面臨真正的不確定性時，就會使用 t 分佈。

情況 3：母體變異數未知且樣本數很小 ($n < 30$)。

💡 比喻： 將 Z 檢定想像成一把鋒利且精準的刀，當你清楚知道自己在切什麼時使用；t 分佈則是一把稍微鈍一點的刀，因為你對估計的精確度較沒把握，所以它給出的誤差範圍會稍大一些。

重點總結： 若 $\sigma^2$ 未知且 $n$ 很小，你必須使用 t 分佈。這是 9231 關於平均值推論的核心重點。

2. 理解 t 分佈

a) 什麼是 t 分佈？

t 分佈（或學生 t 分佈）與常態分佈相似：它也是對稱的鐘形曲線，中心點為零。然而，它通常比標準常態分佈 (Z) 更平坦，且尾部更厚 (heavier tails)。這是為了說明在使用樣本變異數 $s^2$ 來估計 $\sigma^2$ 時所引入的額外不確定性。

b) 自由度 ($\nu$)

t 分佈的形狀會根據其自由度 ($\nu$) 而改變。

對於大小為 $n$ 的單一樣本，自由度永遠是：$\nu = n - 1$。
隨著 $\nu$ 增加（即樣本數 $n$ 變大），t 分佈會變得更窄，並逐漸接近標準常態分佈 (Z)。

為什麼是 $n-1$？ 當我們計算樣本平均值 ($\bar{x}$) 來估計變異數時，我們消耗了一個資訊單位（一個自由度）。如果你已經知道 $\bar{x}$ 和 $n-1$ 個數據值，那麼最後一個數值就已經被固定了。因此，只有 $n-1$ 個數值是「可以自由變動的」。

3. 單一母體平均值 ($\mu$) 的推論

當我們從未知變異數 ($\sigma^2$) 的常態母體中取得小樣本 ($n < 30$) 時，我們使用 t 檢定。

a) 假設檢定 (t 檢定)

檢定統計量 $T$ 用來測量樣本平均值 ($\bar{x}$) 與虛無假設 $H_0$ 中設定的預期母體平均值 ($\mu_0$) 之間相差幾個標準誤。

步驟 1：建立假設

範例：$H_0: \mu = 50$ 對應 $H_1: \mu \ne 50$（雙尾檢定）。

步驟 2：計算變異數的無偏估計值 ($s^2$)

母體變異數 $\sigma^2$ 是由無偏樣本變異數 $s^2$ 來估計的。如果你拿到的是原始數據，必須先計算它：

$$s^2 = \frac{1}{n-1} \sum (x - \bar{x})^2$$

步驟 3：計算檢定統計量 T

$$T = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}$$

其中 $s / \sqrt{n}$ 是估計的平均值標準誤。

步驟 4：決定自由度與臨界值

自由度：$\nu = n - 1$。根據 $\nu$ 和顯著水準 ($\alpha$)，在統計表（MF19 第 41 頁）中查出臨界 t 值。

步驟 5：結論

將計算出的 $T$ 與臨界值比較，或將 p 值與 $\alpha$ 比較。若 $|T| > t_{\text{crit}}$，則拒絕 $H_0$。

b) $\mu$ 的信賴區間 (CI)

信賴區間提供了一個範圍，真實的母體平均值 $\mu$ 很可能落在其中。由於 $\sigma^2$ 未知且 $n$ 很小，我們使用 t 分佈的臨界值。

$\mu$ 的 CI 公式為：

$$\bar{x} \pm t_{\text{crit}} \times \frac{s}{\sqrt{n}}$$

$\bar{x}$ 是樣本平均值。
$t_{\text{crit}}$ 是使用 $\nu = n - 1$ 和所需的信賴水準查出的臨界 t 值（例如，對於 95% CI，使用 MF19 t 表中的 0.975 欄位）。
$\frac{s}{\sqrt{n}}$ 是估計的標準誤。

常見錯誤警示！ 請記住，在尋找 95% 信賴區間時，對於雙尾檢定，必須使用對應 $p = 0.975$ 的 t 表數值（因為 $1 - 0.95 = 0.05$，而 $0.05/2 = 0.025$，所以 $p = 1 - 0.025 = 0.975$）。

4. 兩個母體平均值之差 ($\mu_1 - \mu_2$) 的推論

這部分至關重要，要求你正確判斷樣本是獨立 (independent) 還是 相依 (dependent/paired) 的，以及樣本數是大還是小。

情境 A：大樣本 (Z 檢定)

如果兩個樣本數 $n_1$ 和 $n_2$ 都很大 ($\ge 30$)，我們使用常態 (Z) 分佈，並以樣本變異數 $s_1^2$ 和 $s_2^2$ 代替 $\sigma_1^2$ 和 $\sigma_2^2$。

檢定統計量：

$$Z = \frac{(\bar{x}_1 - \bar{x}_2) - 0}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}$$

信賴區間：

$$(\bar{x}_1 - \bar{x}_2) \pm Z_{\text{crit}} \times \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}$$

情境 B：小獨立樣本 (雙樣本 t 檢定)

當我們有兩個來自常態母體的小型獨立樣本，且假設兩母體擁有相同的未知變異數 ($\sigma_1^2 = \sigma_2^2 = \sigma^2$) 時，使用此檢定。

步驟 1：計算合併變異數估計值 ($s_p^2$)

由於我們假設變異數相同，我們將數據「合併 (pool)」以獲得這個共同變異數更好的單一估計值。MF19（第 39 頁）提供的公式為：

$$s_p^2 = \frac{\sum(x_1 - \bar{x}_1)^2 + \sum(x_2 - \bar{x}_2)^2}{n_1 + n_2 - 2}$$

注意：$\sum(x - \bar{x})^2$ 通常稱為離均差平方和 (Sum of Squares, SS)。此公式本質上就是 $(SS_1 + SS_2) / (n_1 + n_2 - 2)$。

步驟 2：計算檢定統計量 T

$$T = \frac{(\bar{x}_1 - \bar{x}_2) - 0}{\sqrt{s_p^2 \left(\frac{1}{n_1} + \frac{1}{n_2}\right)}}$$

步驟 3：自由度 ($\nu$)

當合併兩個獨立樣本時，自由度為個別自由度的總和：

$$\nu = (n_1 - 1) + (n_2 - 1) = n_1 + n_2 - 2$$

步驟 4：$\mu_1 - \mu_2$ 的信賴區間

$$(\bar{x}_1 - \bar{x}_2) \pm t_{\text{crit}} \times \sqrt{s_p^2 \left(\frac{1}{n_1} + \frac{1}{n_2}\right)}$$

別擔心，這剛開始看起來可能有點複雜！ 最困難的部分是計算 $s_p^2$。一旦算出來，其餘步驟就只是將數值代入標準 t 公式，並使用對應的自由度即可。

情境 C：配對樣本 t 檢定 (相依樣本)

當測量結果自然連結（例如比較同一組人的「前」與「後」分數，或比較同卵雙胞胎）時，使用此檢定。

這裡的巧妙技巧是，我們不把它看作兩個獨立的群體；我們將配對分數的差值 (difference) 視為單一樣本。

配對 t 檢定的步驟：

計算每一對的差值 $d$ ($d = x_1 - x_2$)。
計算差值的平均值 $\bar{d}$ 以及差值的標準差 $s_d$。
假設檢定簡化為對差值的單一樣本 t 檢定，檢定平均差值 $\mu_d$ 是否為零（即 $H_0: \mu_d = 0$）。

檢定統計量：

$$T = \frac{\bar{d} - 0}{s_d / \sqrt{n}}$$

其中 $n$ 是配對的數量。

自由度：

$$\nu = n - 1$$

$\mu_d$ 的信賴區間：

$$\bar{d} \pm t_{\text{crit}} \times \frac{s_d}{\sqrt{n}}$$

選擇正確的檢定（總結輔助）：

單一樣本，$\sigma^2$ 已知或 $n$ 大： Z 檢定 (常態)
單一樣本，$\sigma^2$ 未知，$n$ 小： T 檢定 ($\nu = n-1$)
雙樣本，獨立，$n$ 大： Z 檢定 (常態近似)
雙樣本，獨立，$n$ 小： 雙樣本 T 檢定 (合併變異數，$\nu = n_1 + n_2 - 2$)
雙樣本，相依/配對： 配對 T 檢定 (對差值進行單樣本檢定，$\nu = n-1$)

5. 使用信賴區間 (CI)

信賴區間其實就是假設檢定的補充。如果假設的平均值（$\mu_0$ 或 $\mu_1 - \mu_2 = 0$）落在計算出的信賴區間之外，那麼你就會在相應的顯著水準下拒絕虛無假設。

a) 決定正確的 CI 公式

尋找 CI 的過程與選擇假設檢定的過程一致：

識別參數： 你是在估計單一平均值 ($\mu$) 還是平均值之差 ($\mu_1 - \mu_2$)？
識別分佈： 是常態 (Z) 還是 t (T)？（基於 $n$ 的大小及 $\sigma^2$ 的已知情況）。
識別臨界值： 查出 $Z_{\text{crit}}$（從常態分佈表的臨界值部分）或 $t_{\text{crit}}$（從 t 表中使用對應的自由度）。

任何信賴區間的結構都是：

$$(\text{點估計值}) \pm (\text{臨界值}) \times (\text{標準誤})$$

b) 解讀信賴區間

95% 信賴區間並不代表真實母體平均值有 95% 的機率落在此特定區間內。相反地，它代表如果我們重複抽樣程序多次，所構建的 95% 的信賴區間都將包含真實的母體平均值。

範例：如果方法 A 與方法 B 之間平均值差的 95% CI 為 (2.5, 4.1)，由於此區間不包含零，我們可以有 95% 的信心認為方法 A 優於方法 B。

c) 你知道嗎？

t 分佈是由 William Sealy Gosset 於 1908 年首次開發的。他在健力士 (Guinness) 釀酒廠工作，並利用小樣本來監控啤酒的品質。由於公司規定禁止他以本名發表研究，他便以筆名「學生」(Student) 發表，這就是「學生 t 分佈」一詞的由來。

快速複習：必要元素

為了在本章取得成功，請確保你能快速辨識任何問題中的三件事：

樣本是大還是小？
$\sigma^2$ 是已知還是未知？
樣本是獨立還是配對的？

回答這些問題，能立即指引你選擇正確的檢定統計量 (Z 或 T) 以及正確的自由度 ($\nu$)。

持續練習選擇正確的程序，你一定能掌握這個主題！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。

🚀 使用常態分佈與 t 分佈進行推論：學習筆記 (9231 Further Statistics)

1. 快速複習：何時使用 Z 檢定 vs. T 檢定

常態分佈（Z 檢定）：黃金標準

t 分佈：小樣本專家

2. 理解 t 分佈

a) 什麼是 t 分佈？

b) 自由度 (\(\nu\))

3. 單一母體平均值 (\(\mu\)) 的推論

a) 假設檢定 (t 檢定)

b) \(\mu\) 的信賴區間 (CI)

4. 兩個母體平均值之差 (\(\mu_1 - \mu_2\)) 的推論

情境 A：大樣本 (Z 檢定)

情境 B：小獨立樣本 (雙樣本 t 檢定)

步驟 1：計算合併變異數估計值 (\(s_p^2\))