學習筆記:估計 (Estimation, FS2.3)

你好!歡迎來到「估計」這一章!FS2 統計學中的這一部分非常重要,因為它讓我們不再局限於計算樣本統計量,而是進一步幫助我們對整個母體做出有根據的推斷。

在現實世界中,我們很少有時間或資源去測量每一個人或每一件物品(即整個母體)。因此,我們通常會選取一個樣本。估計就是一種技術,讓我們利用樣本資訊(例如樣本平均值 \(\bar{x}\))來有信心地預測真實且未知的母體參數(例如母體平均值 \(\mu\))。

如果這些概念聽起來很抽象,不用擔心!我們將使用熟悉的統計概念(如常態分佈和 \(t\)-分佈),將這個過程拆解為清晰且易於掌握的步驟。

什麼是估計?點估計與區間估計

1. 點估計(複習)

在 FS2.2 中,我們學過點估計。點估計是指用一個單一數值來估計母體參數。

  • 母體平均值 (\(\mu\)) 的最佳點估計是樣本平均值 (\(\bar{x}\))。
  • 母體變異數 (\(\sigma^2\)) 的最佳點估計是不偏樣本變異數 (\(s^2\))。

例子:如果你測量了大學裡 50 名學生的身高,算出的平均值為 170 cm,那麼 170 cm 就是該大學所有學生平均身高的點估計值。

2. 區間估計(FS2.3 的重點)

點估計幾乎肯定是不準確的!真實的母體平均值可能是 170.1 cm 或 169.9 cm,但幾乎不可能是精確的 170.0 cm。

區間估計(或稱置信區間)為我們提供了一個數值範圍,真實的母體參數很可能落在此範圍內。

重點總結:與其說「我認為平均值剛好是 170 cm」,我們改說「我有 95% 的把握,真實的平均值位於 168 cm 到 172 cm 之間」。

置信區間 (CI) 的概念

1. 定義置信區間

置信區間 (Confidence Interval, CI) 是根據樣本數據計算得出的一個區間,該區間有特定的置信水平,能涵蓋真實的母體參數。

本課程大綱僅著重於關於平均值對稱的置信區間。這意味著你的最佳估計值(\(\bar{x}\))剛好位於區間的正中央。

其結構永遠是:

置信區間 = 點估計 \(\pm\) 誤差範圍 (E)

誤差範圍 (E) 捕捉了因使用樣本而非整個母體而產生的不確定性。

2. 理解置信水平

置信水平(例如 90%, 95%, 99%)告訴你對於該區間包含真實平均值有多大的把握。

類比:捕魚網
想像真實的母體平均值 (\(\mu\)) 是海裡的一條魚。你的樣本平均值 (\(\bar{x}\)) 是你船所在的位置。而置信區間就是你的漁網。

  • 如果你使用 90% CI(較窄的網),你可能更容易漏掉那條魚(有 10% 的機率漏掉)。
  • 如果你使用 99% CI(非常寬的網),你幾乎肯定能抓到魚(只有 1% 的漏網機率)。

區間越寬,置信度越高,但資訊的精確度就越低!

3. 標準誤與臨界值

要計算誤差範圍 \(E\),我們需要兩個要素:

標準誤 (\(\sigma_{\bar{X}}\))

這是平均值抽樣分佈的標準差。它衡量樣本平均值預期會偏離母體平均值的程度。

\[ \sigma_{\bar{X}} = \frac{\sigma}{\sqrt{n}} \]

其中 \(\sigma\) 是母體標準差,\(n\) 是樣本大小。

臨界值 (z 或 t)

這個值根據你選擇的置信水平決定了區間的寬度。

  • 對於 95% 的 CI,我們在分佈的上尾留出 2.5%,下尾留出 2.5%。
  • 臨界值就是對應於該尾部面積的 \(z\) 分數或 \(t\) 分數。

在 95% 置信水平下,臨界 Z-值1.96。(從 FS1 開始你應該對這個值非常熟悉!)

快速複習:誤差範圍公式

\[ E = \text{臨界值} \times \text{標準誤} \]

計算置信區間:三種主要情境

我們所使用的分佈(進而決定臨界值)完全取決於兩件事:母體變異數 (\(\sigma^2\)) 是否已知?以及樣本大小 (\(n\)) 是多少?

情境 1:已知變異數 (\(\sigma^2\)) 的常態分佈

如果我們已知母體變異數 \(\sigma^2\)(或標準差 \(\sigma\)),無論樣本大小 \(n\) 為何,我們始終使用 Z-分佈(常態分佈)

公式 (Z-區間):

\[ \bar{x} \pm z \times \frac{\sigma}{\sqrt{n}} \]

情境 2:大樣本 (\(n \geq 30\))

如果樣本很大(通常 \(n \geq 30\)),中央極限定理 (CLT) 保證了平均值的抽樣分佈近似為常態分佈。

即使 \(\sigma\) 未知,對於大樣本,我們可以用樣本標準差 (\(s\)) 代替 \(\sigma\)。我們依然使用 Z-分佈

公式 (大樣本的 Z-區間):

\[ \bar{x} \pm z \times \frac{s}{\sqrt{n}} \]

(記得:課程大綱確認在大樣本下,無論變異數已知或未知,我們都使用常態近似。)

情境 3:小樣本 (\(n < 30\)) 且未知變異數 (\(\sigma^2\))

這是最棘手的情況。如果樣本很小且母體變異數 \(\sigma^2\) 未知,使用常態分佈會低估不確定性。

因此,我們使用 \(t\)-分佈 (Student's \(t\)-distribution)。

  • \(t\)-分佈比 Z-分佈更寬、更扁平,這能提供更大的誤差範圍,以彌補因使用 \(s\) 來估計 \(\sigma\) 所產生的額外不確定性。
  • 它需要計算自由度 (\(\nu\)):\(\nu = n - 1\)。
  • 我們使用 \(\nu\) 和置信水平在 \(t\)-分佈表中查出臨界 \(t\)-值。

公式 (t-區間):

\[ \bar{x} \pm t_{\nu} \times \frac{s}{\sqrt{n}} \]

⚠ 常見錯誤警示:Z 與 t 的選擇 ⚠

在選擇臨界值之前,請務必確認這兩個事實:

  1. \(\sigma\) 是否已知? 是 -> 使用 Z。
  2. \(\sigma\) 是否未知? 檢查 \(n\)。若 \(n \geq 30\) -> 使用 Z (CLT 適用)。若 \(n < 30\) -> 使用 t (需考慮額外的不確定性)。

推論與樣本大小估計

1. 從置信區間進行推論

置信區間提供了一種對母體平均值 (\(\mu\)) 進行假設檢定的簡便方法。這有時被稱為「觀察法檢定」。

假設我們為 \(\mu\) 構建了一個 95% 的置信區間。我們隨後可以使用該區間來檢定虛無假設 \(H_0: \mu = \mu_0\)。

規則:

  • 如果假設的平均值 (\(\mu_0\)) 落在置信區間內,則在相應的顯著性水平下,沒有理由拒絕 \(H_0\)
  • 如果假設的平均值 (\(\mu_0\)) 落在置信區間外,則在相應的顯著性水平下,我們拒絕 \(H_0\)

例子:如果 95% CI 是 [168, 172],而有人聲稱 \(\mu_0 = 175\),由於 175 在區間之外,我們在 5% 的顯著性水平下拒絕該聲稱。

2. 估計樣本大小 (\(n\))

在規劃研究時,我們通常需要知道要取得特定的誤差範圍 (\(E\)) 和給定的置信水平,需要多大的樣本。

由於誤差範圍為 \(E = z \times \frac{\sigma}{\sqrt{n}}\),我們可以重新排列公式來求出 \(n\):

\[ \sqrt{n} = \frac{z\sigma}{E} \]

\[ n = \left(\frac{z\sigma}{E}\right)^2 \]

在這種情況下,我們必須使用 Z-臨界值,因為我們假設樣本收集後將適用 CLT。此外,我們必須有一個 \(\sigma\) 的估計值(來自過往的研究或先導樣本)。

關鍵步驟:向上取整
由於樣本大小 \(n\) 必須是整數,計算結果務必向上取整。如果 \(n = 100.1\),你需要 101 個樣本。如果向下取整至 100,將無法達到預期的精確度。

✓ 本章重點總結

  • 目標:利用樣本平均值 (\(\bar{x}\)) 為真實母體平均值 (\(\mu\)) 建立一個區間 (CI)。
  • 公式結構: \(\bar{x} \pm (\text{臨界值} \times \frac{\text{標準差}}{\sqrt{n}})\)。
  • Z-檢定條件:當 \(\sigma\) 已知 或 \(n \geq 30\) 時使用。
  • T-檢定條件:當 \(\sigma\) 未知 且 \(n < 30\) 時使用。自由度 \(\nu = n-1\)。
  • 推論:若假設的平均值 \(\mu_0\) 在 CI 之外,則拒絕 \(H_0\)。
  • 樣本大小:計算 \(n = \left(\frac{z\sigma}{E}\right)^2\),並務必向上取整至下一個整數。