Estimation, confidence intervals and tests

歡迎來到單元 S3：估計、置信區間與檢定！

你好，未來的統計學家！在這一章，我們將不再僅僅滿足於描述數據，而是要學會對整個母體做出強而有力且資訊充分的推斷。這正是統計推論的核心——利用小樣本來得出關於母體的重大結論。

為什麼這很重要？ 無論你未來從事金融、醫學還是品質管理，你幾乎不可能獲取*所有*的數據。我們利用本章的工具，能以特定的確定性水平（level of certainty）來判定真實數值（例如產品的平均壽命，或偏好某個品牌的人口比例）。掌握這些概念對於你的考試以及現實中的分析工作都至關重要！

1. 點估計量與不偏估計

在統計學中，點估計量 (point estimator) 是一個統計量（樣本數據的函數），我們用它來估計未知的母體參數（例如母體平均值 $\mu$ 或變異數 $\sigma^2$）。

什麼是不偏估計量 (Unbiased Estimator)？

當我們估計一個母體參數時，我們希望估計結果是「公平」的。如果一個估計量在多次重複抽樣下，其平均估計值等於母體真實參數，那麼該估計量就是不偏的 (unbiased)。

想像一下射擊練習。如果你的估計量是不偏的，即使個別射擊（樣本）沒有命中靶心（真實參數），但所有射擊點的平均位置正好就是靶心。

你需要掌握的關鍵估計量包括：

母體平均值 ($\mu$)： 使用樣本平均值 $\bar{X}$ 估計。（$\bar{X}$ 是 $\mu$ 的不偏估計量）。
母體比例 ($p$)： 使用樣本比例 $\hat{p}$ 估計。（$\hat{p}$ 是 $p$ 的不偏估計量）。

關鍵問題：估計變異數

這往往是同學最容易犯錯的地方。我們有兩種主要方法計算樣本變異數，但只有一種是不偏的母體變異數 $\sigma^2$ 估計量。

有偏估計量 ($S^2$)

這是你在基礎統計學中學過的標準公式，即將離差平方和除以 $n$： $$S^2 = \frac{\sum (x_i - \bar{x})^2}{n}$$ 如果你使用 $S^2$ 來估計母體變異數 $\sigma^2$，你的估計值通常會偏小。因此，這是一個有偏估計量 (biased estimator)。

不偏估計量 ($\hat{\sigma}^2$)

為了得到母體變異數的不偏估計，我們需使用自由度 (degrees of freedom)，即 $n-1$ 作為分母進行調整： $$\hat{\sigma}^2 = \frac{\sum (x_i - \bar{x})^2}{n-1}$$ 符號 $\hat{\sigma}^2$ 是母體變異數不偏估計量的標準記法。在 A Level 的術語中，它通常被稱為樣本變異數 (sample variance)。

記憶小撇步：為什麼是 $n-1$？

在計算變異數時，你需要先利用樣本平均值 $\bar{x}$ 來求離差。因為你已經利用數據計算了 $\bar{x}$，你等於「消耗」了一項資訊，只剩下 $n-1$ 個*自由*的資訊量（即自由度）。除以 $n-1$ 正是為了修正這種內在的低估。

估計量重點總結： 對於 $\mu$，務必使用 $\bar{X}$；對於 $p$，使用 $\hat{p}$；而對於 $\sigma^2$，請務必除以 $n-1$ 以獲得最佳（不偏）估計。

2. 置信區間：我們到底在說什麼？

置信區間 (Confidence Interval, CI) 是一個數值範圍，我們基於特定的置信水平（confidence level），相信真實的母體參數就落在這個範圍內。

釣魚類比

想像你正試圖在一個巨大的湖中捕捉一條特定的魚（真實母體平均值 $\mu$）。你看不到這條魚，但你可以根據你抽樣取出的少量水，拋出一個網（即你的置信區間）。

網的大小： 取決於你要求的置信水平（例如 95% 或 99%）。99% 的置信區間（網更大）讓你更有機會抓到魚，但區間也會更寬（精確度較低）。
魚：母體參數 ($\mu$)。它是固定的，但我們未知。

如果你構建了 100 個置信區間（即抽取 100 次樣本並製成 100 個網），95% 的置信水平意味著：其中 95 個網能成功捕捉到真實的母體平均值 $\mu$，其餘 5 個則會落空。

公式結構

所有置信區間都遵循以下結構：

$$ \text{估計值} \pm (\text{臨界值} \times \text{標準誤}) $$

其中 $(\text{臨界值} \times \text{標準誤})$ 被稱為誤差範圍 (Margin of Error)。

你知道嗎？ 科學研究中最常見的置信水平是 95%。這對應的顯著性水平 ($\alpha$) 為 0.05。

3. 計算平均值 ($\mu$) 的置信區間

計算平均值置信區間的方法完全取決於兩個因素：樣本大小 ($n$) 以及母體變異數 ($\sigma^2$) 是否已知。

A. 當母體變異數 ($\sigma^2$) 已知時

若已知母體變異數，無論樣本大小 $n$ 為何，我們都可以利用中央極限定理 (CLT) 使用常態分佈 (Z-scores)。

Z-區間步驟

檢查假設： 母體呈常態分佈，或者 $n$ 足夠大 ($n > 30$)，使 CLT 適用。
識別數值： 找出 $\bar{x}$、$\sigma$、$n$ 以及置信水平。
尋找臨界 Z 值 ($z$)： 使用常態分佈表（或計算機）獲取對應的置信水平。
計算區間： $$ \bar{x} \pm z \times \frac{\sigma}{\sqrt{n}} $$

快速回顧：常見 Z 值：
（這是雙側檢定中經常使用的關鍵數值）：

90% 置信水平： $z = 1.6449$
95% 置信水平： $z = 1.9600$
99% 置信水平： $z = 2.5758$

B. 當母體變異數 ($\sigma^2$) 未知時

當 $\sigma^2$ 未知時，我們必須使用樣本變異數 $\hat{\sigma}^2$ 來估計它。當我們這樣做時（特別是樣本較小時），檢定統計量的分佈不再是常態的，我們需要使用學生 t 分佈 (Student's t-distribution)。

重要提示： $t$ 分佈比常態分佈更寬、更扁，這反映了從樣本數據估計 $\sigma^2$ 所帶來的額外不確定性。

T-區間步驟

檢查假設： 我們必須假設母體為常態分佈。（如果 $n$ 非常大，$t$ 分佈會趨近於常態分佈）。
計算 $\hat{\sigma}$： 使用 $\sqrt{\frac{\sum (x_i - \bar{x})^2}{n-1}}$ 作為 $\hat{\sigma}$。
確定自由度 ($v$)： $v = n-1$。
尋找臨界 T 值 ($t_v$)： 使用 $t$ 分佈表，查閱 $v = n-1$ 及相應置信水平（雙側）。
計算區間： $$ \bar{x} \pm t_v \times \frac{\hat{\sigma}}{\sqrt{n}} $$

如果初次接觸覺得複雜也不用擔心，Z 和 T 的主要差別僅在於你要查哪一個表！記住：變異數未知？就用 T！

4. 比例 ($p$) 的置信區間

如果我們研究的是二元結果（例如成功/失敗、是/否），我們關注的是母體比例 $p$。我們使用樣本比例 $\hat{p}$ 來估計 $p$。

為了讓置信區間有效，我們通常要求樣本量足夠大，即 $n\hat{p} > 5$ 且 $n(1-\hat{p}) > 5$。

比例區間步驟

識別數值： 成功次數 $x$、樣本大小 $n$，以及 $\hat{p} = x/n$。
標準誤： 樣本比例的標準誤計算如下： $$ \text{SE} = \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} $$
尋找臨界 Z 值 ($z$)： 使用常態分佈表（與已知變異數的情況相同）。
計算區間： $$ \hat{p} \pm z \times \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} $$

避免常見錯誤： 在處理比例時，請務必使用 Z 分佈（常態近似），因為當樣本足夠大時，$\hat{p}$ 的分佈近似於常態分佈。

5. 母體變異數 ($\sigma^2$) 的置信區間

有時，數據的離散程度比平均值更重要（例如製造過程中的一致性）。要計算母體變異數 $\sigma^2$ 的置信區間，我們必須假設母體呈常態分佈，並使用卡方 ($\chi^2$) 分佈。

使用的統計量為：

$$ \chi^2 = \frac{(n-1)\hat{\sigma}^2}{\sigma^2} $$

$\chi^2$ 分佈的特性：

僅定義於正數範圍。
非對稱（向右偏斜）。
由自由度 $v = n-1$ 定義。

卡方區間步驟

檢查假設： 母體必須呈常態分佈。
識別數值： 計算不偏變異數估計量 $\hat{\sigma}^2$，以及自由度 $v = n-1$。
尋找臨界 $\chi^2$ 值： 由於分佈不對稱，你需要從 $\chi^2$ 表中找到兩個臨界值（自由度 $v=n-1$）。對於 95% 置信區間：
- $\chi^2_L$: 對應於 $(1 - 0.025) = 0.975$ 的值（左尾）。
- $\chi^2_R$: 對應於 $0.025$ 的值（右尾）。
計算區間（針對 $\sigma^2$）： $$ \left( \frac{(n-1)\hat{\sigma}^2}{\chi^2_{R}}, \frac{(n-1)\hat{\sigma}^2}{\chi^2_{L}} \right) $$

注意順序反轉！ 請留意較小的 $\chi^2_L$ 值用於變異數區間的上限，而較大的 $\chi^2_R$ 值用於下限。這是因為 $\sigma^2$ 位於檢定統計量的分母中。

置信區間分佈選擇總結：

平均值 ($\mu$), 已知 $\sigma$：Z
平均值 ($\mu$), 未知 $\sigma$：T (自由度 $n-1$)
比例 ($p$)：Z
變異數 ($\sigma^2$)：$\chi^2$ (自由度 $n-1$)

6. 單樣本的假設檢定

假設檢定（在之前的模組中已詳細介紹）旨在確定是否有足夠的統計證據來拒絕虛無假設 ($H_0$) 並接受對立假設 ($H_1$)。在 S3 中，我們利用 Z、T 和 $\chi^2$ 分佈來應用這些標準程序。

A. 母體平均值 ($\mu$) 的檢定

程序同樣取決於變異數是否已知：

情況 1：$\sigma^2$ 已知 (Z-檢定)

檢定統計量： $$ Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} $$

我們將計算出的 $Z$ 值與常態分佈中的臨界 $Z$ 值進行比較。

情況 2：$\sigma^2$ 未知 (T-檢定)

我們使用不偏估計量 $\hat{\sigma}$ 作為標準差。

檢定統計量： $$ T = \frac{\bar{X} - \mu_0}{\hat{\sigma} / \sqrt{n}} $$

我們將計算出的 $T$ 值與 $t$ 分佈中的臨界 $T$ 值進行比較，使用自由度 $v = n-1$。

B. 母體變異數 ($\sigma^2$) 的檢定

如果我們想檢定母體變異數是否等於某個指定值 $\sigma_0^2$，我們使用卡方檢定。

假設範例：
$H_0: \sigma^2 = \sigma_0^2$
$H_1: \sigma^2 \neq \sigma_0^2$ (雙側) 或 $H_1: \sigma^2 > \sigma_0^2$ (單側)

檢定統計量 ($\chi^2$)

檢定統計量： $$ \chi^2 = \frac{(n-1)\hat{\sigma}^2}{\sigma_0^2} $$

我們將計算出的 $\chi^2$ 值與表格中的臨界 $\chi^2$ 值進行比較，使用自由度 $v = n-1$。

假設檢定步驟總結：

設定 $H_0$ 與 $H_1$： 清晰地定義虛無假設與對立假設。
設定顯著性水平 ($\alpha$)： 通常為 5% (0.05) 或 1% (0.01)。
計算檢定統計量： 使用適當的公式 (Z, T, 或 $\chi^2$)。
尋找臨界值： 使用正確的分佈表和自由度查表。
得出結論： 將檢定統計量與臨界值比較（或使用 $p$-值）。若檢定統計量落入拒絕域，則拒絕 $H_0$。
語境結論： 寫下與原始問題相關的結論語句。

學習小貼士：置信區間與檢定的連結
一個 95% 的置信區間可以用來進行 5% 顯著性水平的雙側假設檢定。如果假設的數值 ($\mu_0$ 或 $\sigma_0^2$) 落於置信區間之外，則拒絕 $H_0$。如果落於區間內，則不拒絕 $H_0$。

最終重點

整個章節的關鍵在於根據兩點判斷該使用哪種分佈 (Z, T, 或 $\chi^2$)：你正在估計哪個參數 ($\mu$, $p$, 或 $\sigma^2$)，以及母體變異數是否已知。

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。

歡迎來到單元 S3：估計、置信區間與檢定！

1. 點估計量與不偏估計

什麼是不偏估計量 (Unbiased Estimator)？

關鍵問題：估計變異數

有偏估計量 (\(S^2\))

不偏估計量 (\(\hat{\sigma}^2\))

2. 置信區間：我們到底在說什麼？

釣魚類比

公式結構

3. 計算平均值 (\(\mu\)) 的置信區間

A. 當母體變異數 (\(\sigma^2\)) 已知時

Z-區間步驟

B. 當母體變異數 (\(\sigma^2\)) 未知時

T-區間步驟

4. 比例 (\(p\)) 的置信區間

比例區間步驟

5. 母體變異數 (\(\sigma^2\)) 的置信區間

卡方區間步驟

6. 單樣本的假設檢定

A. 母體平均值 (\(\mu\)) 的檢定

情況 1：\(\sigma^2\) 已知 (Z-檢定)

情況 2：\(\sigma^2\) 未知 (T-檢定)

B. 母體變異數 (\(\sigma^2\)) 的檢定

檢定統計量 (\(\chi^2\))

最終重點

立即實踐所學