歡迎來到「置信區間」的世界!

在你之前的統計學學習中,你可能已經習慣計算出一個單一數值來估計總體參數——比如學生的平均身高或蘋果的平均重量。我們稱之為點估計 (point estimate)。但說實話:單一的數字很少會完全準確。

在本章中,我們將從「猜測單一數字」轉變為「提供一個可能範圍」。這就是我們所說的置信區間 (Confidence Interval, CI)。你可以把它想像成一個「安全網」。與其說「我認為平均值剛好是 50」,不如說「我有 95% 的把握,真實平均值介於 48 到 52 之間」。

看完這些筆記後,你將能精確地為任何情況構建這些「安全網」,無論你面對的是海量的數據集還是極小的樣本。

1. 基礎:已知變異數的常態分佈 (SH1)

這是我們的起點。當我們知道總體服從常態分佈 (normally distributed),且最重要的一點是,我們已經知道總體變異數 (\(\sigma^2\)) 時,我們就會使用這種方法。

公式

要計算平均值 (\(\mu\)) 的置信區間,我們使用:
\( \bar{x} \pm z \left( \frac{\sigma}{\sqrt{n}} \right) \)

其中:
\(\bar{x}\) 是樣本平均值(區間的中點)。
\(z\)臨界值 (critical value)(代表你需要向兩側延伸多少個標準差,以達到所需的置信水平)。
\(\sigma\) 是總體標準差。
\(n\) 是樣本大小。
\(\frac{\sigma}{\sqrt{n}}\) 被稱為標準誤 (Standard Error)

需要記住的常見 \(z\) 值

你可以在公式手冊中找到這些數值,但記住它們會很有幫助:
• 90% 置信水平:\(z = 1.645\)
• 95% 置信水平:\(z = 1.960\)
• 99% 置信水平:\(z = 2.576\)

比喻:把樣本平均值 (\(\bar{x}\)) 想成你站立的位置,而 \(z \left( \frac{\sigma}{\sqrt{n}} \right)\) 部分則是你可以向兩側伸展手臂的長度。你想要的置信度越高,你就必須伸得越開!

快速回顧:要讓區間更窄(更精確),你可以增加樣本大小 (\(n\)) 或者降低置信水平

2. 面對現實:未知變異數的大樣本 (SH2)

在現實生活中,我們幾乎從來不知道真實的總體變異數 (\(\sigma^2\))。如果我們擁有大樣本(通常 \(n > 30\)),我們可以使用一個聰明的變通方法。

「大樣本」技巧

由於樣本很大,中央極限定理 (Central Limit Theorem) 告訴我們,樣本平均值的分佈將近似於常態分佈。既然我們不知道 \(\sigma\),我們就用樣本標準差 (\(s\)) 來代替它。

公式看起來幾乎一樣:
\( \bar{x} \pm z \left( \frac{s}{\sqrt{n}} \right) \)

如果這讓你覺得像在「作弊」,別擔心!當 \(n\) 很大時,樣本標準差是總體標準差一個非常可靠的「替代品」。

重點總結:大樣本 (\(n > 30\)) + 未知變異數 = 使用 \(z\) 並以 \(s\) 取代 \(\sigma\)。

3. 「謹慎」的方法:小樣本與 \(t\) 分佈 (SH4)

如果你的樣本很小(例如 \(n = 10\))且你不知道總體變異數怎麼辦?直接使用 \(z\) 會顯得過於「自信」——因為它沒有考慮小樣本帶來的額外不確定性。

這就是我們使用學生 \(t\) 分佈 (Student’s \(t\)-distribution) 的時候。

什麼是 \(t\) 分佈?

\(t\) 分佈看起來像常態分佈,但它的「尾巴較厚」(fatter tails)。這反映了一個事實:在小樣本中,極端值更有可能純粹因為隨機性而出現。

如何使用

1. 檢查自由度 (\(\nu\)):這簡單地等於 \(n - 1\)。
2. 找到\(t\) 值:使用你的置信水平和自由度在統計表中查找。
3. 使用公式:
\( \bar{x} \pm t_{\nu} \left( \frac{s}{\sqrt{n}} \right) \)

記憶口訣:「T for Tiny」(T 代表 Tiny/細小)。如果樣本是細小 (Tiny) 的且你不知道變異數,就使用 T 分佈。

避免常見錯誤:永遠記得使用 \(n - 1\) 作為自由度。如果你有 10 個數據點,請在表中查找 \(\nu = 9\)!

4. 融會貫通:進行統計推論 (SH3)

構建區間只是完成了一半的工作,你還需要解釋它的含義。

情境 A:區間是否支持某個說法?
如果製造商聲稱他們的電池能持續使用 50 小時,而你算出的 95% 置信區間是 \([42, 48]\),那麼數值 50 就在區間之外。這暗示他們的聲稱可能是錯誤的!

情境 B:比較兩個群組。
如果你有 A 組的身高 CI \([160, 170]\) 和 B 組的 CI \([172, 180]\),請注意它們沒有重疊。這為我們提供了強有力的證據,證明 B 組的平均身高較高。

你知道嗎? 95% 置信區間並不意味著平均值有 95% 的機率落在「這特定的一個」區間內。它的意思是,如果我們進行 100 次不同的抽樣並製作出 100 個區間,我們預期其中大約有 95 個會包含真實的總體平均值。

總結檢查清單

在開始做題之前,問自己這三個問題:

1. 我知道總體變異數 (\(\sigma^2\)) 嗎?
• 是:使用 \(z\)。
• 否:進入問題 2。

2. 我的樣本大小 (\(n\)) 是否很大?
• 是 (\(n > 30\)):使用 \(z\),並以 \(s\) 取代 \(\sigma\)。
• 否:使用 \(t\) 分佈。

3. 原始總體是否呈常態分佈?
• 這是小樣本(\(t\) 分佈)的要求。如果題目說「總體呈常態分佈」,那你就準備好可以開始了!

最後小貼士:在將數值代入公式之前,請務必先列出 \(\bar{x}\)、\(n\) 以及你所選取的臨界值(\(z\) 或 \(t\))。這可以防止簡單的計算器錯誤!