Confidence Intervals - Further Mathematics 7367 - AQA A Level

歡迎來到「置信區間」的世界！

在你之前的統計學學習中，你可能已經習慣計算出一個單一數值來估計總體參數——比如學生的平均身高或蘋果的平均重量。我們稱之為點估計 (point estimate)。但說實話：單一的數字很少會完全準確。

在本章中，我們將從「猜測單一數字」轉變為「提供一個可能範圍」。這就是我們所說的置信區間 (Confidence Interval, CI)。你可以把它想像成一個「安全網」。與其說「我認為平均值剛好是 50」，不如說「我有 95% 的把握，真實平均值介於 48 到 52 之間」。

看完這些筆記後，你將能精確地為任何情況構建這些「安全網」，無論你面對的是海量的數據集還是極小的樣本。

1. 基礎：已知變異數的常態分佈 (SH1)

這是我們的起點。當我們知道總體服從常態分佈 (normally distributed)，且最重要的一點是，我們已經知道總體變異數 (\(\sigma^2\)) 時，我們就會使用這種方法。

公式

要計算平均值 (\(\mu\)) 的置信區間，我們使用：
\( \bar{x} \pm z \left( \frac{\sigma}{\sqrt{n}} \right) \)

其中：
• \(\bar{x}\) 是樣本平均值（區間的中點）。
• \(z\) 是臨界值 (critical value)（代表你需要向兩側延伸多少個標準差，以達到所需的置信水平）。
• \(\sigma\) 是總體標準差。
• \(n\) 是樣本大小。
• \(\frac{\sigma}{\sqrt{n}}\) 被稱為標準誤 (Standard Error)。

需要記住的常見 \(z\) 值

你可以在公式手冊中找到這些數值，但記住它們會很有幫助：
• 90% 置信水平：\(z = 1.645\)
• 95% 置信水平：\(z = 1.960\)
• 99% 置信水平：\(z = 2.576\)

比喻：把樣本平均值 (\(\bar{x}\)) 想成你站立的位置，而 \(z \left( \frac{\sigma}{\sqrt{n}} \right)\) 部分則是你可以向兩側伸展手臂的長度。你想要的置信度越高，你就必須伸得越開！

快速回顧：要讓區間更窄（更精確），你可以增加樣本大小 (\(n\)) 或者降低置信水平。

2. 面對現實：未知變異數的大樣本 (SH2)

在現實生活中，我們幾乎從來不知道真實的總體變異數 (\(\sigma^2\))。如果我們擁有大樣本（通常 \(n > 30\)），我們可以使用一個聰明的變通方法。

「大樣本」技巧

由於樣本很大，中央極限定理 (Central Limit Theorem) 告訴我們，樣本平均值的分佈將近似於常態分佈。既然我們不知道 \(\sigma\)，我們就用樣本標準差 (\(s\)) 來代替它。

公式看起來幾乎一樣：
\( \bar{x} \pm z \left( \frac{s}{\sqrt{n}} \right) \)

如果這讓你覺得像在「作弊」，別擔心！當 \(n\) 很大時，樣本標準差是總體標準差一個非常可靠的「替代品」。

重點總結：大樣本 (\(n > 30\)) + 未知變異數 = 使用 \(z\) 並以 \(s\) 取代 \(\sigma\)。

3. 「謹慎」的方法：小樣本與 \(t\) 分佈 (SH4)

如果你的樣本很小（例如 \(n = 10\)）且你不知道總體變異數怎麼辦？直接使用 \(z\) 會顯得過於「自信」——因為它沒有考慮小樣本帶來的額外不確定性。

這就是我們使用學生 \(t\) 分佈 (Student’s \(t\)-distribution) 的時候。

什麼是 \(t\) 分佈？

\(t\) 分佈看起來像常態分佈，但它的「尾巴較厚」(fatter tails)。這反映了一個事實：在小樣本中，極端值更有可能純粹因為隨機性而出現。

如何使用

1. 檢查自由度 (\(\nu\))：這簡單地等於 \(n - 1\)。
2. 找到\(t\) 值：使用你的置信水平和自由度在統計表中查找。
3. 使用公式：
\( \bar{x} \pm t_{\nu} \left( \frac{s}{\sqrt{n}} \right) \)

記憶口訣：「T for Tiny」(T 代表 Tiny/細小)。如果樣本是細小 (Tiny) 的且你不知道變異數，就使用 T 分佈。

避免常見錯誤：永遠記得使用 \(n - 1\) 作為自由度。如果你有 10 個數據點，請在表中查找 \(\nu = 9\)！

4. 融會貫通：進行統計推論 (SH3)

構建區間只是完成了一半的工作，你還需要解釋它的含義。

情境 A：區間是否支持某個說法？
如果製造商聲稱他們的電池能持續使用 50 小時，而你算出的 95% 置信區間是 \([42, 48]\)，那麼數值 50 就在區間之外。這暗示他們的聲稱可能是錯誤的！

情境 B：比較兩個群組。
如果你有 A 組的身高 CI \([160, 170]\) 和 B 組的 CI \([172, 180]\)，請注意它們沒有重疊。這為我們提供了強有力的證據，證明 B 組的平均身高較高。

你知道嗎？ 95% 置信區間並不意味著平均值有 95% 的機率落在「這特定的一個」區間內。它的意思是，如果我們進行 100 次不同的抽樣並製作出 100 個區間，我們預期其中大約有 95 個會包含真實的總體平均值。

總結檢查清單

在開始做題之前，問自己這三個問題：

1. 我知道總體變異數 (\(\sigma^2\)) 嗎？
• 是：使用 \(z\)。
• 否：進入問題 2。

2. 我的樣本大小 (\(n\)) 是否很大？
• 是 (\(n > 30\))：使用 \(z\)，並以 \(s\) 取代 \(\sigma\)。
• 否：使用 \(t\) 分佈。

3. 原始總體是否呈常態分佈？
• 這是小樣本（\(t\) 分佈）的要求。如果題目說「總體呈常態分佈」，那你就準備好可以開始了！

最後小貼士：在將數值代入公式之前，請務必先列出 \(\bar{x}\)、\(n\) 以及你所選取的臨界值（\(z\) 或 \(t\)）。這可以防止簡單的計算器錯誤！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。