Estimation, confidence intervals and tests using a normal distribution - Further Mathematics (9FM0) - Pearson Edexcel A Level

歡迎來到「估計與置信區間」的世界！

在這一章，我們將學習如何成為「數學偵探」。在現實世界中，我們幾乎不可能完全了解一個群體（例如地球上每個人的確切平均身高）。相反地，我們會抽取一個樣本 (sample)，並利用它來推測總體 (population) 的情況。這個過程就稱為估計 (estimation)。

別擔心，即使某些公式乍看之下很嚇人，我們也會一步步拆解。學完之後，你將能夠準確地計算出你對統計猜測的「信心程度」有多高！

1. 估計量：做出最佳預測

估計量 (estimator) 就像是用來預測總體參數的規則或公式。而估計值 (estimate) 則是當你代入數據後所得到的實際數值。

偏差與不偏估計量

想像你在練習射箭。如果你的箭總是偏向靶心的左邊，那麼你的瞄準就是有偏差 (biased) 的。在統計學中，我們追求的是不偏估計量 (unbiased estimators)。這意味著如果我們進行非常多次的取樣，所有估計值的平均數將會等於真正的總體數值。

你需要掌握兩個重要的不偏估計量：

樣本平均數 (\(\bar{x}\))： 這是總體平均數 (\(\mu\)) 的不偏估計量。它其實就是數據的平均值！
樣本變異數 (\(s^2\))： 為了讓樣本變異數成為不偏估計量，我們必須將分母設為 \(n - 1\) 而非單純的 \(n\)。

不偏樣本變異數的公式：
\(s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2\)

小複習： 為什麼要用 \(n - 1\)？除以 \(n - 1\)（即所謂的貝索修正 Bessel's correction）會稍微增大結果。這是為了彌補小樣本的離散程度通常比整個總體還要小的現象。

估計量的品質

我們該如何在兩個不同的不偏估計量之間做選擇呢？我們會看它們的變異數 (variance)。一個「好」的估計量不僅是不偏的，還要有較小的變異數。
類比： 想像兩位射手。兩者平均來說都能射中靶心，但射手 A 的箭都緊密地聚在一起，而射手 B 的箭則是四處散落。射手 A 是較佳的「估計量」，因為他更穩定！

關鍵要點： 我們希望估計量是不偏 (unbiased) 的，且具有最小變異數 (minimum variance)。

2. 置信區間：你的「安全網」

置信區間 (confidence interval) 是一個數值範圍，我們相當確定真實的總體平均數就落在其中。我們不會說「平均數剛好是 50」，而是說「我們有 95% 的信心認為平均數介於 48 到 52 之間」。

如何解讀（最容易搞混的部分！）

學生在這裡常犯一個錯誤。「95% 置信區間」並不意味著總體平均數有 95% 的機率落在該特定區間內。
它的真正含義是：「如果我們進行多次取樣，並為每一個樣本建立一個置信區間，那麼其中 95% 的區間會包含真正的總體平均數。」

計算常態分佈平均數的置信區間

當總體變異數 (\(\sigma^2\)) 已知時，我們使用常態分佈來找出邊界：

\(\bar{x} \pm z \frac{\sigma}{\sqrt{n}}\)

\(\bar{x}\)：你的樣本平均數。
\(z\)：臨界值 (critical value)（取決於你的置信水平，例如 95% 對應 1.96）。
\(\frac{\sigma}{\sqrt{n}}\)：這稱為標準誤 (Standard Error)。它告訴我們樣本平均數的變異程度。

步驟指引：
1. 找出樣本平均數 (\(\bar{x}\))。
2. 確認總體標準差 (\(\sigma\)) 和樣本大小 (\(n\))。
3. 選擇你的置信水平（例如 95%）並從表中找出對應的 \(z\) 值。
4. 計算誤差邊際 (error margin)：\(z \times \frac{\sigma}{\sqrt{n}}\)。
5. 將此值加減到 \(\bar{x}\)，即可得到你的區間邊界。

你知道嗎？ 當樣本大小 (\(n\)) 變大時，你的置信區間會變得更窄。這很合乎邏輯：數據越多，你就越能確定答案！

關鍵要點： 置信區間提供了一個參數的合理數值範圍，其寬度由標準誤和置信水平共同決定。

3. 假設檢定：兩個平均數之間的差異

有時我們想比較兩個不同的組別——例如，「A 班學生的成績是否比 B 班高？」

場景設定

如果我們有兩個獨立的常態總體，且變異數已知 (\(\sigma_x^2\) 和 \(\sigma_y^2\))，我們可以檢定它們平均數的差異是否為特定值（通常為零）。

虛無假設 (\(H_0\))： \(\mu_x - \mu_y = D\) (通常 \(D=0\))。
檢定統計量 (Test Statistic)：
\(Z = \frac{(\bar{X} - \bar{Y}) - (\mu_x - \mu_y)}{\sqrt{\frac{\sigma_x^2}{n_x} + \frac{\sigma_y^2}{n_y}}}\)

此統計量服從標準常態分佈 \(Z \sim N(0, 1)\)。

避開常見錯誤： 如果題目給的是 \(\sigma\) 而不是 \(\sigma^2\)，別忘了要平方！另外，即使是在檢定差異，分母中的變異數也務必使用相加的邏輯。

4. 大樣本與中央極限定理 (CLT)

如果總體不是常態分佈，或者我們不知道總體變異數 (\(\sigma^2\)) 怎麼辦？

如果樣本大小 (\(n\)) 很大（通常 \(n > 30\)），中央極限定理 (Central Limit Theorem) 將成為你的救星！它告訴我們，無論原始總體的形態如何，樣本平均數的分佈都會趨近於常態分佈。

大樣本下的未知變異數

如果我們不知道 \(\sigma^2\)，我們可以使用不偏樣本變異數 (\(s^2\)) 來替代。檢定統計量或置信區間的公式基本保持不變，只需將 \(\sigma^2\) 換成 \(s^2\) 即可：

\(Z \approx \frac{(\bar{X} - \bar{Y}) - (\mu_x - \mu_y)}{\sqrt{\frac{s_x^2}{n_x} + \frac{s_y^2}{n_y}}}\)

小複習方塊：
- 小樣本 + 變異數已知： 使用 \(Z\) (常態分佈)。
- 大樣本 + 變異數未知： 使用 \(Z\) (常態分佈)，並以 \(s^2\) 取代 \(\sigma^2\)（得益於中央極限定理）。
- 標準誤： 計算永遠涉及除以 \(\sqrt{n}\)。

關鍵要點： 對於大樣本，我們可以將樣本變異數視為總體變異數，並使用常態分佈的方法進行檢定和建立區間。

關鍵詞彙總結

參數 (Parameter)： 描述整個總體的數值（例如 \(\mu\)）。
統計量 (Statistic)： 從樣本計算出來的數值（例如 \(\bar{x}\)）。
不偏 (Unbiased)： 平均而言，估計量能準確命中真實數值。
標準誤 (Standard Error)： 估計量的標準差（通常為 \(\frac{\sigma}{\sqrt{n}}\)）。
中央極限定理 (Central Limit Theorem)： 那個允許我們在大樣本下使用常態分佈的「魔法」規則。

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。