Sampling and estimation - Mathematics (9709) - Cambridge International A Level

抽樣與估計 (P3 Statistics 2 - Paper 6)

歡迎來到「抽樣與估計」的世界！這一章非常實用，因為它探討了我們如何利用小部分的資訊（*樣本*），來對龐大的群體（*總體*）作出合理的推斷。別擔心，即使起初看到公式覺得很棘手，其實背後的概念非常直觀。本質上，我們正在學習如何在進行統計預測時，確保結果具備統計上的可靠性。

1. 總體與樣本：宏觀視角 vs. 微觀快照

1.1 關鍵定義

總體 (Population)： 你想要研究的整個群體。例如：全國的所有學生、某工廠生產的所有汽車，或是某次收成的所有蘋果。
樣本 (Sample)： 從總體中選取出來的一個小部分。我們研究樣本，是因為研究整個總體通常成本太高、耗時太長，甚至是不可能的任務。
普查 (Census)： 試圖收集總體中每一位成員數據的研究（在實際應用中很少見）。

比喻：想像一鍋巨大的湯（總體）。你舀出一匙（樣本）來品嚐，從而判斷是否需要加鹽（估計總體平均值）。

1.2 隨機性的必要性

為了讓樣本的結果具有意義且在數學上有效，樣本必須是隨機 (random) 抽取的。

隨機樣本 (Random Sample)： 總體中的每一位成員都必須有相等的機會被選中。
為何隨機性至關重要： 它確保樣本能代表總體，並避免偏差 (bias)（即系統性地偏袒某些結果）。

1.3 不理想的抽樣方法

你必須能夠以簡單的語言解釋，為什麼非隨機的方法通常是不理想的。

例子： 如果你想估計一所大型大學學生的平均身高，只詢問籃球隊成員就是一種不理想的方法（有偏差的），因為他們可能比平均身高更高，導致估計值過高。

快速回顧：總體 vs. 樣本

我們使用隨機樣本來獲得總體特徵的無偏估計。如果抽樣不是隨機的，結果將非常不可靠。

2. 作為隨機變量的樣本平均值 (\(\bar{X}\))

當你抽取一個樣本量為 \(n\) 的樣本時，你會算出它的平均值 \(\bar{x}\)。如果你再抽取另一個樣本量為 \(n\) 的樣本，你會得到略微不同的平均值，以此類推。這意味著樣本平均值本身就是一個隨機變量，記作 \(\bar{X}\)。

2.1 樣本平均值的期望值

如果我們抽取無數個樣本並取其平均值的平均值，會得到什麼？

\(E(\bar{X}) = \mu\)

這是一個強大的結論！這意味著樣本平均值是總體平均值 \(\mu\) 的一個無偏估計量 (unbiased estimator)。簡單來說：平均而言，你的樣本平均值會準確地擊中目標（真正的總體平均值）。

2.2 樣本平均值的變異數

變異數告訴我們樣本平均值的分佈有多分散。

\(Var(\bar{X}) = \frac{\sigma^2}{n}\)

\(\sigma^2\) 是總體變異數。
\(n\) 是樣本量。

重要洞見： 注意變異數被 \(n\) 除。這意味著樣本量 (\(n\)) 越大，樣本平均值的變異數就越小。樣本越大，你的估計值就越精確，也越接近真實的平均值。

樣本平均值的標準差，稱為標準誤 (Standard Error, SE)，計算如下：

\(SE = \sqrt{Var(\bar{X})} = \frac{\sigma}{\sqrt{n}}\)

2.3 \(\bar{X}\) 的分佈（常態分佈情況）

如果總體 \(X\) 本身服從常態分佈 \(X \sim N(\mu, \sigma^2)\)，那麼樣本平均值 \(\bar{X}\) 的分佈也完全是常態分佈：

\(\bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right)\)

3. 中央極限定理 (Central Limit Theorem, CLT)

這可能是統計學中最重要的一個概念。

如果總體 \(X\) 不是常態分佈怎麼辦？

中央極限定理 (CLT) 指出，如果你抽取足夠大的樣本（通常 \(n > 30\) 被視為「大樣本」），那麼無論原始總體 \(X\) 的分佈為何，樣本平均值 \(\bar{X}\) 的分佈都會近似於常態分佈。

當 \(n\) 很大時，\(\bar{X} \approx N\left(\mu, \frac{\sigma^2}{n}\right)\)

比喻： CLT 就像一種統計學的魔法。無論原始總體的分佈看起來多奇怪或不均勻（偏態、均勻分佈等），當你將許多獨立數值平均在一起時，產生的平均值分佈會平滑化，變成可預測的、鐘形的常態曲線。

重點總結 (CLT)：

我們在處理大樣本時會依賴 CLT，因為它允許我們對樣本平均值使用常態分佈，即使我們不知道總體的精確形狀。

4. 無偏估計

當我們收集樣本時，我們使用樣本數據來估計未知的總體參數（\(\mu\) 和 \(\sigma^2\)）。

4.1 估計總體平均值 (\(\mu\))

總體平均值 \(\mu\) 的無偏估計量就是樣本平均值 \(\bar{x}\)：

\(\hat{\mu} = \bar{x}\)

（符號 \(\hat{\mu}\) 意為「\(\mu\) 的估計量」）

4.2 估計總體變異數 (\(\sigma^2\))

為了獲得總體變異數的無偏估計，我們需要一個特殊的公式，稱為無偏樣本變異數 (unbiased sample variance) \(s^2\)。

\(\hat{\sigma}^2 = s^2 = \frac{1}{n-1}\left(\sum x^2 - \frac{(\sum x)^2}{n}\right)\)

你知道嗎？ 除以 \(n-1\) 而不是 \(n\) 被稱為貝塞爾校正 (Bessel's correction)。我們使用 \(n-1\) 是因為在計算過程中使用了樣本平均值 \(\bar{x}\)，這稍微限制了樣本的變異性，因此除以 \(n-1\) 可以修正這種輕微的低估。

如果題目給你原始數據或總和數據（\(\sum x\) 和 \(\sum x^2\)），你必須使用上述公式來計算 \(s^2\)。
在涉及大樣本的考試題目中，有時題目會直接給出 \(s^2\) 或 \(s\)（樣本變異數或標準差），並要求你將其視為真實的總體變異數 \(\sigma^2\) 或標準差 \(\sigma\)。

5. 總體平均值的信賴區間 (\(\mu\))

除了給出一個單點估計值 (\(\bar{x}\)) 外，信賴區間 (Confidence Interval, CI) 給出了一個數值範圍，真實的總體參數很可能落在這個範圍內。

5.1 信賴度的概念

95% 信賴區間意味著，如果我們重複多次抽樣過程，我們計算出的區間中，有 95% 會包含真實的總體平均值 \(\mu\)。

5.2 使用 Z-區間的條件

如果滿足以下兩個條件之一，我們可以使用標準常態分佈 (Z-distribution) 來確定 \(\mu\) 的信賴區間：

總體是常態分佈且總體變異數 \(\sigma^2\) 已知。
樣本量 \(n\) 是大型的（基於中央極限定理）。若 \(n\) 很大，我們通常可以使用無偏樣本變異數 \(s^2\) 作為 \(\sigma^2\) 的估計值。

5.3 計算 \(\mu\) 的信賴區間

信賴區間的通用公式是：

\(\bar{x} \pm z \times \frac{\sigma}{\sqrt{n}}\)

\(\bar{x}\) 是計算出的樣本平均值。
\(z\) 是臨界 z 值 (critical z-value)（根據所需的信賴水平，從常態分佈表中查得）。
\(\frac{\sigma}{\sqrt{n}}\) 是標準誤 (SE)。

臨界 Z 值 (Z-scores) 的例子

要找到正確的 \(z\) 值，請在表中查找信賴水平（或使用 \(\Phi(z)\)）。

對於 90% CI：兩側尾部總計 10%（每側 5%）。我們查找 \(\Phi(z) = 0.95\)，得 \(z \approx 1.645\)。
對於 95% CI：兩側尾部總計 5%（每側 2.5%）。我們查找 \(\Phi(z) = 0.975\)，得 \(z \approx 1.960\)。
對於 99% CI：兩側尾部總計 1%（每側 0.5%）。我們查找 \(\Phi(z) = 0.995\)，得 \(z \approx 2.576\)。

CI 計算步驟

識別已知數值： 樣本量 \(n\)、樣本平均值 \(\bar{x}\) 以及總體標準差 \(\sigma\)（或其估計值 \(s\)）。
確定臨界 \(z\) 值： 查找對應你信賴水平的 \(z\) 值（例如 95% 信賴度對應 \(z=1.96\)）。
計算標準誤 (SE)： \(SE = \frac{\sigma}{\sqrt{n}}\)。
計算誤差範圍 (Margin of Error, ME)： \(ME = z \times SE\)。
構建區間： \(\bar{x} - ME < \mu < \bar{x} + ME\)。

解釋示例： 如果學生學習時間的 95% 信賴區間為 (10.5 小時, 14.5 小時)，你可以解釋為：「我們有 95% 的把握，所有學生的真實平均學習時間介於 10.5 小時到 14.5 小時之間。」

6. 總體比例的信賴區間 (\(p\))

有時我們需要估計總體中具有特定特徵的比例（例如：*支持候選人 A 的選民比例*）。

6.1 條件與分佈

此方法僅適用於大樣本。

回想一下，對於二項分佈 \(B(n, p)\)，如果 \(n\) 很大，它可以被常態分佈近似。樣本比例 \(\hat{p}\)（成功數與 \(n\) 的比值）可以近似為：

\(\hat{P} \sim N\left(p, \frac{p(1-p)}{n}\right)\)

然而，由於我們不知道真實的總體比例 \(p\)，我們在變異數計算中使用樣本比例 \(\hat{p}\)。

6.2 計算 \(p\) 的信賴區間

總體比例 \(p\) 的近似信賴區間為：

\(\hat{p} \pm z \times \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\)

其中：

\(\hat{p}\) 是樣本比例（由樣本數據計算得出）。
\(n\) 是樣本量。
\(z\) 是對應信賴水平的臨界 z 值。
\(\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\) 是比例的估計標準誤。

關於連續性校正的說明

當你使用常態分佈來近似二項分佈或卜瓦松分佈（你在其他章節中見過）時，我們需要使用連續性校正。但是，在計算總體平均值或比例的信賴區間時，我們不需要使用連續性校正。

快速回顧：信賴區間

計算取決於標準誤（平均值為 \(\frac{\sigma}{\sqrt{n}}\)，比例為 \(\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\)）和臨界 Z 值。記住 \(\sigma\)（總體標準差）與 \(s\)（無偏樣本標準差，在 \(\sigma\) 未知但 \(n\) 很大時使用）之間的區別。

你現在已經掌握了使用樣本估計總體參數的精髓。熟練這些步驟對於 Paper 6 的成功至關重要！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。