抽樣與估計 (P3 Statistics 2 - Paper 6)
歡迎來到「抽樣與估計」的世界!這一章非常實用,因為它探討了我們如何利用小部分的資訊(*樣本*),來對龐大的群體(*總體*)作出合理的推斷。別擔心,即使起初看到公式覺得很棘手,其實背後的概念非常直觀。本質上,我們正在學習如何在進行統計預測時,確保結果具備統計上的可靠性。
1. 總體與樣本:宏觀視角 vs. 微觀快照
1.1 關鍵定義
- 總體 (Population): 你想要研究的整個群體。例如:全國的所有學生、某工廠生產的所有汽車,或是某次收成的所有蘋果。
- 樣本 (Sample): 從總體中選取出來的一個小部分。我們研究樣本,是因為研究整個總體通常成本太高、耗時太長,甚至是不可能的任務。
- 普查 (Census): 試圖收集總體中每一位成員數據的研究(在實際應用中很少見)。
比喻:想像一鍋巨大的湯(總體)。你舀出一匙(樣本)來品嚐,從而判斷是否需要加鹽(估計總體平均值)。
1.2 隨機性的必要性
為了讓樣本的結果具有意義且在數學上有效,樣本必須是隨機 (random) 抽取的。
- 隨機樣本 (Random Sample): 總體中的每一位成員都必須有相等的機會被選中。
- 為何隨機性至關重要: 它確保樣本能代表總體,並避免偏差 (bias)(即系統性地偏袒某些結果)。
1.3 不理想的抽樣方法
你必須能夠以簡單的語言解釋,為什麼非隨機的方法通常是不理想的。
例子: 如果你想估計一所大型大學學生的平均身高,只詢問籃球隊成員就是一種不理想的方法(有偏差的),因為他們可能比平均身高更高,導致估計值過高。
我們使用隨機樣本來獲得總體特徵的無偏估計。如果抽樣不是隨機的,結果將非常不可靠。
2. 作為隨機變量的樣本平均值 (\(\bar{X}\))
當你抽取一個樣本量為 \(n\) 的樣本時,你會算出它的平均值 \(\bar{x}\)。如果你再抽取另一個樣本量為 \(n\) 的樣本,你會得到略微不同的平均值,以此類推。這意味著樣本平均值本身就是一個隨機變量,記作 \(\bar{X}\)。
2.1 樣本平均值的期望值
如果我們抽取無數個樣本並取其平均值的平均值,會得到什麼?
\(E(\bar{X}) = \mu\)
這是一個強大的結論!這意味著樣本平均值是總體平均值 \(\mu\) 的一個無偏估計量 (unbiased estimator)。簡單來說:平均而言,你的樣本平均值會準確地擊中目標(真正的總體平均值)。
2.2 樣本平均值的變異數
變異數告訴我們樣本平均值的分佈有多分散。
\(Var(\bar{X}) = \frac{\sigma^2}{n}\)
- \(\sigma^2\) 是總體變異數。
- \(n\) 是樣本量。
重要洞見: 注意變異數被 \(n\) 除。這意味著樣本量 (\(n\)) 越大,樣本平均值的變異數就越小。樣本越大,你的估計值就越精確,也越接近真實的平均值。
樣本平均值的標準差,稱為標準誤 (Standard Error, SE),計算如下:
\(SE = \sqrt{Var(\bar{X})} = \frac{\sigma}{\sqrt{n}}\)
2.3 \(\bar{X}\) 的分佈(常態分佈情況)
如果總體 \(X\) 本身服從常態分佈 \(X \sim N(\mu, \sigma^2)\),那麼樣本平均值 \(\bar{X}\) 的分佈也完全是常態分佈:
\(\bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right)\)
3. 中央極限定理 (Central Limit Theorem, CLT)
這可能是統計學中最重要的一個概念。
如果總體 \(X\) 不是常態分佈怎麼辦?
中央極限定理 (CLT) 指出,如果你抽取足夠大的樣本(通常 \(n > 30\) 被視為「大樣本」),那麼無論原始總體 \(X\) 的分佈為何,樣本平均值 \(\bar{X}\) 的分佈都會近似於常態分佈。
當 \(n\) 很大時,\(\bar{X} \approx N\left(\mu, \frac{\sigma^2}{n}\right)\)
比喻: CLT 就像一種統計學的魔法。無論原始總體的分佈看起來多奇怪或不均勻(偏態、均勻分佈等),當你將許多獨立數值平均在一起時,產生的平均值分佈會平滑化,變成可預測的、鐘形的常態曲線。
我們在處理大樣本時會依賴 CLT,因為它允許我們對樣本平均值使用常態分佈,即使我們不知道總體的精確形狀。
4. 無偏估計
當我們收集樣本時,我們使用樣本數據來估計未知的總體參數(\(\mu\) 和 \(\sigma^2\))。
4.1 估計總體平均值 (\(\mu\))
總體平均值 \(\mu\) 的無偏估計量就是樣本平均值 \(\bar{x}\):
\(\hat{\mu} = \bar{x}\)
(符號 \(\hat{\mu}\) 意為「\(\mu\) 的估計量」)
4.2 估計總體變異數 (\(\sigma^2\))
為了獲得總體變異數的無偏估計,我們需要一個特殊的公式,稱為無偏樣本變異數 (unbiased sample variance) \(s^2\)。
\(\hat{\sigma}^2 = s^2 = \frac{1}{n-1}\left(\sum x^2 - \frac{(\sum x)^2}{n}\right)\)
你知道嗎? 除以 \(n-1\) 而不是 \(n\) 被稱為貝塞爾校正 (Bessel's correction)。我們使用 \(n-1\) 是因為在計算過程中使用了樣本平均值 \(\bar{x}\),這稍微限制了樣本的變異性,因此除以 \(n-1\) 可以修正這種輕微的低估。
- 如果題目給你原始數據或總和數據(\(\sum x\) 和 \(\sum x^2\)),你必須使用上述公式來計算 \(s^2\)。
- 在涉及大樣本的考試題目中,有時題目會直接給出 \(s^2\) 或 \(s\)(樣本變異數或標準差),並要求你將其視為真實的總體變異數 \(\sigma^2\) 或標準差 \(\sigma\)。
5. 總體平均值的信賴區間 (\(\mu\))
除了給出一個單點估計值 (\(\bar{x}\)) 外,信賴區間 (Confidence Interval, CI) 給出了一個數值範圍,真實的總體參數很可能落在這個範圍內。
5.1 信賴度的概念
95% 信賴區間意味著,如果我們重複多次抽樣過程,我們計算出的區間中,有 95% 會包含真實的總體平均值 \(\mu\)。
5.2 使用 Z-區間的條件
如果滿足以下兩個條件之一,我們可以使用標準常態分佈 (Z-distribution) 來確定 \(\mu\) 的信賴區間:
- 總體是常態分佈且總體變異數 \(\sigma^2\) 已知。
- 樣本量 \(n\) 是大型的(基於中央極限定理)。若 \(n\) 很大,我們通常可以使用無偏樣本變異數 \(s^2\) 作為 \(\sigma^2\) 的估計值。
5.3 計算 \(\mu\) 的信賴區間
信賴區間的通用公式是:
\(\bar{x} \pm z \times \frac{\sigma}{\sqrt{n}}\)
- \(\bar{x}\) 是計算出的樣本平均值。
- \(z\) 是臨界 z 值 (critical z-value)(根據所需的信賴水平,從常態分佈表中查得)。
- \(\frac{\sigma}{\sqrt{n}}\) 是標準誤 (SE)。
臨界 Z 值 (Z-scores) 的例子
要找到正確的 \(z\) 值,請在表中查找信賴水平(或使用 \(\Phi(z)\))。
- 對於 90% CI:兩側尾部總計 10%(每側 5%)。我們查找 \(\Phi(z) = 0.95\),得 \(z \approx 1.645\)。
- 對於 95% CI:兩側尾部總計 5%(每側 2.5%)。我們查找 \(\Phi(z) = 0.975\),得 \(z \approx 1.960\)。
- 對於 99% CI:兩側尾部總計 1%(每側 0.5%)。我們查找 \(\Phi(z) = 0.995\),得 \(z \approx 2.576\)。
CI 計算步驟
- 識別已知數值: 樣本量 \(n\)、樣本平均值 \(\bar{x}\) 以及總體標準差 \(\sigma\)(或其估計值 \(s\))。
- 確定臨界 \(z\) 值: 查找對應你信賴水平的 \(z\) 值(例如 95% 信賴度對應 \(z=1.96\))。
- 計算標準誤 (SE): \(SE = \frac{\sigma}{\sqrt{n}}\)。
- 計算誤差範圍 (Margin of Error, ME): \(ME = z \times SE\)。
- 構建區間: \(\bar{x} - ME < \mu < \bar{x} + ME\)。
解釋示例: 如果學生學習時間的 95% 信賴區間為 (10.5 小時, 14.5 小時),你可以解釋為:「我們有 95% 的把握,所有學生的真實平均學習時間介於 10.5 小時到 14.5 小時之間。」
6. 總體比例的信賴區間 (\(p\))
有時我們需要估計總體中具有特定特徵的比例(例如:*支持候選人 A 的選民比例*)。
6.1 條件與分佈
此方法僅適用於大樣本。
回想一下,對於二項分佈 \(B(n, p)\),如果 \(n\) 很大,它可以被常態分佈近似。樣本比例 \(\hat{p}\)(成功數與 \(n\) 的比值)可以近似為:
\(\hat{P} \sim N\left(p, \frac{p(1-p)}{n}\right)\)
然而,由於我們不知道真實的總體比例 \(p\),我們在變異數計算中使用樣本比例 \(\hat{p}\)。
6.2 計算 \(p\) 的信賴區間
總體比例 \(p\) 的近似信賴區間為:
\(\hat{p} \pm z \times \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\)
其中:
- \(\hat{p}\) 是樣本比例(由樣本數據計算得出)。
- \(n\) 是樣本量。
- \(z\) 是對應信賴水平的臨界 z 值。
- \(\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\) 是比例的估計標準誤。
關於連續性校正的說明
當你使用常態分佈來近似二項分佈或卜瓦松分佈(你在其他章節中見過)時,我們需要使用連續性校正。但是,在計算總體平均值或比例的信賴區間時,我們不需要使用連續性校正。
計算取決於標準誤(平均值為 \(\frac{\sigma}{\sqrt{n}}\),比例為 \(\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\))和臨界 Z 值。記住 \(\sigma\)(總體標準差)與 \(s\)(無偏樣本標準差,在 \(\sigma\) 未知但 \(n\) 很大時使用)之間的區別。
你現在已經掌握了使用樣本估計總體參數的精髓。熟練這些步驟對於 Paper 6 的成功至關重要!