Inference - Further Mathematics B (MEI) - H645 - Cambridge OCR A Level

歡迎來到統計推論的世界！

在統計學中，我們經常想了解一大群人或事物（即母體 (Population)）的特徵，但要檢查每一個個體根本是不可能的。試想一下，要找出全英國每個人的平均身高——這簡直不可能！因此，我們會抽取一個較小的樣本 (Sample)，並利用它對整個母體進行合理的推斷。這種「合理的推測」就是我們所稱的統計推論 (Statistical Inference)。

在本章中，你將學會如何估算母體數值、如何構建稱為置信區間 (Confidence Intervals) 的「安全網」，以及如何檢定一個平均值是否真的如他人所宣稱的那樣。別擔心，即使起初聽起來有點深奧，我們會一步一步為你拆解！

1. 參數估計：點估計 (Point Estimates)

點估計是指利用樣本中的單一數值，作為我們對母體參數的最佳猜測。

平均值估計：我們使用樣本平均值（記為 \(\bar{x}\)）來估計母體平均值 \(\mu\)。即 \(\hat{\mu} = \bar{x}\)。
變異數估計：為了得到母體變異數 (\(\sigma^2\)) 的不偏估計量，我們使用樣本變異數 \(s^2\)。重要提示：我們除以 \(n - 1\) 而非 \(n\)。這能「修正」估計值，因為小型樣本往往會稍微低估母體的離散程度。

變異數不偏估計量的公式為：
\(s^2 = \frac{1}{n-1} \sum (x_i - \bar{x})^2\)

什麼是標準誤 (Standard Error)？

平均值標準誤 (Standard Error of the Mean, SE) 告訴我們樣本平均值預期會偏離真實母體平均值多少。你可以把它想像成「我們猜測結果的標準差」。

公式：\(SE = \frac{\sigma}{\sqrt{n}}\)（如果不知道 \(\sigma\)，我們就用樣本的 \(s\) 來代替）。

快速回顧：樣本量 (\(n\)) 越大，標準誤就越小。這很合理：樣本越大，你的猜測就越可靠！

2. 抽樣分佈與中央極限定理 (CLT)

如果你多次抽取樣本並繪製它們的平均值，這些平均值會形成自己的分佈，這就是平均值的抽樣分佈 (Sampling distribution of the mean)。

如果原始母體呈常態分佈 (Normal)，樣本平均值分佈也會呈常態分佈。
中央極限定理 (Central Limit Theorem, CLT)：這是統計學中的「魔法」。它指出，只要你的樣本量「足夠大」（通常 \(n > 30\)），樣本平均值的分佈就會趨近於常態分佈，即使原始母體的分佈形狀很奇怪也沒關係！

類比：想像一鍋湯。即使配料（母體）大小不一且分佈不均，如果你用一個夠大的勺子（樣本），那麼每一勺湯的味道都會與下一勺非常一致。

3. 置信區間 (Confidence Intervals, CIs)

與其只給出一個數字（點估計），置信區間提供了一個數值範圍，讓我們相當有把握真實的母體平均值就落在其中。

「Z」與「T」分佈的抉擇

這是許多學生感到困惑的地方，但規則很簡單：

1. 以下情況使用常態分佈 (z)：
- 樣本量很大（使用 \(s^2\) 作為 \(\sigma^2\) 的估計值）。
- 已知母體變異數 \(\sigma^2\)。

2. 以下情況使用 t-分佈：
- 樣本量很小且母體變異數 \(\sigma^2\) 未知（但必須假設母體呈常態分佈）。

影響置信區間寬度的因素：

樣本量 (\(n\))：樣本越大，區間越窄（越精確）。
置信水平：置信水平越高（例如 99% 對比 95%），區間越寬。（如果你想更確定能捕捉到「魚」，你需要一張更大的網！）
母體變異性 (\(\sigma\))：數據越分散，區間越寬。

關鍵概念：95% 置信區間的意思是，如果我們抽取 100 個不同的樣本並建立 100 個區間，我們預期其中大約有 95 個會實際包含真實的母體平均值。

4. 成對樣本 (Paired Samples)

有時數據是成對出現的。例如，測試一個人喝咖啡「前」與「後」的反應時間。這不是兩組獨立的數據，而是同一群人被測量了兩次。

為了解決這個問題，我們計算每一對的差值 (Difference)。然後，我們將這些差值視為單一樣本，並使用與之前相同的平均值和置信區間方法來進行分析。

步驟：
1. 對每個人計算「後」減「前」的差值。
2. 找出這些差值的平均值 (\(\bar{d}\))。
3. 找出這些差值的標準差 (\(s_d\))。
4. 使用這些「差值」構建你的區間或進行檢定。

5. 平均值的假設檢定 (Hypothesis Testing)

這是我們對母體參數（通常是平均值 \(\mu\) 或中位數）的宣稱進行檢定的過程。

三大主要檢定：

1. 常態 (z) 檢定：用於 \(n\) 很大或已知 \(\sigma\) 時的平均值檢定。
2. t-檢定：用於 \(n\) 很小、\(\sigma\) 未知且母體呈常態分佈時的平均值檢定。
3. Wilcoxon 單樣本符號秩檢定 (Wilcoxon Single Sample Signed-Rank Test)：這是一種無母數 (non-parametric) 檢定。我們用它來檢定中位數。當你不想假設數據符合常態分佈，但分佈必須對稱時，這是個很好的選擇。

Wilcoxon 記憶法：記住 W-S-S (Wilcoxon - Symmetrical - Signed-rank)。它關注的是差值的「秩 (rank)」，而不僅僅是原始數值。

6. 利用置信區間做決策

你可以利用置信區間來執行假設檢定！
如果你有一個假設數值（例如某人宣稱平均體重為 50kg），而你建立的 95% 置信區間並不包含 50kg，那麼你可以在 5% 的顯著性水平下拒絕他們的宣稱。

快速回顧：
- 數值在區間內 \(\rightarrow\) 沒有足夠證據拒絕該宣稱。
- 數值在區間外 \(\rightarrow\) 有證據拒絕該宣稱。

應避免的常見錯誤

除錯分母：在計算標準誤時，務必將標準差除以 \(\sqrt{n}\)，而不是除以 \(n\)。
混用 z 與 t：如果樣本很小（例如 \(n=10\)）且你不知道母體變異數，你必須使用 t-分佈。
忘記對稱性：除非你明確陳述了母體分佈是對稱的這一假設，否則不能使用 Wilcoxon 檢定。

本章重點總結：統計推論是從「已知」（樣本）走向「未知」（母體）的過程。無論你是使用點估計、置信區間還是假設檢定，你始終都要考慮到樣本本身會存在變異這一事實！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。