歡迎來到統計推論的世界!

在統計學中,我們經常想了解一大群人或事物(即母體 (Population))的特徵,但要檢查每一個個體根本是不可能的。試想一下,要找出全英國每個人的平均身高——這簡直不可能!因此,我們會抽取一個較小的樣本 (Sample),並利用它對整個母體進行合理的推斷。這種「合理的推測」就是我們所稱的統計推論 (Statistical Inference)

在本章中,你將學會如何估算母體數值、如何構建稱為置信區間 (Confidence Intervals) 的「安全網」,以及如何檢定一個平均值是否真的如他人所宣稱的那樣。別擔心,即使起初聽起來有點深奧,我們會一步一步為你拆解!

1. 參數估計:點估計 (Point Estimates)

點估計是指利用樣本中的單一數值,作為我們對母體參數的最佳猜測。

  • 平均值估計:我們使用樣本平均值(記為 \(\bar{x}\))來估計母體平均值 \(\mu\)。即 \(\hat{\mu} = \bar{x}\)。
  • 變異數估計:為了得到母體變異數 (\(\sigma^2\)) 的不偏估計量,我們使用樣本變異數 \(s^2\)。重要提示:我們除以 \(n - 1\) 而非 \(n\)。這能「修正」估計值,因為小型樣本往往會稍微低估母體的離散程度。

變異數不偏估計量的公式為:
\(s^2 = \frac{1}{n-1} \sum (x_i - \bar{x})^2\)

什麼是標準誤 (Standard Error)?

平均值標準誤 (Standard Error of the Mean, SE) 告訴我們樣本平均值預期會偏離真實母體平均值多少。你可以把它想像成「我們猜測結果的標準差」。

公式:\(SE = \frac{\sigma}{\sqrt{n}}\)(如果不知道 \(\sigma\),我們就用樣本的 \(s\) 來代替)。

快速回顧:樣本量 (\(n\)) 越大,標準誤就越小。這很合理:樣本越大,你的猜測就越可靠!

2. 抽樣分佈與中央極限定理 (CLT)

如果你多次抽取樣本並繪製它們的平均值,這些平均值會形成自己的分佈,這就是平均值的抽樣分佈 (Sampling distribution of the mean)

  • 如果原始母體呈常態分佈 (Normal),樣本平均值分佈也會呈常態分佈
  • 中央極限定理 (Central Limit Theorem, CLT):這是統計學中的「魔法」。它指出,只要你的樣本量「足夠大」(通常 \(n > 30\)),樣本平均值的分佈就會趨近於常態分佈,即使原始母體的分佈形狀很奇怪也沒關係!

類比:想像一鍋湯。即使配料(母體)大小不一且分佈不均,如果你用一個夠大的勺子(樣本),那麼每一勺湯的味道都會與下一勺非常一致。

3. 置信區間 (Confidence Intervals, CIs)

與其只給出一個數字(點估計),置信區間提供了一個數值範圍,讓我們相當有把握真實的母體平均值就落在其中。

「Z」與「T」分佈的抉擇

這是許多學生感到困惑的地方,但規則很簡單:

1. 以下情況使用常態分佈 (z)
- 樣本量很大(使用 \(s^2\) 作為 \(\sigma^2\) 的估計值)。
- 已知母體變異數 \(\sigma^2\)。

2. 以下情況使用 t-分佈
- 樣本量很小且母體變異數 \(\sigma^2\) 未知(但必須假設母體呈常態分佈)。

影響置信區間寬度的因素:

  • 樣本量 (\(n\)):樣本越大,區間越窄(越精確)。
  • 置信水平:置信水平越高(例如 99% 對比 95%),區間越寬。(如果你想更確定能捕捉到「魚」,你需要一張更大的網!)
  • 母體變異性 (\(\sigma\)):數據越分散,區間越寬。

關鍵概念:95% 置信區間的意思是,如果我們抽取 100 個不同的樣本並建立 100 個區間,我們預期其中大約有 95 個會實際包含真實的母體平均值。

4. 成對樣本 (Paired Samples)

有時數據是成對出現的。例如,測試一個人喝咖啡「前」與「後」的反應時間。這不是兩組獨立的數據,而是同一群人被測量了兩次。

為了解決這個問題,我們計算每一對的差值 (Difference)。然後,我們將這些差值視為單一樣本,並使用與之前相同的平均值和置信區間方法來進行分析。

步驟:
1. 對每個人計算「後」減「前」的差值。
2. 找出這些差值的平均值 (\(\bar{d}\))。
3. 找出這些差值的標準差 (\(s_d\))。
4. 使用這些「差值」構建你的區間或進行檢定。

5. 平均值的假設檢定 (Hypothesis Testing)

這是我們對母體參數(通常是平均值 \(\mu\) 或中位數)的宣稱進行檢定的過程。

三大主要檢定:

1. 常態 (z) 檢定:用於 \(n\) 很大或已知 \(\sigma\) 時的平均值檢定。
2. t-檢定:用於 \(n\) 很小、\(\sigma\) 未知且母體呈常態分佈時的平均值檢定。
3. Wilcoxon 單樣本符號秩檢定 (Wilcoxon Single Sample Signed-Rank Test):這是一種無母數 (non-parametric) 檢定。我們用它來檢定中位數。當你不想假設數據符合常態分佈,但分佈必須對稱時,這是個很好的選擇。

Wilcoxon 記憶法:記住 W-S-S (Wilcoxon - Symmetrical - Signed-rank)。它關注的是差值的「秩 (rank)」,而不僅僅是原始數值。

6. 利用置信區間做決策

你可以利用置信區間來執行假設檢定!
如果你有一個假設數值(例如某人宣稱平均體重為 50kg),而你建立的 95% 置信區間並不包含 50kg,那麼你可以在 5% 的顯著性水平下拒絕他們的宣稱。

快速回顧:
- 數值區間內 \(\rightarrow\) 沒有足夠證據拒絕該宣稱。
- 數值區間外 \(\rightarrow\) 有證據拒絕該宣稱。

應避免的常見錯誤

  • 除錯分母:在計算標準誤時,務必將標準差除以 \(\sqrt{n}\),而不是除以 \(n\)。
  • 混用 z 與 t:如果樣本很小(例如 \(n=10\))且你不知道母體變異數,你必須使用 t-分佈。
  • 忘記對稱性:除非你明確陳述了母體分佈是對稱的這一假設,否則不能使用 Wilcoxon 檢定。

本章重點總結:統計推論是從「已知」(樣本)走向「未知」(母體)的過程。無論你是使用點估計、置信區間還是假設檢定,你始終都要考慮到樣本本身會存在變異這一事實!