Introduction to hypothesis testing - Statistics (9ST0) - Pearson Edexcel A Level

歡迎來到統計推論（Statistical Inference）的世界！

你有沒有想過，科學家是如何「證明」一種新藥有效，或者工廠如何知道機器是否校準正確？他們不是靠猜的，而是使用假設檢定（Hypothesis Testing）。你可以把假設檢定想像成一場法庭審判：在我們找到足夠證據證明某人有罪之前，我們預設他是清白的。在統計學中，我們也預設「現狀」是正確的，直到數據證明事實並非如此。
如果這聽起來有點抽象，不用擔心——我們會把它拆解成簡單又合乎邏輯的步驟！

1. 基礎概念：母數 vs. 統計量

在開始檢定之前，我們需要弄清楚討論的對象。在統計學中，我們區分「總體」與我們實際測量的「小組」。

母數（Parameter）：描述總體（Population）的數值屬性。它通常是我們不知道的「真實」數值。
例子：英國所有成年人的平均身高（\(\mu\)）。

統計量（Statistic）：描述樣本（Sample）的數值屬性。這是我們從收集到的數據中計算出來的數值。
例子：你所測量的 100 個人的平均身高（\(\bar{x}\)）。

記憶小撇步：
Parameter（母數）= Population（總體）
Statistic（統計量）= Sample（樣本）

標準誤（Standard Error）：這只是一個花俏的名字，其實就是統計量的標準差。它告訴我們樣本結果與真實總體數值之間預期的變異程度。

重點總結：我們使用統計量（來自樣本）來對母數（總體）進行「推論」（一種經過計算的猜測）。

2. 假設檢定的語言

為了通過考試，你必須學會這些術語！以下是你在每道題目中都會用到的核心詞彙：

假設（Hypotheses）

虛無假設（Null Hypothesis，\(H_0\)）：這是「無聊」的版本，假設沒有發生任何改變或沒有任何效果。我們總是使用等號來書寫（例如：\(H_0: p = 0.5\)）。

對立假設（Alternative Hypothesis，\(H_1\)）：這正是你試圖尋找證據支持的部分。這是「令人興奮」的版本（例如：\(H_1: p > 0.5\)）。

決策關鍵

顯著水準（Significance Level，\(\alpha\)）：這是證據的「門檻」，通常設定為 5%（\(0.05\)）。如果我們的結果是由純粹機率產生的可能性低於這個水準，我們就拒絕 \(H_0\)。

檢定統計量（Test Statistic）：從樣本數據計算出的數值（如 Z 分數或二項分佈中的成功次數），用於做決定。

p-值（p-value）：假設 \(H_0\) 為真，得到極端結果的機率。
口訣：如果 p 值夠低，虛無假設就要離去！（若 p < 顯著水準，則拒絕 \(H_0\)）。

「區域」劃分

拒絕域（Critical Region）：「拒絕區」。如果你的檢定統計量落在這裡，就要拒絕 \(H_0\)。
臨界值（Critical Value）：劃分拒絕域的「邊界」數字。
接受域（Acceptance Region）：「安全區」。如果你的統計量落在這裡，代表沒有足夠證據改變立場，因此保留 \(H_0\)。

快速回顧：
1. 寫出 \(H_0\) 和 \(H_1\)。
2. 選擇顯著水準（通常為 5%）。
3. 計算檢定統計量。
4. 檢查它是否落在拒絕域中。

3. 單尾檢定 vs. 雙尾檢定

如何判斷要用哪種檢定？這取決於題目的提問方式。

單尾檢定（1-Tail Test）：你正在尋找特定方向上的改變。
關鍵詞：「增加」、「減少」、「更好」、「更慢」。
例子：\(H_1: \mu > 100\)

雙尾檢定（2-Tail Test）：你正在尋找任何方向上的改變。
關鍵詞：「有改變」、「不同」、「不等於」。
例子：\(H_1: \mu \neq 100\)

常見錯誤：在雙尾檢定中，你必須將顯著水準平分！對於 5% 的檢定，你在高端尋找 2.5%，在低端尋找 2.5%。

4. 比例檢定（二項分佈）

當我們計算「成功」與「失敗」時會用到。
\(X \sim B(n, p)\)

步驟：
1. 定義母數：設 \(p\) 為……的機率。
2. 寫出 \(H_0: p = \text{舊值}\) 及 \(H_1: p <, > \text{或} \neq \text{舊值}\)。
3. 假設 \(H_0\) 為真，找出得到像觀察值那樣極端的機率。
4. 將此機率與顯著水準進行比較。

小知識：如果樣本數 (\(n\)) 非常大，你可以使用常態近似（Normal Approximation）來解決二項分佈問題。這能讓大數據的計算速度快得多！

5. 平均數檢定（常態分佈）

當我們觀察樣本的平均值時會用到。
如果總體 \(X \sim N(\mu, \sigma^2)\)，那麼樣本平均數 \(\bar{X}\) 遵循：
\(\bar{X} \sim N(\mu, \frac{\sigma^2}{n})\)

重點：隨著樣本數 (\(n\)) 增加，樣本平均數的「離散程度」（\(\frac{\sigma^2}{n}\)）會變小。這就是為什麼較大的樣本能提供更可靠的結果！

「大樣本」法則：如果你的樣本夠大（通常 \(n \geq 30\)），根據中央極限定理（Central Limit Theorem），即使原始總體不是常態分佈，我們也能假設樣本平均數遵循常態分佈。

6. 解讀結果

完成檢定後，你的結論必須謹慎且結合題目背景。

好的寫法：「在 5% 的顯著水準下，有足夠證據顯示平均身高有所增加。」
壞的寫法：「這證明了平均身高絕對是 180 公分。」

為什麼？因為我們只用了樣本。永遠存在一種微小的機率，是因為運氣好才抽到這種樣本！這就是為什麼我們從不說「證明」了，我們只有「證據」。

7. 成功清單

- 隨機抽樣：確保樣本是隨機的，否則檢定會有偏差。
- 陳述假設：提到你是否假設常態分佈或使用中央極限定理。
- 檢查尾數：是 \(>\) 還是 \(\neq\)？
- 情境最重要：最後一句話一定要寫出題目中的具體事物（例如：種子、燈泡、考試分數），而不只是關於「p-值」。

如果一開始覺得很棘手，別擔心！假設檢定是一個過程。一旦你針對幾種不同的情境練習過這些步驟，你就會發現其中的「邏輯」每一次都是一樣的。

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。