Hypothesis test for the mean of a normal distribution - Mathematics A - H240 - Cambridge OCR A Level

歡迎來到平均值的假設檢定！

在之前的章節中，你已經學過如何檢定一枚硬幣是否有偏差，或是某個特定比例的人群是否偏好某個品牌。那些是針對離散 (discrete) 數據（可以點算的事物）。現在，我們將進入連續 (continuous) 數據的世界（可以測量的事物），例如學生的身高、麥片盒的重量或燈泡的壽命。

別擔心，雖然這看起來比二項分佈檢定「重」一點，但背後的邏輯完全相同！我們只是將常態分佈 (Normal Distribution) 當作我們的尺，來看看一個結果是令人驚訝的，還是「純屬巧合」。

1. 作為隨機變數的樣本平均值

想像你有一個裝滿雷根糖的巨大罐子。如果你只取出其中一顆，它的重量可能會非常重或非常輕。但如果你抓一把 20 顆雷根糖並算出它們的平均重量，這個平均值出現極端數值的機率就會小得多。

在統計學中，我們將樣本的平均值稱為 \(\bar{x}\)。因為每次我們抽取新樣本時 \(\bar{x}\) 都會改變，所以我們將其視為一個隨機變數 (random variable)，記作 \(\bar{X}\)。

「更瘦」分佈的規則

課程大綱要求你掌握一個非常具體的結果。如果你的原始母體遵循常態分佈 \(X \sim N(\mu, \sigma^2)\)，那麼樣本平均值也會遵循常態分佈，但它會顯得更「瘦」（離散程度更小）：

\(\bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right)\)

其中： - \(\mu\) 是母體平均值。 - \(\sigma^2\) 是母體變異數。 - \(n\) 是樣本大小。

快速複習：要得到這個新分佈的標準差（通常稱為標準誤 Standard Error），你需要對變異數取平方根：\(\frac{\sigma}{\sqrt{n}}\)。

你知道嗎？

你的樣本大小 (\(n\)) 越大，變異數 (\(\frac{\sigma^2}{n}\)) 就越小。這很合理：相較於小樣本，大樣本能為你提供更可靠的真實平均值估計！

重點提示：進行平均值檢定時，請務必使用 \(\bar{X}\) 的分佈，這代表你必須將原始變異數除以樣本大小 \(n\)。

2. 設定檢定

就像二項分佈檢定一樣，我們需要一個起始假設和一個對立假設。

虛無假設 (Null Hypothesis, \(H_0\))：這是「現狀」。我們假設平均值完全符合預期。
例如：\(H_0: \mu = 50\)

對立假設 (Alternative Hypothesis, \(H_1\))：這是我們正在調查的對象。 - 單尾檢定 (1-tailed test)：我們認為平均值已經增加 (\(\mu > 50\)) 或減少 (\(\mu < 50\))。 - 雙尾檢定 (2-tailed test)：我們只是認為平均值已經改變 (\(\mu \neq 50\))。

避免犯下常見錯誤

編寫假設時，請務必使用母體參數 \(\mu\)。切勿在 \(H_0\) 或 \(H_1\) 中使用 \(\bar{x}\)。假設是關於整個母體的，而不僅僅是你手頭上的那個小樣本！

3. 分步驟操作流程

如果你能找到一套方法並堅持使用，這些問題會變得簡單得多。讓我們看看「臨界值」法。

第一步：假設
清楚寫出 \(H_0\) 和 \(H_1\)，並定義 \(\mu\) 代表什麼（例如：「其中 \(\mu\) 為巧克力棒的平均重量」）。

第二步：分佈
說明在虛無假設下樣本平均值的分佈：\(\bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right)\)。

第三步：顯著性水平
從題目中找出顯著性水平 (\(\alpha\))（通常是 5% 或 1%）。如果是雙尾檢定，記得將其一分為二（例如：兩端各佔 2.5%）。

第四步：找出臨界區域
使用計算機的「逆向常態分佈」(Inverse Normal) 功能，找出對應於你的 \(\bar{X}\) 分佈顯著性水平的邊界值（臨界值, Critical Value）。
例如：如果 \(\alpha = 5\%\) 且我們正在檢定 \(\mu > 50\)，請找出一個數值 \(c\)，使得 \(P(\bar{X} > c) = 0.05\)。

第五步：比較與結論
- 如果觀察到的樣本平均值 \(\bar{x}\) 落在臨界區域（「尾部」）之內，那麼這不太可能是偶然發生的。拒絕 \(H_0\)。 - 如果它落在區域之外，則該結果不夠令人驚訝。不拒絕 \(H_0\)。

第六步：結合情境的結論
務必用平實的語言寫下最後一句話。
例如：「在 5% 的顯著性水平下，有足夠的證據表明巧克力棒的平均重量已經減少。」

4. 使用 Z 分數轉換

有時，與其直接在計算機上對 \(\bar{X}\) 進行操作，你可能更想使用標準常態分佈 (Standard Normal Distribution) \(Z \sim N(0, 1)\)。如果你使用考試公式手冊中提供的統計表，這會特別有幫助。

將樣本平均值轉換為檢定統計量 (test statistic, \(z\)) 的公式為：

\(z = \frac{\bar{x} - \mu}{\sigma / \sqrt{n}}\)

將 \(z\) 分數視為「我的樣本距離平均值有多少個標準差？」。如果 \(z\) 分數非常大（例如對於 5% 單尾檢定大於 1.645），則結果是顯著的！

5. 成功的重要提醒

記憶小幫手：看「尾部」說故事

如果問題問的是「平均值是否改變」，請使用雙尾檢定並平分顯著性水平。如果問題問的是「增加」或「減少」，請使用單尾檢定。

快速複習盒

- 母體：\(X \sim N(\mu, \sigma^2)\)
- 樣本平均值：\(\bar{X} \sim N(\mu, \frac{\sigma^2}{n})\)
- 假設：務必使用 \(\mu\)
- 結論：務必與現實生活情境（例如「燈泡」、「學生」）聯繫起來。

常見陷阱

1. 忘記除以 \(n\)：這是最常見的錯誤。樣本平均值總是比母體更穩定（分佈更「瘦」）。
2. 使用變異數而非標準差：在計算機中，「sigma」(\(\sigma\)) 代表標準差。如果題目給你的是變異數 (\(\sigma^2\))，你必須先取平方根，然後再除以 \(\sqrt{n}\)。
3. 結論過於絕對：永遠不要說「\(H_0\) 是正確的」或「我已經證明了平均值發生了變化」。請始終使用謹慎的語言，例如「有證據表明……」或「證據不足以表明……」。

重點提示：假設檢定其實就是在問：「我的樣本平均值距離預期平均值是否遠到離譜，以至於原始平均值一定是錯的？」如果答案是肯定的，你就可以拒絕虛無假設！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。