歡迎來到平均值的假設檢定!

在之前的章節中,你已經學過如何檢定一枚硬幣是否有偏差,或是某個特定比例的人群是否偏好某個品牌。那些是針對離散 (discrete) 數據(可以點算的事物)。現在,我們將進入連續 (continuous) 數據的世界(可以測量的事物),例如學生的身高、麥片盒的重量或燈泡的壽命。

別擔心,雖然這看起來比二項分佈檢定「重」一點,但背後的邏輯完全相同!我們只是將常態分佈 (Normal Distribution) 當作我們的尺,來看看一個結果是令人驚訝的,還是「純屬巧合」。

1. 作為隨機變數的樣本平均值

想像你有一個裝滿雷根糖的巨大罐子。如果你只取出其中一顆,它的重量可能會非常重或非常輕。但如果你抓一把 20 顆雷根糖並算出它們的平均重量,這個平均值出現極端數值的機率就會小得多。

在統計學中,我們將樣本的平均值稱為 \(\bar{x}\)。因為每次我們抽取新樣本時 \(\bar{x}\) 都會改變,所以我們將其視為一個隨機變數 (random variable),記作 \(\bar{X}\)。

「更瘦」分佈的規則

課程大綱要求你掌握一個非常具體的結果。如果你的原始母體遵循常態分佈 \(X \sim N(\mu, \sigma^2)\),那麼樣本平均值也會遵循常態分佈,但它會顯得更「瘦」(離散程度更小):

\(\bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right)\)

其中: - \(\mu\) 是母體平均值。 - \(\sigma^2\) 是母體變異數。 - \(n\) 是樣本大小。

快速複習:要得到這個新分佈的標準差(通常稱為標準誤 Standard Error),你需要對變異數取平方根:\(\frac{\sigma}{\sqrt{n}}\)。

你知道嗎?

你的樣本大小 (\(n\)) 越大,變異數 (\(\frac{\sigma^2}{n}\)) 就越小。這很合理:相較於小樣本,大樣本能為你提供更可靠的真實平均值估計!

重點提示:進行平均值檢定時,請務必使用 \(\bar{X}\) 的分佈,這代表你必須將原始變異數除以樣本大小 \(n\)。

2. 設定檢定

就像二項分佈檢定一樣,我們需要一個起始假設和一個對立假設。

虛無假設 (Null Hypothesis, \(H_0\)):這是「現狀」。我們假設平均值完全符合預期。
例如:\(H_0: \mu = 50\)

對立假設 (Alternative Hypothesis, \(H_1\)):這是我們正在調查的對象。 - 單尾檢定 (1-tailed test):我們認為平均值已經增加 (\(\mu > 50\)) 或減少 (\(\mu < 50\))。 - 雙尾檢定 (2-tailed test):我們只是認為平均值已經改變 (\(\mu \neq 50\))。

避免犯下常見錯誤

編寫假設時,請務必使用母體參數 \(\mu\)。切勿在 \(H_0\) 或 \(H_1\) 中使用 \(\bar{x}\)。假設是關於整個母體的,而不僅僅是你手頭上的那個小樣本!

3. 分步驟操作流程

如果你能找到一套方法並堅持使用,這些問題會變得簡單得多。讓我們看看「臨界值」法。

第一步:假設
清楚寫出 \(H_0\) 和 \(H_1\),並定義 \(\mu\) 代表什麼(例如:「其中 \(\mu\) 為巧克力棒的平均重量」)。

第二步:分佈
說明在虛無假設下樣本平均值的分佈:\(\bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right)\)。

第三步:顯著性水平
從題目中找出顯著性水平 (\(\alpha\))(通常是 5% 或 1%)。如果是雙尾檢定,記得將其一分為二(例如:兩端各佔 2.5%)。

第四步:找出臨界區域
使用計算機的「逆向常態分佈」(Inverse Normal) 功能,找出對應於你的 \(\bar{X}\) 分佈顯著性水平的邊界值(臨界值, Critical Value)。
例如:如果 \(\alpha = 5\%\) 且我們正在檢定 \(\mu > 50\),請找出一個數值 \(c\),使得 \(P(\bar{X} > c) = 0.05\)。

第五步:比較與結論
- 如果觀察到的樣本平均值 \(\bar{x}\) 落在臨界區域(「尾部」)之內,那麼這不太可能是偶然發生的。拒絕 \(H_0\)。 - 如果它落在區域之外,則該結果不夠令人驚訝。不拒絕 \(H_0\)

第六步:結合情境的結論
務必用平實的語言寫下最後一句話。
例如:「在 5% 的顯著性水平下,有足夠的證據表明巧克力棒的平均重量已經減少。」

4. 使用 Z 分數轉換

有時,與其直接在計算機上對 \(\bar{X}\) 進行操作,你可能更想使用標準常態分佈 (Standard Normal Distribution) \(Z \sim N(0, 1)\)。如果你使用考試公式手冊中提供的統計表,這會特別有幫助。

將樣本平均值轉換為檢定統計量 (test statistic, \(z\)) 的公式為:

\(z = \frac{\bar{x} - \mu}{\sigma / \sqrt{n}}\)

將 \(z\) 分數視為「我的樣本距離平均值有多少個標準差?」。如果 \(z\) 分數非常大(例如對於 5% 單尾檢定大於 1.645),則結果是顯著的!

5. 成功的重要提醒

記憶小幫手:看「尾部」說故事

如果問題問的是「平均值是否改變」,請使用雙尾檢定並平分顯著性水平。如果問題問的是「增加」或「減少」,請使用單尾檢定。

快速複習盒

- 母體:\(X \sim N(\mu, \sigma^2)\)
- 樣本平均值:\(\bar{X} \sim N(\mu, \frac{\sigma^2}{n})\)
- 假設:務必使用 \(\mu\)
- 結論:務必與現實生活情境(例如「燈泡」、「學生」)聯繫起來。

常見陷阱

1. 忘記除以 \(n\):這是最常見的錯誤。樣本平均值總是比母體更穩定(分佈更「瘦」)。
2. 使用變異數而非標準差:在計算機中,「sigma」(\(\sigma\)) 代表標準差。如果題目給你的是變異數 (\(\sigma^2\)),你必須先取平方根,然後再除以 \(\sqrt{n}\)。
3. 結論過於絕對:永遠不要說「\(H_0\) 是正確的」或「我已經證明了平均值發生了變化」。請始終使用謹慎的語言,例如「有證據表明……」或「證據不足以表明……」。

重點提示:假設檢定其實就是在問:「我的樣本平均值距離預期平均值是否遠到離譜,以至於原始平均值一定是錯的?」如果答案是肯定的,你就可以拒絕虛無假設!