介紹:成為統計偵探

歡迎來到統計學的世界!今天,我們將深入探討假設檢定 (Hypothesis Testing)。如果你曾經好奇過一枚硬幣是否不公平,或者一個新的「幸運」骰子是否真的比較常擲出六點,其實你已經具備了統計學家的思維模式。
假設檢定基本上就是「統計偵探工作」。我們從一個假設開始,觀察證據(數據),然後決定這些證據是否足夠強大,以至於讓我們改變原有的看法。如果一開始覺得有很多新名詞感到困惑,請別擔心,我們會一步步為你拆解!

1. 假設檢定的術語

要成為一名出色的偵探,你需要熟悉相關術語。以下是 OCR MEI 課程大綱中必須掌握的關鍵詞:

虛無假設 (Null Hypothesis, \(H_0\)): 這是「現狀」或「無變化」的宣稱。它假設一切如常,沒有發生任何改變。對於二項分佈機率,我們通常這樣寫:
\(H_0: p = \text{某數值}\)

對立假設 (Alternative Hypothesis, \(H_1\)): 這是「令人興奮」的宣稱。這是你試圖尋找證據支持的觀點。它通常是以下其中一種形式:
\(H_1: p < \text{某數值}\)(你認為機率降低了)
\(H_1: p > \text{某數值}\)(你認為機率增加了)
\(H_1: p \neq \text{某數值}\)(你只是認為機率有所改變)

檢定統計量 (Test Statistic): 這是你在實驗中觀察到的數值。例如,如果你擲硬幣 20 次,出現正面的次數就是你的檢定統計量。

顯著性水平 (Significance Level, \(\alpha\)): 這是我們判斷證據的「門檻」。通常設為 5% (\(0.05\)) 或 10% (\(0.1\))。它代表當我們拒絕 \(H_0\) 時,我們願意承擔犯錯的機率。

快速複習小盒子:
- \(H_0\) 永遠使用 "="
- \(H_1\) 永遠使用 "<", ">" 或 "\(\neq\)"
- 假設永遠是關於母體機率 \(p\),絕不是關於樣本結果!

2. 單尾與雙尾檢定

我們如何知道該往哪個方向尋找證據?這取決於我們懷疑發生了什麼事。

單尾檢定 (One-Tail Tests)

如果題目明確指定方向,請使用 1 尾檢定
例子: 「園丁懷疑種子的發芽率增加了。」
這裡,\(H_1: p > \text{舊數值}\)。我們只關心結果分佈中的「高位」端。

雙尾檢定 (Two-Tail Tests)

如果題目說「機率改變了」或「有所不同」,請使用 2 尾檢定
例子: 「科學家想檢查機器是否仍然校準正確。」
這裡,\(H_1: p \neq \text{舊數值}\)。我們關心結果是否太高 OR 太低。
重要技巧: 在 2 尾檢定中,我們將顯著性水平平分。如果總水平是 5%,我們會在底部尋找 2.5%,在頂部尋找 2.5%。

重點總結: 仔細讀題!像「增加」、「減少」、「更好」或「更差」等詞意味著 1 尾檢定。像「改變」、「不同」或「受影響」等詞則意味著 2 尾檢定。

3. 臨界區域與 \(p\)-值

得到數據後,我們如何決定 \(H_0\) 是「有罪」(拒絕)還是「無罪」(接受)?主要有兩種方法。

臨界區域法 (The Critical Region Method)

臨界區域 (Critical Region)(或拒絕域)是指一系列極不可能純屬偶然發生的數值,如果我們的檢定統計量落在此區域內,我們就拒絕 \(H_0\)。
臨界值 (Critical Value) 是劃分此區域的「界線」數字。

\(p\)-值法 (The \(p\)-value Method)

\(p\)-值 (\(p\)-value) 是在假設 \(H_0\) 為真的前提下,觀察到結果至少與實際觀測值一樣極端的機率。
- 如果 \(p\)-值 \(\leq\) 顯著性水平 \(\rightarrow\) 拒絕 \(H_0\)(這結果非常罕見!)
- 如果 \(p\)-值 \( > \) 顯著性水平 \(\rightarrow\) 不拒絕 \(H_0\)(這結果可能只是運氣好。)

你知道嗎? 顯著性水平實際上是犯下「第一型錯誤 (Type I error)」的機率,意即當虛無假設實際上為真時,你卻拒絕了它!我們將這個水平保持在較低數值,以避免犯錯。

4. 進行檢定的步驟指南

如果一開始覺得很困難,別擔心;每次都遵循這五個步驟即可:

第 1 步:列出你的假設。 先定義 \(p\)(例如:「令 \(p\) 為種子發芽的機率」),然後寫出 \(H_0\) 和 \(H_1\)。

第 2 步:列出分佈。 在虛無假設下,變數 \(X\) 服從二項分佈:\(X \sim B(n, p)\)。

第 3 步:計算機率。 使用計算機的二項累積分佈函數 (BCD) 來找出結果「至少與此一樣極端」的機率。
- 對於「大於」檢定,找出 \(P(X \geq x) = 1 - P(X \leq x-1)\)。
- 對於「小於」檢定,找出 \(P(X \leq x)\)。

第 4 步:比較。 將你的 \(p\)-值與顯著性水平進行比較。

第 5 步:在語境中得出結論。 這是學生最容易丟分的地方!你必須提到具體的情境。

常見錯誤: 永遠不要說「H0 絕對是真的」或「H1 絕對是假的」。統計學是關於證據,而不是絕對確定。請使用非肯定語氣,例如「沒有足夠證據顯示……」。

5. 真實世界案例

情境: 一枚硬幣擲了 20 次,其中 15 次為正面。在 5% 的顯著性水平下,這枚硬幣是否偏向正面?

1. 假設: \(p\) 為正面機率。\(H_0: p = 0.5\);\(H_1: p > 0.5\)(1 尾檢定)。

2. 分佈: 在 \(H_0\) 下,\(X \sim B(20, 0.5)\)。

3. 計算: 我們觀察到 15 次正面。我們需要得到 15 或更多次的機率。
\(P(X \geq 15) = 1 - P(X \leq 14) \approx 0.0207\)。

4. 比較: \(0.0207\) (2.07%) 小於 \(0.05\) (5%)。

5. 結論: 0.0207 小於 0.05,因此我們拒絕 \(H_0\)。在 5% 的水平下,有足夠證據顯示這枚硬幣偏向正面。

重點總結: 如果你結果的發生機率小於顯著性水平,代表它太奇怪了,不可能是巧合。拒絕那個「平庸」的 \(H_0\) 吧!

常見錯誤總結

- 使用樣本比例: 不要寫 \(H_0: p = 15/20\)。假設永遠是關於理論機率(如 \(0.5\))。
- 方向錯誤: 在「大於」檢定中,確保你計算的是上尾 (\(P(X \geq x)\))。
- 遺忘情境: 在最後的句子中,務必提到硬幣、種子或題目涉及的具體事物。
- 雙尾混淆: 記得在 2 尾檢定中,將你的 \(p\)-值與顯著性水平的一半比較(或將你的 \(p\)-值乘以 2)。