Hypothesis Testing - Further Mathematics (9FM0) - Pearson Edexcel A Level

歡迎來到假設檢定 (Hypothesis Testing)！

你好！歡迎來到 Further Statistics 1 中最實用且強大的章節之一。你有沒有想過科學家是如何判斷新藥是否真的有效，或者工廠是如何確認機器運作正常的？他們用的就是假設檢定。

在普通 A Level 數學中，你已經學過如何對二項分佈 (Binomial distribution) 進行檢定。在 Further Mathematics (9FM0) 中，我們將這些概念應用到兩個新的「角色」上：泊松分佈 (Poisson Distribution) 和 幾何分佈 (Geometric Distribution)。別擔心，這聽起來或許有些深奧，但它的核心其實只是一個正式的方法，用來問：「這個結果純屬巧合，還是真的有什麼發生了變化？」

1. 檢定泊松分佈的平均值

在泊松分佈中，我們通常關注事件在固定區間（如時間或空間）內發生的速率。我們將此速率稱為 \(\lambda\) (lambda)，有時也稱為 \(\mu\)。

設定情境：假設

每個檢定都始於兩個相對立的陳述：

1. 虛無假設 (Null Hypothesis, \(H_0\))：這是「現狀」。我們假設速率 \(\lambda\) 沒有改變。我們總是將其寫為 \(H_0: \lambda = \text{number}\)。
2. 對立假設 (Alternative Hypothesis, \(H_1\))：這是我們懷疑實際發生的情況。速率可能增加 (\(>\))、減少 (\(<\))，或者只是發生了改變 (\(\neq\))。

現實類比：流星

想像一下，你通常平均每小時看到 3 顆流星 (\(\lambda = 3\))。某天晚上，你看到了 8 顆。你可能會想：「哇，流星出現的速率增加了！」假設檢定能幫你判斷看到 8 顆純粹是因為那個晚上運氣好（虛無假設），還是真的發生了流星雨（對立假設）。

逐步操作：如何進行檢定

1. 清楚寫出假設，並使用參數 \(\lambda\)。
2. 確認分佈：在虛無假設下，\(X \sim Po(\lambda)\)。
3. 計算機率：計算得到觀察值或更極端數值的機率。請使用計算機的泊松分佈累積機率函數 (Poisson CD)。
4. 與顯著性水平 (\(\alpha\)) 比較。如果你的機率小於 \(\alpha\)，代表結果「太奇怪了，不可能是巧合」，我們會拒絕 \(H_0\)。
5. 寫出結論：用簡單的語言寫出結論，並結合題目背景（例如：「有足夠的證據顯示流星出現的速率已經增加。」）

快速複習：記得如果你改變了區間的大小（例如從 1 小時變為 2 小時），在開始檢定前，你必須相應地調整你的 \(\lambda\)！

關鍵點：對於泊松檢定，我們是在檢查觀察到的事件發生次數與預期的平均速率相比，是否「太高」或「太低」。

2. 檢定幾何分佈的參數 \(p\)

幾何分佈關注的是「等待時間」——需要多少次試驗才會出現第一次成功？在這裡，我們要檢定的是成功機率 \(p\)。

理解邏輯

如果成功機率 \(p\) 非常高，你會預期第一次成功很快就會出現。如果 \(p\) 非常低，你則會預期要等很久。如果你等待的時間比預期長得多，或許真實的 \(p\) 比你想像中要小！

設定假設

對於幾何分佈檢定，你的假設必須以 \(p\) 來表示：
\(H_0: p = \text{value}\)
\(H_1: p < \text{value}\) (或 \(>\) 或 \(\neq\))

公式小技巧

雖然你可以使用計算機，但幾何分佈在處理「等待超過 \(k\) 次試驗」時有一個非常簡單的公式：
\(P(X > k) = (1 - p)^k\)
這是因為若要在第 \(k\) 次試驗之後才出現第一次成功，代表前 \(k\) 次試驗都必須是失敗的。這通常是在這些檢定中計算機率最簡單的方法！

常見錯誤：在幾何分佈檢定中，「更極端」的方向可能會讓人感到反直覺。如果你在檢定 \(p\) 是否減少 (\(H_1: p < 0.2\))，那麼「極端」的結果其實是 \(X\) 的較大值（即花了很長時間才獲得成功）。

關鍵點：對於幾何分佈檢定，我們利用直到第一次成功所需的試驗次數，來判定成功機率 \(p\) 是否與聲稱的一致。

3. 顯著性水平與拒絕域

顯著性水平 (\(\alpha\))：這是「奇怪程度的門檻」。常見的水平有 5% (0.05) 或 1% (0.01)。如果我們結果的機率（p-value）小於這個水平，我們就會拒絕虛無假設。

單尾與雙尾檢定

1. 單尾檢定 (One-Tailed)：你只在乎參數是否往某個特定方向移動（例如：「速率是否增加了？」）。你直接將整個 5% 與你的結果進行比較。
2. 雙尾檢定 (Two-Tailed)：你是在乎參數是否產生了任何變化（例如：「速率是否與之前不同？」）。你必須將顯著性水平平分（例如：高標一端 2.5%，低標一端 2.5%）。

記憶小幫手：將雙尾檢定想像成雙刃劍。你必須同時留意兩邊的情況，所以你要把你的「危險區」（顯著性水平）一分為二！

你知道嗎？當你拒絕了事實上正確的虛無假設時，就會發生第一型錯誤 (Type I error)。事實上，顯著性水平正是犯下這種錯誤的機率！

4. 成功檢查清單

別擔心，如果一開始覺得棘手很正常！只要在回答每個問題時遵循以下清單：

1. 定義參數：清楚說明 \(\lambda\) 或 \(p\) 在題目背景中代表什麼。
2. 寫出 \(H_0\) 和 \(H_1\)：使用正確的符號 (\(\lambda, \mu,\) 或 \(p\))。
3. 確認分佈：寫出 \(X \sim Po(\dots)\) 或 \(X \sim Geo(\dots)\)。
4. 尋找 p-value：計算觀察值或更極端數值的機率。
5. 比較並決策：是否 \(p \text{-value} < \alpha\)？如果是，則拒絕 \(H_0\)。
6. 結合背景下結論：結尾務必寫上：「在 [x]% 的顯著性水平下，有 [足夠/不足夠] 的證據顯示 [背景內容]...」

最後小提示：在進行泊松檢定時，如果題目給出的是多個區間內的總事件數，你可以選擇調整 \(\lambda\) 以匹配新的時間段，或者保持 \(\lambda\) 不變並使用泊松分佈的「可加性」來建立一個新的分佈。兩者皆可，但調整 \(\lambda\) 通常會更簡單！

關鍵點：假設檢定是一個邏輯過程。只要你遵循步驟並保持標記整潔，你會發現這將是 Further Statistics 試卷中最穩拿的分數來源之一。

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。