歡迎來到假設檢定 (Hypothesis Testing)!
你好!歡迎來到 Further Statistics 1 中最實用且強大的章節之一。你有沒有想過科學家是如何判斷新藥是否真的有效,或者工廠是如何確認機器運作正常的?他們用的就是假設檢定。
在普通 A Level 數學中,你已經學過如何對二項分佈 (Binomial distribution) 進行檢定。在 Further Mathematics (9FM0) 中,我們將這些概念應用到兩個新的「角色」上:泊松分佈 (Poisson Distribution) 和 幾何分佈 (Geometric Distribution)。別擔心,這聽起來或許有些深奧,但它的核心其實只是一個正式的方法,用來問:「這個結果純屬巧合,還是真的有什麼發生了變化?」
1. 檢定泊松分佈的平均值
在泊松分佈中,我們通常關注事件在固定區間(如時間或空間)內發生的速率。我們將此速率稱為 \(\lambda\) (lambda),有時也稱為 \(\mu\)。
設定情境:假設
每個檢定都始於兩個相對立的陳述:
1. 虛無假設 (Null Hypothesis, \(H_0\)):這是「現狀」。我們假設速率 \(\lambda\) 沒有改變。我們總是將其寫為 \(H_0: \lambda = \text{number}\)。
2. 對立假設 (Alternative Hypothesis, \(H_1\)):這是我們懷疑實際發生的情況。速率可能增加 (\(>\))、減少 (\(<\)),或者只是發生了改變 (\(\neq\))。
現實類比:流星
想像一下,你通常平均每小時看到 3 顆流星 (\(\lambda = 3\))。某天晚上,你看到了 8 顆。你可能會想:「哇,流星出現的速率增加了!」假設檢定能幫你判斷看到 8 顆純粹是因為那個晚上運氣好(虛無假設),還是真的發生了流星雨(對立假設)。
逐步操作:如何進行檢定
1. 清楚寫出假設,並使用參數 \(\lambda\)。
2. 確認分佈:在虛無假設下,\(X \sim Po(\lambda)\)。
3. 計算機率:計算得到觀察值或更極端數值的機率。請使用計算機的泊松分佈累積機率函數 (Poisson CD)。
4. 與顯著性水平 (\(\alpha\)) 比較。如果你的機率小於 \(\alpha\),代表結果「太奇怪了,不可能是巧合」,我們會拒絕 \(H_0\)。
5. 寫出結論:用簡單的語言寫出結論,並結合題目背景(例如:「有足夠的證據顯示流星出現的速率已經增加。」)
快速複習:記得如果你改變了區間的大小(例如從 1 小時變為 2 小時),在開始檢定前,你必須相應地調整你的 \(\lambda\)!
關鍵點:對於泊松檢定,我們是在檢查觀察到的事件發生次數與預期的平均速率相比,是否「太高」或「太低」。
2. 檢定幾何分佈的參數 \(p\)
幾何分佈關注的是「等待時間」——需要多少次試驗才會出現第一次成功?在這裡,我們要檢定的是成功機率 \(p\)。
理解邏輯
如果成功機率 \(p\) 非常高,你會預期第一次成功很快就會出現。如果 \(p\) 非常低,你則會預期要等很久。如果你等待的時間比預期長得多,或許真實的 \(p\) 比你想像中要小!
設定假設
對於幾何分佈檢定,你的假設必須以 \(p\) 來表示:
\(H_0: p = \text{value}\)
\(H_1: p < \text{value}\) (或 \(>\) 或 \(\neq\))
公式小技巧
雖然你可以使用計算機,但幾何分佈在處理「等待超過 \(k\) 次試驗」時有一個非常簡單的公式:
\(P(X > k) = (1 - p)^k\)
這是因為若要在第 \(k\) 次試驗之後才出現第一次成功,代表前 \(k\) 次試驗都必須是失敗的。這通常是在這些檢定中計算機率最簡單的方法!
常見錯誤:在幾何分佈檢定中,「更極端」的方向可能會讓人感到反直覺。如果你在檢定 \(p\) 是否減少 (\(H_1: p < 0.2\)),那麼「極端」的結果其實是 \(X\) 的較大值(即花了很長時間才獲得成功)。
關鍵點:對於幾何分佈檢定,我們利用直到第一次成功所需的試驗次數,來判定成功機率 \(p\) 是否與聲稱的一致。
3. 顯著性水平與拒絕域
顯著性水平 (\(\alpha\)):這是「奇怪程度的門檻」。常見的水平有 5% (0.05) 或 1% (0.01)。如果我們結果的機率(p-value)小於這個水平,我們就會拒絕虛無假設。
單尾與雙尾檢定
1. 單尾檢定 (One-Tailed):你只在乎參數是否往某個特定方向移動(例如:「速率是否增加了?」)。你直接將整個 5% 與你的結果進行比較。
2. 雙尾檢定 (Two-Tailed):你是在乎參數是否產生了任何變化(例如:「速率是否與之前不同?」)。你必須將顯著性水平平分(例如:高標一端 2.5%,低標一端 2.5%)。
記憶小幫手:將雙尾檢定想像成雙刃劍。你必須同時留意兩邊的情況,所以你要把你的「危險區」(顯著性水平)一分為二!
你知道嗎?當你拒絕了事實上正確的虛無假設時,就會發生第一型錯誤 (Type I error)。事實上,顯著性水平正是犯下這種錯誤的機率!
4. 成功檢查清單
別擔心,如果一開始覺得棘手很正常!只要在回答每個問題時遵循以下清單:
1. 定義參數:清楚說明 \(\lambda\) 或 \(p\) 在題目背景中代表什麼。
2. 寫出 \(H_0\) 和 \(H_1\):使用正確的符號 (\(\lambda, \mu,\) 或 \(p\))。
3. 確認分佈:寫出 \(X \sim Po(\dots)\) 或 \(X \sim Geo(\dots)\)。
4. 尋找 p-value:計算觀察值或更極端數值的機率。
5. 比較並決策:是否 \(p \text{-value} < \alpha\)?如果是,則拒絕 \(H_0\)。
6. 結合背景下結論:結尾務必寫上:「在 [x]% 的顯著性水平下,有 [足夠/不足夠] 的證據顯示 [背景內容]...」
最後小提示:在進行泊松檢定時,如果題目給出的是多個區間內的總事件數,你可以選擇調整 \(\lambda\) 以匹配新的時間段,或者保持 \(\lambda\) 不變並使用泊松分佈的「可加性」來建立一個新的分佈。兩者皆可,但調整 \(\lambda\) 通常會更簡單!
關鍵點:假設檢定是一個邏輯過程。只要你遵循步驟並保持標記整潔,你會發現這將是 Further Statistics 試卷中最穩拿的分數來源之一。