歡迎來到假設檢定的世界!
你有沒有聽過別人誇下海口,說:「我有 80% 的把握能預測硬幣投擲的結果」,然後心想:「我才不信呢!」?假設檢定 (Hypothesis testing) 就是統計學中的偵探遊戲。它讓我們能夠針對某個主張,透過檢視證據(數據)來判斷該主張是否可信,還是純屬胡說八道。
在本章中,我們將專注於使用二項分佈 (Binomial Distribution) 來檢定關於機率的主張。別擔心,這些術語聽起來有點嚇人,但我們會一步一步拆解給你聽!
1. 核心概念:無罪推定原則
假設檢定的邏輯就像法庭審判一樣。在法庭上,我們假設被告是無罪的,直到有足夠的證據證明他有罪。在統計學中:
- 虛無假設 (Null Hypothesis, \(H_0\)): 這是「無罪」或「現狀」的立場。我們假設沒有任何改變,或者該主張是標準情況。在 MEI 的課程中,其形式永遠是 \(H_0: p = \text{數值}\)。
- 對立假設 (Alternative Hypothesis, \(H_1\)): 這是「有罪」的立場。這是我們懷疑實際發生的情況(例如,機率上升、下降或單純發生了改變)。
現實生活範例: 一位園丁聲稱她種植的種子發芽率為 70%。你認為這些種子的品質其實沒那麼好。
\(H_0: p = 0.7\) (該主張為真)
\(H_1: p < 0.7\) (發芽率低於聲稱的數值)
重點複習:
- 務必始終使用 \(p\) (母體參數)來書寫假設。
- \(H_0\) 永遠使用等號 (\(=\))。
- \(H_1\) 使用小於 (\(<\))、大於 (\(>\)) 或不等於 (\(\neq\))。
2. 檢定的語言
要進行檢定,你需要了解「遊戲規則」。以下是你在考試中會看到的關鍵術語:
檢定統計量 (Test Statistic)
這就是「證據」。它是你在樣本中觀察到的實際結果。例如,如果你種了 20 顆種子,只有 10 顆發芽,那麼 10 就是你的檢定統計量。
顯著水準 (Significance Level, \(\alpha\))
這是我們的「舉證門檻」。通常設定為 5% 或 1%。它代表錯誤拒絕虛無假設的機率。如果觀察到的結果純屬巧合的機率低於這個水準,我們就會「拒絕」虛無假設。
p 值 (p-value)
p 值是指在假設 \(H_0\) 為真的前提下,觀察到該結果或更極端結果的機率。
記憶口訣:「p 值若太低,\(H_0\) 就要去!」(如果 \(p < \text{顯著水準}\),我們就拒絕 \(H_0\))。
拒絕域與臨界值 (Critical Regions and Critical Values)
拒絕域 (Critical region) 是指檢定統計量落入該範圍時,會導致我們拒絕 \(H_0\) 的數值範圍。臨界值 (Critical value) 則是進入該範圍的第一個數值。
關鍵結論: 如果你的檢定統計量落在拒絕域內,或是你的 p 值小於顯著水準,代表你有足夠的證據來支持你的懷疑 (\(H_1\))。
3. 單尾與雙尾檢定
我們該如何決定檢定的方向?這全取決於我們在尋找什麼。
- 單尾檢定 (1-Tail Test): 當我們懷疑機率在特定方向上有所改變時使用。
例子:「我覺得機率上升了 (\(p > \dots\))」或「我覺得機率下降了 (\(p < \dots\))」。 - 雙尾檢定 (2-Tail Test): 當我們懷疑機率改變了,但不確定是往哪個方向改變時使用。
例子:「我覺得機率不同了 (\(p \neq \dots\))」。
雙尾檢定的重要小貼士: 你必須將顯著水準減半!如果你是在 5% 的水準下進行檢定,你需要尋找兩端各 2.5% 的區域。
4. 一步一步來:如何進行二項式檢定
如果起初覺得棘手也沒關係,每次都按照這五個步驟做:
- 陳述假設: 清楚寫出 \(H_0: p = \dots\) 和 \(H_1: p \dots\)。
- 辨識模型: 寫出虛無假設下的分佈,例如 \(X \sim B(n, p)\)。
- 選擇顯著水準: 記下題目給定的水準(例如 5%)。
- 計算 p 值: 使用計算機,找出獲得該極端結果的機率。
- 若 \(H_1: p < k\),找出 \(P(X \leq \text{觀察值})\)。
- 若 \(H_1: p > k\),找出 \(P(X \geq \text{觀察值})\),即 \(1 - P(X \leq \text{觀察值} - 1)\)。 - 結論: 將你的 p 值與顯著水準進行比較,並根據題意寫出結論。
5. 寫出結論:MEI 的標準方式
MEI 的閱卷老師對結論的寫法非常講究!他們要求使用非斷言式 (non-assertive) 的語言。我們從不「證明」任何事,我們只會說是否有足夠的證據或沒有足夠的證據。
「優秀」結論範例:
「p 值 (0.032) 小於 5% 的顯著水準。在 5% 的顯著水準下,有足夠的證據顯示種子的發芽率已經下降。」
「不良」結論範例:
「p 值很低,所以發芽率一定是 60%。」(太過武斷!統計學處理的是機率,而不是絕對確定的事實)。
常見錯誤: 千萬不要只寫「接受 \(H_0\)」。應該說「沒有足夠的證據來拒絕 \(H_0\)」。這就像陪審團判決「無罪」——這並不代表被告 100% 清白,只是證明不足以定罪而已。
6. 總結速查
你知道嗎? 顯著水準其實就是「虛驚一場」的機率——也就是當虛無假設實際上為真時,我們卻錯誤地拒絕了它!
複習關鍵重點:
- \(H_0\): 現狀 (\(p =\))。
- \(H_1\): 懷疑點 (\(<\)、\(>\) 或 \(\neq\))。
- 單尾: 單一方向。雙尾: 任何變動(請記得將 % 減半!)。
- p 值 < 顯著水準: 結果顯著,拒絕 \(H_0\)。
- 結論: 必須結合題目背景,且語氣需謹慎、非斷言。
請繼續利用計算機的二項式累計功能多加練習——熟練度與精確度會讓這些題目變得容易許多!