歡迎來到假設檢定(Hypothesis Testing)的世界!
你有沒有聽過某個說法,心裡卻想著:「這真的可信嗎?」或許你的朋友聲稱他能預測硬幣正反面的準確率達 80%,又或是某公司宣稱他們的新種子發芽速度更快。在統計學中,我們不會憑空猜測;我們使用假設檢定來決定是否有足夠的證據去支持這些說法。
起初接觸這麼多新名詞可能會讓你感到困惑,別擔心!把它想像成法庭審判:我們假設一個人是無罪的(即「現狀」),除非我們有足夠的證據證明他有罪。讓我們一起拆解 OCR A Level 考試中所需的相關術語吧。
1. 兩個假設:\( H_0 \) 與 \( H_1 \)
每個檢定都始於兩個相對的敘述。我們總是使用參數(在本章中,通常是指 \( p \),即二項分佈中的成功機率)來書寫這些假設。
虛無假設(Null Hypothesis,\( H_0 \)): 這是「平淡」的版本。它假設什麼都沒有改變,情況與過去完全一樣。我們在這裡永遠使用等號。
例子:\( H_0: p = 0.5 \)(硬幣是公正的)。
對立假設(Alternative Hypothesis,\( H_1 \)): 這是「令人興奮」的版本。它是我們正要檢定的主張。我們會使用 \( > \)、\( < \) 或 \( \neq \) 等符號。
例子:\( H_1: p > 0.5 \)(硬幣偏向正面)。
小貼士:定義參數
OCR 的閱卷員很喜歡看到你定義符號!一定要在假設之後寫下:「其中 \( p \) 為...的總體比例」。
重點總結: \( H_0 \) 是「無罪」假設(相等),而 \( H_1 \) 是「有罪」嫌疑(不等)。
2. 檢定統計量與顯著水準
檢定統計量(Test Statistic): 這只是你從樣本中得到的結果。如果你投擲硬幣 20 次,得到 15 個正面,「15」就是你的檢定統計量。它是我們用來判斷 \( H_0 \) 的證據。
顯著水準(Significance Level,\( \alpha \)): 這是我們設定的證據「門檻」。常見的水準是 5%(\( 0.05 \))或 1%(\( 0.01 \))。
如果我們的結果純屬偶然的機率低於這個水準,我們就說該結果具有「顯著性」,並拒絕 \( H_0 \)。
你知道嗎?
顯著水準實際上就是錯誤地拒絕了虛無假設的機率。這是我們承擔犯錯的風險!
重點總結: 檢定統計量是證據,而顯著水準是我們用來判斷證據的門檻。
3. 單尾與雙尾檢定
我們要如何決定觀察的方向呢?這取決於題目的要求。
單尾檢定(1-Tail Test): 我們正在尋找特定方向的變化。
關鍵字:「增加」、「減少」、「更好」、「更差」。
例子:\( H_1: p > 0.2 \) 或 \( H_1: p < 0.2 \)。
雙尾檢定(2-Tail Test): 我們正在尋找任何方向的變化。
關鍵字:「已改變」、「不同」。
例子:\( H_1: p \neq 0.2 \)。
常見錯誤:
在 5% 水準的雙尾檢定中,你必須將顯著水準一分為二:2.5% 給「過高」的一端,2.5% 給「過低」的一端!
重點總結: 當你有明確方向時使用單尾檢定;當你只想確認數值是否改變時使用雙尾檢定。
4. 臨界值與臨界區域
把臨界區域(Critical Region)(或稱拒絕區域)想像成「紅色地帶」。如果我們的檢定統計量落在這個區域,這代表它發生的機率極低,幾乎不可能純屬巧合,因此我們拒絕 \( H_0 \)。
臨界值(Critical Value): 標誌著臨界區域起始的「邊界」數值。
接受區域(Acceptance Region): 沒有足夠證據讓我們改變想法、從而保留 \( H_0 \) 的數值範圍。
類比:跳高運動
臨界值是橫桿的高度。檢定統計量是你實際跳出的高度。如果你跳得比橫桿還高(落入臨界區域),你就完成了足以證明「現狀」被打破的壯舉!
重點總結: 如果你的結果在臨界區域內,就拒絕 \( H_0 \)。若不在,則「無法拒絕(fail to reject)」 \( H_0 \)。
5. P 值(P-value)
P 值是指在假設 \( H_0 \) 為真的情況下,觀察到比實際結果更極端或同樣極端的結果的機率。
簡單法則:
- 如果 P 值 \( \leq \) 顯著水準 \( \rightarrow \) 拒絕 \( H_0 \)。
- 如果 P 值 \( > \) 顯著水準 \( \rightarrow \) 不拒絕 \( H_0 \)。
記憶口訣:
「P 值若低,虛無(Null)必去;P 值若高,虛無(Null)可留。」
重點總結: P 值告訴我們結果發生的機率。極小的 P 值代表結果非常罕見,暗示 \( H_0 \) 可能是錯的。
6. 寫出完美的結論
OCR 對最終結論的用詞非常嚴格。你絕不能說你已經「證明(proven)」了什麼。統計學是關於證據,而非 100% 的確定性。
「兩部分」結論法:
第一部分:統計結果
陳述你是否拒絕 \( H_0 \),並提及顯著水準。
「在 5% 的顯著水準下,有足夠證據拒絕 \( H_0 \)……」
第二部分:情境結論
將結論連結回題目的情境。
「……這顯示支持新法律的人口比例已經增加。」
錯誤用詞(千萬別這樣寫!):
- 「我接受 \( H_0 \)」(我們只能說「無法拒絕」它)。
- 「這證明了硬幣有偏向」(這只能說是「暗示」或提供「證據」)。
重點總結: 說話要留有餘地。使用如「證據」、「顯示」和「可能」等詞彙。
重點總複習
- 虛無假設(\( H_0 \)): 「無變化」的敘述(永遠使用 \( = \))。
- 對立假設(\( H_1 \)): 「有變化」的敘述(使用 \( >, <, \text{ 或 } \neq \))。
- 顯著水準: 證據的門檻(例如 5%)。
- 臨界區域: 導致你拒絕 \( H_0 \) 的數值範圍。
- P 值: 結果純屬偶然發生的機率。