歡迎來到假設檢定 (Hypothesis Testing)!
你有沒有想過,一枚「幸運」硬幣是否真的有偏差?或者一種新藥是否真的比舊藥更有效?假設檢定就像是數學界的偵探遊戲。在本章中,我們將學習如何運用二項分佈 (Binomial Distribution) 來判斷關於比例的說法是否合理,抑或這只是隨機巧合。
如果起初覺得這些文字有點抽象,請不用擔心——一旦掌握了當中的邏輯,數學計算其實非常直接明瞭!
1. 「核心概念」:檢定的邏輯
假設你的朋友聲稱他能預測 80% 的硬幣投擲結果。你觀察他投擲了 10 次,結果他猜中了 9 次。這純粹是運氣,還是他真的有「超能力」?
在假設檢定中,我們總是先假設現狀沒有改變(例如硬幣是公平的)。接著,我們會計算得到「9 次中 9 次」這種極端結果的機率。如果這個機率微乎其微,我們就會「拒絕」這只是運氣的說法。
你需要知道的關鍵術語
虛無假設 (Null Hypothesis, \(H_0\)): 這代表「現狀」。我們假設比例 \(p\) 與以往完全相同。
例子:\(H_0: p = 0.5\)(硬幣是公平的)。
對立假設 (Alternative Hypothesis, \(H_1\)): 這是我們實際要檢測的目標。它是指懷疑比例已經發生了改變。
例子:\(H_1: p > 0.5\)(硬幣對正面有偏差)。
檢定統計量 (Test Statistic): 這是我們在樣本中觀察到的實際「成功」次數(例如你朋友投擲出的 9 個正面)。
顯著性水平 (Significance Level, \(\alpha\)): 這是我們設定的「門檻」。通常為 5% (0.05)。如果觀察到結果的機率低於這個數值,我們就稱其為「具統計顯著性」。
快速回顧: 假設檢定就像一場法庭審判。被告在未經證實有罪前是無罪的。在數學中,\(H_0\) 代表「無罪」(無事發生),我們需要強而有力的證據來證明「有罪」(\(H_1\))。
2. 設定假設
在為二項分佈比例 \(p\) 編寫假設時,必須始終使用參數 \(p\),並以文字說明其代表的意義。
你可能會進行三種類型的檢定:
1. 單尾檢定(上尾): 檢測比例是否增加了。\(H_1: p > \text{數值}\)。
2. 單尾檢定(下尾): 檢測比例是否減少了。\(H_1: p < \text{數值}\)。
3. 雙尾檢定: 檢測比例是否在任一方向上有所改變。\(H_1: p \neq \text{數值}\)。
常見錯誤: 永遠不要在假設中使用你的樣本結果。例如,如果你觀察到 8/10 的成功率,不要寫成 \(H_0: p = 0.8\)。假設是關於整個總體 (population),而不僅僅是你的小樣本。
3. 逐步檢定過程
請為每一題遵循以下 5 個步驟:
步驟 1:陳述假設。
定義 \(p\)(例如:「其中 \(p\) 為種子發芽的機率」)。
寫出 \(H_0: p = \dots\) 和 \(H_1: p < \dots\)(或是 \(>\) 或 \(\neq\))。
步驟 2:識別模型。
在虛無假設下陳述分佈:\(X \sim B(n, p)\)。
\(n\) 是你的樣本大小,而 \(p\) 是來自 \(H_0\) 的數值。
步驟 3:計算 p-值 (p-value)。
這是得到你觀察到的結果或更極端結果的機率。
- 若檢測 \(p > \dots\),計算 \(P(X \ge \text{觀察值})\)。
- 若檢測 \(p < \dots\),計算 \(P(X \le \text{觀察值})\)。
步驟 4:與顯著性水平比較。
如果 p-值 \(\le\) 顯著性水平,我們拒絕 \(H_0\)。
如果 p-值 \(>\) 顯著性水平,我們無法拒絕 \(H_0\)。
步驟 5:在情境中作結論。
使用類似這樣的句子:「在 5% 的顯著性水平下,有足夠證據顯示……的比例已經增加。」
你知道嗎? 我們從不說「接受」\(H_0\)。我們只會說沒有足夠的證據來拒絕它。這就像陪審團說「無罪釋放」——這並不一定代表真的「清白」,只是證明不足而已!
4. 臨界區域與臨界值
有時,題目不會要求計算 p-值,而是要求找出臨界區域 (Critical Region)。這是指你會拒絕 \(H_0\) 的數值範圍。
臨界值 (Critical Value): 進入拒絕區域的第一個數值。
接受區域 (Acceptance Region): 我們保持 \(H_0\) 的數值範圍。
OCR 重要規則: 對於指定的顯著性水平(例如 5%),檢定統計量落在拒絕區域內的機率,必須是在不超過顯著性水平的前提下,盡可能地接近該水平。
雙尾檢定的變數
在雙尾檢定 (\(H_1: p \neq \dots\)) 中,「懷疑」僅指事情有所改變。我們將顯著性水平平分為二。
例子:在 5% 的顯著性水平下,我們會在下端尋找 2.5%,並在上端尋找 2.5%。
記憶小撇步: 雙尾 = 兩個方向 = 百分比的兩個半部。
5. 理解顯著性水平
「5% 顯著性水平」實際上是什麼意思?
它是錯誤地拒絕虛無假設的機率。換句話說,有 5% 的可能性是我們斷定事情發生了改變,但實際上,該結果只是一次罕見的運氣。
快速總結表:
- p-值較小 (\(<\alpha\)): 結果罕見 \(\rightarrow\) 有證據反對 \(H_0\) \(\rightarrow\) 拒絕 \(H_0\)。
- p-值較大 (\(>\alpha\)): 結果常見 \(\rightarrow\) 無證據反對 \(H_0\) \(\rightarrow\) 無法拒絕 \(H_0\)。
常見陷阱
1. 忘記情境: 你的最後一句話必須提到真實世界的情況(種子、硬幣、選票等)。
2. 計算錯誤: 記得在計算機上,\(P(X \ge 8)\) 要計算為 \(1 - P(X \le 7)\)。
3. 假設符號: 永遠使用 \(p\) 來代表總體比例。不要使用 \(x\) 或 \(\mu\)。
4. 進位: 不要過早將 p-值四捨五入;保持精確度以便與顯著性水平比較。
重點總結: 假設檢定不是為了達到 100% 的確定。它是為了判斷在當前的規則下,一個結果是否「太過不可能」以致於不可能是由隨機產生的。利用計算機找出這些機率,與「門檻」(顯著性水平)進行比較,並寫下明確的結論!