歡迎來到假設檢定 (Hypothesis Testing) 的世界!
你有沒有聽過別人誇下海口——例如「我擲硬幣有 80% 的機率會出現正面」——然後心想:「我敢說他們只是運氣好罷了」?其實,假設檢定正是數學上用來證明一個人是真的有「實力」(或是某個情況真的發生了變化),還是純粹「運氣好」的工具。
在本章中,我們將學習如何利用二項分佈 (Binomial Distribution) 來檢定關於比例 (proportions) 的主張。如果一開始覺得有點棘手也不用擔心,我們會一步步拆解教學!
1. 「數學偵探」的專用語言
在開始計算之前,我們必須先掌握一些術語。你可以把假設檢定想像成一場法庭審判。
假設 (The Hypotheses)
- 虛無假設 \( (H_0) \): 這就是「現狀」。它假設一切都沒有改變,原有的主張是正確的。我們總是將其寫作 \( H_0: p = \text{某個數值} \)。
- 對立假設 \( (H_1) \): 這就是「有事情發生了」的假設。這是你懷疑實際發生的情況。它可以是 \( p > \)、\( p < \) 或 \( p \neq \)。
檢定工具
- 檢定統計量 (Test Statistic): 這是你在樣本中觀察到的實際結果(例如:「我擲了 20 次硬幣,結果出現 15 次正面」)。
- 顯著性水平 \( (\alpha) \): 這是我們設立的「懷疑閾值」,通常為 5% (0.05) 或 1% (0.01)。這代表我們願意承擔犯錯的風險上限。
- p 值 (p-value): 若虛無假設為真,獲得你目前觀察到之結果(或更極端結果)的機率。
小提醒: 在作答時,你必須明確定義 \( p \) 代表什麼。例如:「其中 \( p \) 代表喜歡吃辣的人口比例。」
2. 單尾檢定 vs. 雙尾檢定
我們設定對立假設 \( (H_1) \) 的方式,取決於我們想要檢測什麼。
單尾檢定 (One-Tail Test)
當我們懷疑比例有明確的增加或明確的減少時使用。
例子:「我認為這種新藥比舊藥更有效。」
\( H_1: p > 0.5 \)
雙尾檢定 (Two-Tail Test)
當我們懷疑比例只是有所改變(我們不知道是變多還是變少)時使用。
例子:「我認為袋子裡紅糖果的比例與標籤上寫的不同。」
\( H_1: p \neq 0.5 \)
記憶小撇步:
單尾 = 單一方向(更高 或 更低)。
雙尾 = 兩個方向(更高 或 更低——總之就是不一樣!)。
重要貼士: 在雙尾檢定中,你必須將顯著性水平平分到兩端。如果總顯著性水平是 5%,你需要在兩端各自尋找 2.5% (0.025) 的機率區間。
3. 臨界區間法 (The Critical Region Approach)
臨界區間 (Critical Region)(又稱拒絕區間)就是「禁區」。如果我們的檢定統計量落入這個區域,我們就拒絕虛無假設。
如何找出它:
使用計算機的二項累積分布函數 (Binomial Cumulative Distribution, BCD)。你要尋找的是使得機率首次低於(或等於)顯著性水平的那個 \( x \) 值。
例子: 如果我們在 5% 的顯著性水平下,針對 \( X \sim B(20, 0.5) \) 檢測比例是否增加:
我們檢查 \( P(X \geq 15) \)、\( P(X \geq 16) \) 等。如果 \( P(X \geq 15) = 0.0207 \)(小於 0.05),那麼 15 就在我們的臨界區間內。
你知道嗎? 顯著性水平實際上就是錯誤拒絕虛無假設的機率。這就是所謂的「誤報」率!
4. 步驟教學:執行檢定
每次執行檢定時請遵循以下步驟,以確保不會失分:
- 列出假設: 清晰寫下 \( H_0 \) 和 \( H_1 \),並定義 \( p \)。
- 定義分佈: 說明模型,例如在 \( H_0 \) 下 \( X \sim B(n, p) \)。
- 選擇顯著性水平: 通常題目會給定(例如 5%)。
- 計算機率: 計算得到你的結果或更極端結果的機率。
- 如果 \( H_1: p > k \),計算 \( P(X \geq \text{observed}) \)。
- 如果 \( H_1: p < k \),計算 \( P(X \leq \text{observed}) \)。
- 比較: 你的機率(p 值)是否小於顯著性水平?
- 總結: 寫出正式的結論。一定要結合題目背景來寫!
避免常見錯誤: 不要只寫「拒絕 \( H_0 \)」。你必須加上背景描述,例如:「在 5% 的顯著性水平下,有足夠的證據顯示故障燈泡的比例已經下降。」
5. 總結與重點摘要
假設檢定並不是要追求 100% 的確定性;它的重點在於我們是否有足夠的證據來改變我們的看法。
速查表:
- 接受區間 (Acceptance Region): 我們保留 \( H_0 \) 的數值範圍。
- 臨界值 (Critical Value): 落入臨界區間的第一個數值。
- 顯著性水平: 「截止」機率(誤報的風險)。
- 計算機: 務必使用累積函數(List 或 Variable 模式)來檢查分佈「尾端」的機率。
現實類比: 想像一個煙霧警報器。如果它太靈敏(顯著性水平過高),烤吐司時它就會響(錯誤地拒絕了 \( H_0 \))。如果它不夠靈敏(顯著性水平太低),它可能會漏掉真正的火災。我們選擇一個水平(如 5%)來平衡這些風險!
核心建議: 檢查時務必留意檢定的方向。對於 \( P(X \geq x) \),請記住大多數計算機直接計算的是 \( P(X \leq x) \),因此你可能需要用 \( 1 - P(X \leq x-1) \)。如果不確定,請檢查你的計算機說明書!