歡迎來到統計假設檢定!
你有沒有試過說:「我敢賭我拋這枚硬幣,出現正面的次數會超過一半」,或者「我覺得這種新藥比舊藥更有效」?在統計學中,我們不只是隨便猜測;我們使用假設檢定 (Hypothesis Testing) 來看看數據是否真的支持我們的說法。如果剛開始覺得這有點抽象,別擔心——把它想像成你是個數學偵探。你正在檢視證據(數據),看看是否真的發生了「犯罪」(某種改變)!
1. 假設檢定的術語
在開始計算之前,我們需要學習一下「行話」。統計檢定有一套專門的術語,你必須正確使用它們才能拿到滿分。
兩個假設
每個檢定都始於兩個相對的陳述:
1. 虛無假設 (Null Hypothesis, \(H_0\)): 這是「現狀」。它假設沒有任何事情改變,一切都很正常。對於二項分佈,我們將其寫為 \(H_0: p = \text{某個數值}\)。
2. 對立假設 (Alternative Hypothesis, \(H_1\)): 這是我們正在調查的主張。它是「等等,我覺得有東西真的不一樣了!」的陳述。我們將其寫為 \(H_1: p < \dots\)、\(H_1: p > \dots\) 或 \(H_1: p \neq \dots\)。
比喻:法庭
想像一場審判。虛無假設是被告「無罪」。我們假設他們是無罪的,除非我們找到了「排除合理懷疑」的證據來證明對立假設(他們是「有罪」的)。
必須知道的重要術語
檢定統計量 (Test Statistic): 這是你從實驗中得到的實際結果(例如:「我拋了 10 次硬幣,出現了 8 次正面」)。
顯著性水平 (Significance Level, \(\alpha\)): 這是證據必須跨越的「門檻」。常見的水平是 5% (0.05) 或 1% (0.01)。如果我們的結果發生機率小於這個門檻,我們就拒絕 \(H_0\)。
p值 (p-value): 在虛無假設為真的情況下,獲得該結果(或比該結果更極端的情況)的實際機率。
臨界值 (Critical Value): 落在拒絕域 (Critical Region) 內的第一個數值。
拒絕域 (Critical Region): 一組數值範圍,如果結果落入其中,代表證據強烈到足以讓我們決定拒絕虛無假設。
快速回顧:
- \(H_0\) 永遠是 "="。
- \(H_1\) 是 "<"、">" 或 "\(\neq\)"。
- 檢定統計量只是你觀察到的成功次數。
2. 單尾檢定 vs. 雙尾檢定
我們怎麼知道要往哪個方向看?這取決於題目的措辭!
單尾檢定 (1-Tail Test)
當我們尋找單一特定方向的變化時,使用單尾檢定。
例子:「檢定破損雞蛋的比例是否減少了。」
\(H_1: p < 0.05\)
雙尾檢定 (2-Tail Test)
當我們尋找任何變化(不論方向)時,使用雙尾檢定。
例子:「檢定投選 A 黨的人數比例是否改變了。」
\(H_1: p \neq 0.4\)
記憶小撇步:
如果題目說「增加」或「減少」,用單尾;如果題目說「改變」或「不同」,用雙尾!
3. 進行檢定:分步指南
讓我們來看看如何使用二項分佈 (Binomial Distribution) \(X \sim B(n, p)\) 實際進行檢定。
第 1 步:列出假設
務必先定義 \(p\)(例如:「設 \(p\) 為種子發芽的機率」)。然後寫出 \(H_0\) 和 \(H_1\)。
第 2 步:列出顯著性水平
通常題目會給出(例如:5%)。
第 3 步:列出分佈
在虛無假設下,分佈是什麼?例如:\(X \sim B(20, 0.4)\)。
第 4 步:計算 p 值
使用你的計算機找出獲得該結果或更極端結果的機率。
- 若 \(H_1: p > \dots\),計算 \(P(X \geq \text{觀察值})\)。
- 若 \(H_1: p < \dots\),計算 \(P(X \leq \text{觀察值})\)。
第 5 步:比較並得出結論
如果你的 p 值小於顯著性水平,你便拒絕 \(H_0\)。表示有「足夠證據」。
如果你的 p 值大於顯著性水平,你便不拒絕 \(H_0\)。表示「證據不足」。
重要提示: 在雙尾檢定中,你必須將你的 p 值與顯著性水平的一半進行比較(例如:若水平為 5%,則將 p 值與兩端的 2.5% 進行比較)。
核心重點:
「若 p 值低,虛無必須走!」(如果 p 值 < 顯著性水平,拒絕 \(H_0\))。
4. 拒絕域 (Critical Regions)
有時,考官可能不會要求 p 值,而是要求拒絕域。這是一組所有會導致你拒絕虛無假設的可能結果。
例子: 如果你拋 10 次硬幣,拒絕域可能是 \(X=0, 1\) 或 \(X=9, 10\)。如果你的實際結果落在這些「區域」內,你就要拒絕 \(H_0\)。
你知道嗎?
實際顯著性水平是落入拒絕域的真實機率。因為二項分佈是離散的(你不可能有 4.5 次成功),所以實際顯著性水平通常會略低於要求的水平(例如:4.2% 而不是 5%)。
5. 避免常見錯誤
不要掉進這些陷阱!
1. 混淆 \(H_0\) 和 \(H_1\): 記住,\(H_0\) 永遠是那個包含「等於」的。
2. 忘記背景: 在檢定結束時,你必須寫一句話回歸題目背景。不要只說「拒絕 \(H_0\)」,要說「有足夠證據顯示破損雞蛋的比例已經減少」。
3. 使用錯誤的不等式: 如果你是在檢定「增加」,你需要計算 \(P(X \geq x)\)。學生經常不小心計算成 \(P(X \leq x)\)。
4. 誤解顯著性水平: 要明白顯著性水平是錯誤拒絕虛無假設的機率。換句話說,這是當一切其實只是運氣好時,我們說「情況改變了!」的機率。
總結檢查清單
- 用文字定義參數 \(p\)。
- 寫出 \(H_0\) 和 \(H_1\)。
- 從數據中識別檢定統計量。
- 使用計算機找到 p 值或拒絕域。
- 與顯著性水平進行比較。
- 在題目背景下寫出最終結論。
繼續練習!假設檢定是一個邏輯過程。一旦掌握了這些步驟,你會發現它是 Paper 2 中最容易預測的部分之一!