歡迎來到假設檢定!

你有沒有想過科學家是如何判定一種新藥是否真正有效,或是工廠如何檢查機器填裝麥片盒是否準確?他們用的就是假設檢定 (Hypothesis Testing)。在本章中,我們將從單純的描述數據轉向根據數據作出重大決策。這本質上就像是數學版的法庭審判:我們假設「未經證明有罪前,均視為無罪」。如果一開始覺得有很多生詞,別擔心——一旦你看出了規律,這就會成為統計學 2 (Statistics 2) 中最符合邏輯的部分之一!

1. 母體、普查與樣本

在我們進行任何測試之前,必須先知道數據來自何處。

關鍵詞彙:

母體 (Population): 我們感興趣的所有項目的總集合(例如:你學校裡的每一位學生)。
普查 (Census): 當你測量或觀察母體中每一個成員時。
樣本 (Sample): 從母體中挑選出來的個別成員或項目的選擇。
抽樣單位 (Sampling Unit): 母體中可以被抽樣的單一個體(例如:一位學生)。
抽樣框 (Sampling Frame): 所有抽樣單位的完整列表(例如:學校的學生名冊)。

優缺點:

普查:
+ 優點: 100% 準確;能提供真實的代表性。
- 缺點: 極度耗時、昂貴且處理困難。此外,如果測試涉及破壞性(例如測試燈泡壽命!),你就無法使用普查。

樣本:
+ 優點: 快速、經濟且易於管理。
- 缺點: 可能無法完全代表母體;總是有「抽樣誤差 (sampling error)」的可能性。

快速回顧: 想像一鍋湯。普查就是把整鍋湯喝光來確認鹹度。樣本則是舀起一湯匙。抽樣單位就是那一湯匙,而抽樣框就是鍋裡所有食材的食譜清單!

2. 假設檢定的語言

為了進行測試,我們需要設定「審判」的規則。

什麼是統計量?

統計量 (Statistic) 是僅從樣本數據計算出的數值。它不能包含任何未知的參數(例如母體平均數 \(\mu\) 或機率 \(p\))。
統計量的抽樣分佈 (Sampling Distribution) 是指該統計量在所有可能的固定大小樣本中,所能取得的所有可能值之機率分佈。

假設

每個測試都有兩個相互競爭的聲明:
1. 虛無假設 \(H_0\) (Null Hypothesis): 「平淡無奇」的假設。我們假設情況沒有改變,或者主張是正確的。(例如:「硬幣是公平的,\(p = 0.5\)」)。
2. 對立假設 \(H_1\) (Alternative Hypothesis): 我們正在調查的「令人興奮」的主張。只有在反對 \(H_0\) 的證據非常強烈時,我們才會相信它。(例如:「硬幣有偏差,\(p > 0.5\)」)。

檢定統計量與拒絕域

檢定統計量 (Test Statistic) 是我們從樣本中獲得的具體結果(例如:「我拋了 10 次硬幣,出現了 9 次正面」)。
拒絕域 (Critical Region) 是檢定統計量的數值範圍,如果結果落在此範圍內,代表它極不可能偶然發生,因此我們拒絕 \(H_0\)。
顯著水準 (Significance Level)(通常為 5% 或 1%)是判定結果必須多「不可能」發生的「門檻」。如果在 \(H_0\) 成立的情況下,結果發生的機率小於 5%,我們就拒絕 \(H_0\)。

核心觀念: 如果你的樣本結果落在拒絕域內,你就可以對 \(H_0\) 說「再見」,並擁抱 \(H_1\)。

3. 單尾與雙尾檢定

這取決於問題的要求。

單尾檢定 (One-Tailed Test): 你正在尋找特定方向的改變。
範例: 「成功的機率是否增加了?」
\(H_1: p > \text{數值}\) 或 \(H_1: p < \text{數值}\)。
顯著水準(例如 5%)完全位於分佈的一端。

雙尾檢定 (Two-Tailed Test): 你正在尋找任何改變,無論是上升還是下降。
範例: 「機率是否改變了?」
\(H_1: p \neq \text{數值}\)。
重要: 你必須將顯著水準一分為二!對於 5% 的測試,你需要尋找最高端 2.5% 以及最低端 2.5% 的極端數值。

常見錯誤: 在雙尾檢定中忘記將顯著水準減半。一定要檢查題目問的是「改變」(雙尾)還是「增加/減少」(單尾)。

4. 二項分佈參數 \(p\) 的檢定

當我們有固定次數的試驗 \(n\),且要檢定成功機率 \(p\) 時,就會用到這個方法。

步驟流程:

1. 陳述 \(H_0\)(例如 \(H_0: p = 0.4\))和 \(H_1\)(例如 \(H_1: p > 0.4\))。
2. 陳述虛無假設下的分佈:\(X \sim B(n, p)\)。
3. 確定顯著水準(例如 5%)。
4. 計算觀察到的結果或更極端結果的機率。對於 \(H_1: p > k\),計算 \(P(X \geq \text{observed})\)。
5. 結論: 如果機率小於顯著水準,則拒絕 \(H_0\)。否則,不要拒絕 \(H_0\)。

使用常態近似:

如果 \(n\) 很大且 \(p\) 接近 0.5,你可以使用常態分佈來近似二項分佈。只要記住連續修正 (Continuity Correction) 即可!
若 \(X \sim B(n, p)\),則 \(X \approx N(np, np(1-p))\)。
小撇步: 二項分佈中的 \(P(X \geq 10)\) 變為常態分佈中的 \(P(Y > 9.5)\)。

5.卜瓦松平均數 \(\lambda\) 的檢定

當我們在檢定一段區間內的發生率時,會使用此方法。

範例:

一家店每小時通常有 10 位顧客 (\(\lambda = 10\))。他們投放廣告後想看看速率是否增加。他們計算出某一小時內有 15 位顧客。
\(H_0: \lambda = 10\)
\(H_1: \lambda > 10\)
使用 \(\lambda = 10\) 的卜瓦松分佈表找出 \(P(X \geq 15)\)。如果這個機率非常小(小於你的顯著水準),廣告就有效!

你知道嗎? 假設檢定並不能「證明」任何事情是 100% 確定的。它只是告訴我們證據是否「強大到足以令人信服」。這就是為什麼我們總是使用諸如「有足夠的證據顯示……」之類的說法。

總結清單

- 定義變數: 明確說明 \(X\) 代表什麼。
- 寫出假設: 使用符號(\(p\) 或 \(\lambda\))。
- 找出機率: 使用統計表或計算機找出「p 值」(即在 \(H_0\) 成立前提下,出現該結果的機率)。
- 比較: 將 p 值與顯著水準進行比較。
- 情境結論: 務必以題目原本的情境寫出最終答案(例如:「有證據顯示機器故障了」)。

如果一開始覺得很棘手,別擔心!練習寫步驟的次數越多,這就會變得越自然。留意那些「尾端」,並務必仔細閱讀題目!