歡迎來到統計偵探的世界!
你有沒有想過,科學家是如何判斷一種新藥是否真的有效?或者製造商如何證明他們的「長效」電池不僅僅是行銷噱頭?答案就是運用統計假設檢定 (Statistical Hypothesis Testing)。
你可以把這一章想像成訓練你成為一名「數學偵探」。你不只是在看數字,而是在尋找證據。你從一個主張(現狀)出發,然後透過觀察數據,看看是否有足夠的證據來「推翻」該主張,並提出可能有新情況發生。
如果起初覺得這些概念有點抽象,別擔心——我們會運用簡單的邏輯和生活化的例子,一步步為你拆解!
1. 前置準備:快速溫習二項分佈
在深入研究之前,請記住 AS Level 的重點在於二項分佈 (Binomial Distribution)。當我們有固定次數的試驗 (\(n\)) 且每次試驗成功的機率 (\(p\)) 為定值時,就會用到它。
快速回顧:我們將其記作 \(X \sim B(n, p)\)。假設檢定其實就是根據樣本觀察到的結果,來檢驗我們假設的 \(p\) 值是否正確的過程。
2. 假設檢定的語言
要成為一名數學偵探,你需要掌握專業術語。讓我們拆解課程大綱 2.05a 中的關鍵術語。
兩個對立的主張
每一個檢定都始於兩個相對的觀點:
1. 虛無假設 (Null Hypothesis, \(H_0\)): 這是「無聊」的版本。它假設什麼都沒有改變。在被證明錯誤之前,我們總是假設 \(H_0\) 為真。就像法律原則「無罪推定」一樣。
2. 對立假設 (Alternative Hypothesis, \(H_1\)): 這是「有趣」的版本。它是你懷疑可能正在發生的情況(例如:成功率上升了,或者硬幣有偏差)。
關鍵參數
假設必須使用母體參數 \(p\)(成功機率)來表示。
例如:如果我們要檢定硬幣是否公平,我們會說:
\(H_0: p = 0.5\)(硬幣是公平的)
\(H_1: p \neq 0.5\)(硬幣是不公平的)
重要提示:在答案中一定要定義 \(p\) 代表什麼!(例如:「其中 \(p\) 為硬幣擲出正面的機率」)。
顯著性水平 (Significance Level, \(\alpha\))
這是你的證據「門檻」。通常為 5% (0.05) 或 1% (0.01)。
類比:想像你是一位法官,顯著性水平就是你願意容忍多少疑慮。5% 的顯著性水平意味著,只有當你觀察到的結果非常罕見(純粹運氣好發生的機率不到 5%)時,你才會拒絕 \(H_0\)。
關鍵總結:
假設檢定是根據檢定統計量 (test statistic)(即你在樣本中觀察到的實際結果),對 \(H_0\) 和 \(H_1\) 做出決定的正式程序。
3. 單尾檢定 vs. 雙尾檢定
你怎麼知道要往哪個方向看?這取決於你正在調查什麼。
單尾檢定 (1-Tail Test,尋求特定方向)
當你懷疑某個數值明確地增加或減少時使用。
例如:「我認為這項手術的成功率提高了。」
\(H_1: p > \text{舊值}\)(右尾)
\(H_1: p < \text{舊值}\)(左尾)
雙尾檢定 (2-Tail Test,尋求任何變化)
當你只認為數值改變了,但不知道(或不在意)改變的方向時使用。
例如:「製造商調整了機器設定,我認為不良率現在不同了。」
\(H_1: p \neq \text{舊值}\)
小撇步:在 5% 顯著性水平的雙尾檢定中,你需要將「風險」平分:上方 2.5% 和下方 2.5%。
4. 「危險地帶」:臨界區域與臨界值
我們如何決定「拒絕」虛無假設?我們需要尋找臨界區域 (Critical Region)。
1. 臨界值 (Critical Value): 落入「危險地帶」的第一個數值。
2. 臨界區域 (或拒絕區域, Rejection Region): 純粹靠運氣極難發生的數值範圍,一旦落入此範圍,我們就決定拒絕 \(H_0\)。
3. 接受區域 (Acceptance Region): 不夠「奇怪」的數值。如果我們的結果落在此處,我們就保留 \(H_0\)。
你知道嗎? 計算機是你最好的幫手!你會用到二項累積分佈函數 (Binomial Cumulative Distribution) 來求出這些數值。課程備註:落入臨界區域的實際機率必須小於或等於顯著性水平。
5. 步驟教學:如何進行檢定
如果你遵循這些步驟,絕對不會出錯:
步驟 1:定義 \(p\)。 寫下該機率所代表的含義。
步驟 2:陳述假設。 寫出 \(H_0\) 和 \(H_1\)。
步驟 3:確認分佈。 使用 \(H_0\) 中的數值寫出 \(X \sim B(n, p)\)。
步驟 4:設定顯著性水平。 (例如:5%)。
步驟 5:計算機率。 求出得到觀察結果或更極端結果的機率。這稱為 p值 (p-value)。
步驟 6:進行比較。 你的 p值是否小於顯著性水平?
步驟 7:結論。 將結果分為兩部分撰寫:數學結論與情境結論。
常見錯誤!
永遠不要說「我接受 \(H_0\)」或「這證明了 \(H_0\) 是正確的」。
我們只有兩個選擇:
1. 拒絕 \(H_0\)(有足夠的證據顯示 \(H_1\) 成立)。
2. 無法拒絕 \(H_0\)(沒有足夠的證據顯示 \(H_1\) 成立)。
類比:法庭上判決「證據不足」並不代表被告絕對無罪,只是代表沒有足夠的證據來證明他們有罪。
6. 解讀結果 (課程大綱 2.05c)
顯著性水平其實就是錯誤地拒絕虛無假設的機率。
想像一個公平的硬幣 (\(p=0.5\)),如果你拋 10 次且 10 次都是正面,你會在 5% 的水平下拒絕 \(H_0\),因為得到 10 個正面非常罕見 (\(p \approx 0.001\))。但這仍然可能純屬運氣!如果那真的只是運氣,那你拒絕 \(H_0\) 就犯了錯誤。這就是我們在統計學中必須承擔的風險。
快速回顧表:
若 p值 \(\le\) 顯著性水平: 結果具有顯著性 (significant)。拒絕 \(H_0\),有證據顯示 \(H_1\) 成立。
若 p值 > 顯著性水平: 結果不具顯著性 (not significant)。不要拒絕 \(H_0\),沒有足夠的證據顯示 \(H_1\) 成立。
7. 結語:最後的範例
一位園丁聲稱他的種子發芽率為 70% (\(p=0.7\))。一名懷疑的學生種了 20 顆種子,結果只有 10 顆發芽。請在 5% 的水平下檢定園丁的說法。
1. 定義 \(p\): 令 \(p\) 為種子發芽的機率。
2. 假設: \(H_0: p = 0.7\),\(H_1: p < 0.7\) (單尾檢定)。
3. 分佈: 在 \(H_0\) 假設下,\(X \sim B(20, 0.7)\)。
4. 觀察結果: 學生觀察到 \(X = 10\)。
5. 計算: 使用計算機,\(P(X \le 10) = 0.0480\) (或 4.8%)。
6. 比較: \(0.0480 < 0.05\)。結果具有顯著性!
7. 結論: 拒絕 \(H_0\)。在 5% 的顯著性水平下,有顯著證據表明發芽率小於 0.7。
鼓勵一下: 假設檢定確實需要寫很多步驟,但邏輯始終如一。掌握好步驟,你就掌握了這一章!你一定做得到的!