Statistical Hypothesis Testing - Mathematics A - H230 - Cambridge OCR AS Level

歡迎來到統計偵探的世界！

你有沒有想過，科學家是如何判斷一種新藥是否真的有效？或者製造商如何證明他們的「長效」電池不僅僅是行銷噱頭？答案就是運用統計假設檢定 (Statistical Hypothesis Testing)。

你可以把這一章想像成訓練你成為一名「數學偵探」。你不只是在看數字，而是在尋找證據。你從一個主張（現狀）出發，然後透過觀察數據，看看是否有足夠的證據來「推翻」該主張，並提出可能有新情況發生。

如果起初覺得這些概念有點抽象，別擔心——我們會運用簡單的邏輯和生活化的例子，一步步為你拆解！

1. 前置準備：快速溫習二項分佈

在深入研究之前，請記住 AS Level 的重點在於二項分佈 (Binomial Distribution)。當我們有固定次數的試驗 (\(n\)) 且每次試驗成功的機率 (\(p\)) 為定值時，就會用到它。

快速回顧：我們將其記作 \(X \sim B(n, p)\)。假設檢定其實就是根據樣本觀察到的結果，來檢驗我們假設的 \(p\) 值是否正確的過程。

2. 假設檢定的語言

要成為一名數學偵探，你需要掌握專業術語。讓我們拆解課程大綱 2.05a 中的關鍵術語。

兩個對立的主張

每一個檢定都始於兩個相對的觀點：
1. 虛無假設 (Null Hypothesis, \(H_0\))： 這是「無聊」的版本。它假設什麼都沒有改變。在被證明錯誤之前，我們總是假設 \(H_0\) 為真。就像法律原則「無罪推定」一樣。
2. 對立假設 (Alternative Hypothesis, \(H_1\))： 這是「有趣」的版本。它是你懷疑可能正在發生的情況（例如：成功率上升了，或者硬幣有偏差）。

關鍵參數

假設必須使用母體參數 \(p\)（成功機率）來表示。
例如：如果我們要檢定硬幣是否公平，我們會說：
\(H_0: p = 0.5\)（硬幣是公平的）
\(H_1: p \neq 0.5\)（硬幣是不公平的）
重要提示：在答案中一定要定義 \(p\) 代表什麼！(例如：「其中 \(p\) 為硬幣擲出正面的機率」)。

顯著性水平 (Significance Level, \(\alpha\))

這是你的證據「門檻」。通常為 5% (0.05) 或 1% (0.01)。
類比：想像你是一位法官，顯著性水平就是你願意容忍多少疑慮。5% 的顯著性水平意味著，只有當你觀察到的結果非常罕見（純粹運氣好發生的機率不到 5%）時，你才會拒絕 \(H_0\)。

關鍵總結：

假設檢定是根據檢定統計量 (test statistic)（即你在樣本中觀察到的實際結果），對 \(H_0\) 和 \(H_1\) 做出決定的正式程序。

3. 單尾檢定 vs. 雙尾檢定

你怎麼知道要往哪個方向看？這取決於你正在調查什麼。

單尾檢定 (1-Tail Test，尋求特定方向)

當你懷疑某個數值明確地增加或減少時使用。
例如：「我認為這項手術的成功率提高了。」
\(H_1: p > \text{舊值}\)（右尾）
\(H_1: p < \text{舊值}\)（左尾）

雙尾檢定 (2-Tail Test，尋求任何變化)

當你只認為數值改變了，但不知道（或不在意）改變的方向時使用。
例如：「製造商調整了機器設定，我認為不良率現在不同了。」
\(H_1: p \neq \text{舊值}\)

小撇步：在 5% 顯著性水平的雙尾檢定中，你需要將「風險」平分：上方 2.5% 和下方 2.5%。

4. 「危險地帶」：臨界區域與臨界值

我們如何決定「拒絕」虛無假設？我們需要尋找臨界區域 (Critical Region)。

1. 臨界值 (Critical Value)： 落入「危險地帶」的第一個數值。
2. 臨界區域 (或拒絕區域, Rejection Region)： 純粹靠運氣極難發生的數值範圍，一旦落入此範圍，我們就決定拒絕 \(H_0\)。
3. 接受區域 (Acceptance Region)： 不夠「奇怪」的數值。如果我們的結果落在此處，我們就保留 \(H_0\)。

你知道嗎？ 計算機是你最好的幫手！你會用到二項累積分佈函數 (Binomial Cumulative Distribution) 來求出這些數值。課程備註：落入臨界區域的實際機率必須小於或等於顯著性水平。

5. 步驟教學：如何進行檢定

如果你遵循這些步驟，絕對不會出錯：

步驟 1：定義 \(p\)。 寫下該機率所代表的含義。
步驟 2：陳述假設。 寫出 \(H_0\) 和 \(H_1\)。
步驟 3：確認分佈。 使用 \(H_0\) 中的數值寫出 \(X \sim B(n, p)\)。
步驟 4：設定顯著性水平。 (例如：5%)。
步驟 5：計算機率。 求出得到觀察結果或更極端結果的機率。這稱為 p值 (p-value)。
步驟 6：進行比較。 你的 p值是否小於顯著性水平？
步驟 7：結論。 將結果分為兩部分撰寫：數學結論與情境結論。

常見錯誤！

永遠不要說「我接受 \(H_0\)」或「這證明了 \(H_0\) 是正確的」。
我們只有兩個選擇：
1. 拒絕 \(H_0\)（有足夠的證據顯示 \(H_1\) 成立）。
2. 無法拒絕 \(H_0\)（沒有足夠的證據顯示 \(H_1\) 成立）。

類比：法庭上判決「證據不足」並不代表被告絕對無罪，只是代表沒有足夠的證據來證明他們有罪。

6. 解讀結果 (課程大綱 2.05c)

顯著性水平其實就是錯誤地拒絕虛無假設的機率。

想像一個公平的硬幣 (\(p=0.5\))，如果你拋 10 次且 10 次都是正面，你會在 5% 的水平下拒絕 \(H_0\)，因為得到 10 個正面非常罕見 (\(p \approx 0.001\))。但這仍然可能純屬運氣！如果那真的只是運氣，那你拒絕 \(H_0\) 就犯了錯誤。這就是我們在統計學中必須承擔的風險。

快速回顧表：

若 p值 \(\le\) 顯著性水平： 結果具有顯著性 (significant)。拒絕 \(H_0\)，有證據顯示 \(H_1\) 成立。
若 p值 > 顯著性水平： 結果不具顯著性 (not significant)。不要拒絕 \(H_0\)，沒有足夠的證據顯示 \(H_1\) 成立。

7. 結語：最後的範例

一位園丁聲稱他的種子發芽率為 70% (\(p=0.7\))。一名懷疑的學生種了 20 顆種子，結果只有 10 顆發芽。請在 5% 的水平下檢定園丁的說法。

1. 定義 \(p\)： 令 \(p\) 為種子發芽的機率。
2. 假設： \(H_0: p = 0.7\)，\(H_1: p < 0.7\) (單尾檢定)。
3. 分佈： 在 \(H_0\) 假設下，\(X \sim B(20, 0.7)\)。
4. 觀察結果： 學生觀察到 \(X = 10\)。
5. 計算： 使用計算機，\(P(X \le 10) = 0.0480\) (或 4.8%)。
6. 比較： \(0.0480 < 0.05\)。結果具有顯著性！
7. 結論： 拒絕 \(H_0\)。在 5% 的顯著性水平下，有顯著證據表明發芽率小於 0.7。

鼓勵一下： 假設檢定確實需要寫很多步驟，但邏輯始終如一。掌握好步驟，你就掌握了這一章！你一定做得到的！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。