Hypothesis testing for a binomial probability p - Mathematics B (MEI) - H640 - Cambridge OCR A Level

假設檢定簡介

你好！歡迎來到 A Level 數學課程中最令人興奮且實用的一個單元。你有沒有想過一枚「幸運」硬幣是否真的有偏差，或是廠商對產品的聲稱是否屬實？假設檢定 (Hypothesis Testing) 就是一套數學工具，讓我們能利用數據來回答這些問題。

在本章中，我們將重點放在測試二項分佈機率 \(p\)。我們實際上是在擔任「統計偵探」，透過觀察一系列實驗結果，來判斷是否有足夠證據支持「真實」機率與我們原本所想的不同。如果初學時覺得有點抽象，別擔心——一旦你掌握了步驟，這其實是非常合乎邏輯的！

第一節：假設檢定的術語

在開始計算之前，我們需要先理解這些「行話」。統計檢定有其特定的專業詞彙，在考試中必須正確使用。

1. 假設 (Hypotheses)

每個檢定都始於兩個互相競爭的陳述：
• 虛無假設 (Null Hypothesis, \(H_0\))： 這是「現狀」。我們假設沒有任何改變，機率 \(p\) 正如預期一樣。在考試中，這通常表現為 \(H_0: p = \text{數值}\)。
• 對立假設 (Alternative Hypothesis, \(H_1\))： 這是我們正在調查的「有趣」主張。我們懷疑機率已經改變了。這表現為 \(H_1: p > \text{數值}\)、\(H_1: p < \text{數值}\) 或 \(H_1: p \neq \text{數值}\)。

2. 檢定統計量 (Test Statistic)

檢定統計量是我們在樣本中觀察到的實際結果。對於二項分佈檢定而言，這僅僅是我們在實驗中計算出的成功次數。

3. 顯著性水平 (Significance Level, \(\alpha\))

你可以將其視為「舉證責任」。這是一個百分比（通常為 5% 或 10%），定義了被認為「不太可能發生」的門檻。
類比： 如果你告訴我你能預知未來，然後你猜對了一次拋硬幣，我不會覺得厲害。但如果你連續猜對 20 次，那純屬巧合的可能性就極低，我可能就會開始相信你了。顯著性水平就是我們劃下的一條數學界線，用來決定何時我們才算「足夠驚訝」，從而拒絕虛無假設。

你知道嗎？ 顯著性水平實際上是錯誤地拒絕了虛無假設的機率。即使虛無假設是真的，我們仍有極小的機率（等於顯著性水平）會因為運氣好而得到極端的結果！

重點總結：

虛無假設 (\(H_0\)) 是預設的假設 (\(p = \text{數值}\))，而對立假設 (\(H_1\)) 是我們懷疑實際發生的情況。

第二節：單尾檢定與雙尾檢定

我們如何知道 \(H_1\) 中的箭頭該指向哪邊？這完全取決於題目在問什麼。

單尾檢定 (1-Tail Tests)

當我們只關心機率是否向某個特定方向移動時，我們使用單尾檢定。
• 例子： 一位園丁認為新的肥料能讓種子更好地發芽（所以 \(H_1: p > \text{舊數值}\)）。
• 例子： 一位醫生認為新藥能讓疾病發生的可能性降低（所以 \(H_1: p < \text{舊數值}\)）。

雙尾檢定 (2-Tail Tests)

當我們只想知道機率是否發生了任何改變（不論是變高還是變低）時，我們使用雙尾檢定。
• 例子： 檢查一台機器生產的瑕疵品比例是否與通常的 2% 不同（所以 \(H_1: p \neq 0.02\)）。

小技巧： 在雙尾檢定中，我們將顯著性水平一分為二。如果總顯著性水平是 5%，我們會在最底端尋找 2.5%，在最頂端也尋找 2.5%。

第三節：拒絕域與臨界值

當我們確定了假設和顯著性水平後，需要找出「危險區」——在數學上稱為拒絕域 (Critical Region)。

• 臨界值 (Critical Value)： 這是落在拒絕域中的第一個數值，也就是「臨界點」。
• 拒絕域 (Critical Region)： 這是檢定統計量的一組數值，如果 \(H_0\) 為真，這些數值極不可能發生，因此我們決定拒絕 \(H_0\)。
• 接受域 (Acceptance Region)： 任何不在拒絕域內的數值。如果我們的結果落在這裡，我們就保留虛無假設。

類比： 想像一個「請勿踐踏草地」的標示。草地就是拒絕域。如果你踩上去（你的檢定統計量落入該區域），你就打破了虛無假設的規則，我們必須拒絕它！

快速複習框：

• 如果檢定統計量在拒絕域內 \(\rightarrow\) 拒絕 \(H_0\)。
• 如果檢定統計量不在拒絕域內 \(\rightarrow\) 不拒絕 \(H_0\)。

第四節：p-值法 (p-value Method)

進行檢定的另一種方法是使用 p-值。現代軟體和計算機大多使用這種方法。

p-值是在假設 \(H_0\) 為真的情況下，得到一個至少與我們觀察到的結果一樣極端的結果的機率。

• 如果 p-值 \(\leq\) 顯著性水平：結果是「顯著的」。拒絕 \(H_0\)。
• 如果 p-值 \(>\) 顯著性水平：結果不具「顯著性」。不拒絕 \(H_0\)。

記憶口訣： "If the p is low, the \(H_0\) must go!"（如果 p-值低，虛無假設就要走！即：如果 p-值小於或等於顯著性水平，拒絕虛無假設）。

第五節：如何進行二項假設檢定（分步指南）

在 MEI H640 考試中，請每次都遵循這些步驟以確保拿到全部分數：

1. 陳述假設： 寫出 \(H_0: p = \dots\) 和 \(H_1: p \dots\)。
2. 定義分佈： 說明我們使用的模型，例如 \(X \sim B(n, p)\)，其中 \(n\) 為樣本量，\(p\) 來自 \(H_0\)。
3. 陳述顯著性水平： 通常題目會給出（例如 5%）。
4. 計算機率： 求出得到你的觀察值 \(x\) 或更極端數值的機率。
注意： 若 \(H_1: p > k\)，計算 \(P(X \geq x)\)。若 \(H_1: p < k\)，計算 \(P(X \leq x)\)。
5. 比較： 將計算出的機率（p-值）與顯著性水平進行比較。
6. 結論（兩個部分）：
A 部份（數學層面）： 說明你拒絕還是不拒絕 \(H_0\)。
B 部份（情境層面）： 用通俗易懂的中文句子解釋這對具體情況意味著什麼（例如：「有足夠的證據顯示新的種子更好」）。

重點總結：

千萬不要只說「拒絕 \(H_0\)」。務必在結尾處解釋該結果在題目現實情境下的意義。

第六節：應避免的常見錯誤

如果剛開始覺得棘手，別擔心，很多學生都會犯同樣的錯誤！請注意以下幾點：

• \(H_1\) 中的箭頭錯誤： 仔細閱讀題目。「有增加嗎？」意味著 \(>\)。「有改變嗎？」意味著 \(\neq\)。
• 用 \(<\) 代替 \(\leq\)： 在二項分佈（離散型）中，\(P(X \leq 5)\) 與 \(P(X < 5)\) 有很大不同。請務必包含觀察值本身！
• 忘記在雙尾檢定中平分百分比： 如果是 10% 的雙尾檢定，你需要在兩端各找 5%。
• 斷言： 避免說「這證明了機率已經改變」。我們應該說「有足夠的證據顯示它已經改變」。統計學是關於證據，而不是絕對證明！

本章最終總結

• 我們使用假設檢定來觀察樣本是否提供了足夠的證據來拒絕預設的假設 (\(H_0\))。
• 對於二項檢定，我們測試的是成功機率，即 \(p\)。
• 顯著性水平是我們願意承擔犯錯風險的程度。
• 我們將 p-值（得到該結果或更差結果的機率）與顯著性水平進行比較，以決定最終結果。
• 務必在問題的情境中給出結論！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。

假設檢定簡介

第一節：假設檢定的術語

1. 假設 (Hypotheses)

2. 檢定統計量 (Test Statistic)

3. 顯著性水平 (Significance Level, \(\alpha\))

重點總結：

第二節：單尾檢定與雙尾檢定

單尾檢定 (1-Tail Tests)

雙尾檢定 (2-Tail Tests)

第三節：拒絕域與臨界值

快速複習框：

第四節：p-值法 (p-value Method)

第五節：如何進行二項假設檢定（分步指南）

重點總結：

第六節：應避免的常見錯誤

本章最終總結

立即實踐所學