Hypothesis test for the proportion in a binomial distribution - Mathematics A - H230 - Cambridge OCR AS Level

歡迎來到假設檢定 (Hypothesis Testing)！

你有沒有想過，一枚「幸運」硬幣是否真的有偏差？或者一種新藥是否真的比舊藥更有效？假設檢定就像是數學界的偵探遊戲。在本章中，我們將學習如何運用二項分佈 (Binomial Distribution) 來判斷關於比例的說法是否合理，抑或這只是隨機巧合。

如果起初覺得這些文字有點抽象，請不用擔心——一旦掌握了當中的邏輯，數學計算其實非常直接明瞭！

1. 「核心概念」：檢定的邏輯

假設你的朋友聲稱他能預測 80% 的硬幣投擲結果。你觀察他投擲了 10 次，結果他猜中了 9 次。這純粹是運氣，還是他真的有「超能力」？

在假設檢定中，我們總是先假設現狀沒有改變（例如硬幣是公平的）。接著，我們會計算得到「9 次中 9 次」這種極端結果的機率。如果這個機率微乎其微，我們就會「拒絕」這只是運氣的說法。

你需要知道的關鍵術語

虛無假設 (Null Hypothesis, \(H_0\))： 這代表「現狀」。我們假設比例 \(p\) 與以往完全相同。
例子：\(H_0: p = 0.5\)（硬幣是公平的）。

對立假設 (Alternative Hypothesis, \(H_1\))： 這是我們實際要檢測的目標。它是指懷疑比例已經發生了改變。
例子：\(H_1: p > 0.5\)（硬幣對正面有偏差）。

檢定統計量 (Test Statistic)： 這是我們在樣本中觀察到的實際「成功」次數（例如你朋友投擲出的 9 個正面）。

顯著性水平 (Significance Level, \(\alpha\))： 這是我們設定的「門檻」。通常為 5% (0.05)。如果觀察到結果的機率低於這個數值，我們就稱其為「具統計顯著性」。

快速回顧： 假設檢定就像一場法庭審判。被告在未經證實有罪前是無罪的。在數學中，\(H_0\) 代表「無罪」（無事發生），我們需要強而有力的證據來證明「有罪」(\(H_1\))。

2. 設定假設

在為二項分佈比例 \(p\) 編寫假設時，必須始終使用參數 \(p\)，並以文字說明其代表的意義。

你可能會進行三種類型的檢定：

1. 單尾檢定（上尾）： 檢測比例是否增加了。\(H_1: p > \text{數值}\)。
2. 單尾檢定（下尾）： 檢測比例是否減少了。\(H_1: p < \text{數值}\)。
3. 雙尾檢定： 檢測比例是否在任一方向上有所改變。\(H_1: p \neq \text{數值}\)。

常見錯誤： 永遠不要在假設中使用你的樣本結果。例如，如果你觀察到 8/10 的成功率，不要寫成 \(H_0: p = 0.8\)。假設是關於整個總體 (population)，而不僅僅是你的小樣本。

3. 逐步檢定過程

請為每一題遵循以下 5 個步驟：

步驟 1：陳述假設。
定義 \(p\)（例如：「其中 \(p\) 為種子發芽的機率」）。
寫出 \(H_0: p = \dots\) 和 \(H_1: p < \dots\)（或是 \(>\) 或 \(\neq\)）。

步驟 2：識別模型。
在虛無假設下陳述分佈：\(X \sim B(n, p)\)。
\(n\) 是你的樣本大小，而 \(p\) 是來自 \(H_0\) 的數值。

步驟 3：計算 p-值 (p-value)。
這是得到你觀察到的結果或更極端結果的機率。
- 若檢測 \(p > \dots\)，計算 \(P(X \ge \text{觀察值})\)。
- 若檢測 \(p < \dots\)，計算 \(P(X \le \text{觀察值})\)。

步驟 4：與顯著性水平比較。
如果 p-值 \(\le\) 顯著性水平，我們拒絕 \(H_0\)。
如果 p-值 \(>\) 顯著性水平，我們無法拒絕 \(H_0\)。

步驟 5：在情境中作結論。
使用類似這樣的句子：「在 5% 的顯著性水平下，有足夠證據顯示……的比例已經增加。」

你知道嗎？ 我們從不說「接受」\(H_0\)。我們只會說沒有足夠的證據來拒絕它。這就像陪審團說「無罪釋放」——這並不一定代表真的「清白」，只是證明不足而已！

4. 臨界區域與臨界值

有時，題目不會要求計算 p-值，而是要求找出臨界區域 (Critical Region)。這是指你會拒絕 \(H_0\) 的數值範圍。

臨界值 (Critical Value)： 進入拒絕區域的第一個數值。
接受區域 (Acceptance Region)： 我們保持 \(H_0\) 的數值範圍。

OCR 重要規則： 對於指定的顯著性水平（例如 5%），檢定統計量落在拒絕區域內的機率，必須是在不超過顯著性水平的前提下，盡可能地接近該水平。

雙尾檢定的變數

在雙尾檢定 (\(H_1: p \neq \dots\)) 中，「懷疑」僅指事情有所改變。我們將顯著性水平平分為二。
例子：在 5% 的顯著性水平下，我們會在下端尋找 2.5%，並在上端尋找 2.5%。

記憶小撇步： 雙尾 = 兩個方向 = 百分比的兩個半部。

5. 理解顯著性水平

「5% 顯著性水平」實際上是什麼意思？
它是錯誤地拒絕虛無假設的機率。換句話說，有 5% 的可能性是我們斷定事情發生了改變，但實際上，該結果只是一次罕見的運氣。

快速總結表：
- p-值較小 (\(<\alpha\))： 結果罕見 \(\rightarrow\) 有證據反對 \(H_0\) \(\rightarrow\) 拒絕 \(H_0\)。
- p-值較大 (\(>\alpha\))： 結果常見 \(\rightarrow\) 無證據反對 \(H_0\) \(\rightarrow\) 無法拒絕 \(H_0\)。

常見陷阱

1. 忘記情境： 你的最後一句話必須提到真實世界的情況（種子、硬幣、選票等）。
2. 計算錯誤： 記得在計算機上，\(P(X \ge 8)\) 要計算為 \(1 - P(X \le 7)\)。
3. 假設符號： 永遠使用 \(p\) 來代表總體比例。不要使用 \(x\) 或 \(\mu\)。
4. 進位： 不要過早將 p-值四捨五入；保持精確度以便與顯著性水平比較。

重點總結： 假設檢定不是為了達到 100% 的確定。它是為了判斷在當前的規則下，一個結果是否「太過不可能」以致於不可能是由隨機產生的。利用計算機找出這些機率，與「門檻」（顯著性水平）進行比較，並寫下明確的結論！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。