Hypothesis testing for a binomial probability p - Mathematics B (MEI) - H630 - Cambridge OCR AS Level

介紹：成為統計偵探

歡迎來到統計學的世界！今天，我們將深入探討假設檢定 (Hypothesis Testing)。如果你曾經好奇過一枚硬幣是否不公平，或者一個新的「幸運」骰子是否真的比較常擲出六點，其實你已經具備了統計學家的思維模式。
假設檢定基本上就是「統計偵探工作」。我們從一個假設開始，觀察證據（數據），然後決定這些證據是否足夠強大，以至於讓我們改變原有的看法。如果一開始覺得有很多新名詞感到困惑，請別擔心，我們會一步步為你拆解！

1. 假設檢定的術語

要成為一名出色的偵探，你需要熟悉相關術語。以下是 OCR MEI 課程大綱中必須掌握的關鍵詞：

虛無假設 (Null Hypothesis, \(H_0\))： 這是「現狀」或「無變化」的宣稱。它假設一切如常，沒有發生任何改變。對於二項分佈機率，我們通常這樣寫：
\(H_0: p = \text{某數值}\)

對立假設 (Alternative Hypothesis, \(H_1\))： 這是「令人興奮」的宣稱。這是你試圖尋找證據支持的觀點。它通常是以下其中一種形式：
\(H_1: p < \text{某數值}\)（你認為機率降低了）
\(H_1: p > \text{某數值}\)（你認為機率增加了）
\(H_1: p \neq \text{某數值}\)（你只是認為機率有所改變）

檢定統計量 (Test Statistic)： 這是你在實驗中觀察到的數值。例如，如果你擲硬幣 20 次，出現正面的次數就是你的檢定統計量。

顯著性水平 (Significance Level, \(\alpha\))： 這是我們判斷證據的「門檻」。通常設為 5% (\(0.05\)) 或 10% (\(0.1\))。它代表當我們拒絕 \(H_0\) 時，我們願意承擔犯錯的機率。

快速複習小盒子：
- \(H_0\) 永遠使用 "="
- \(H_1\) 永遠使用 "<", ">" 或 "\(\neq\)"
- 假設永遠是關於母體機率 \(p\)，絕不是關於樣本結果！

2. 單尾與雙尾檢定

我們如何知道該往哪個方向尋找證據？這取決於我們懷疑發生了什麼事。

單尾檢定 (One-Tail Tests)

如果題目明確指定方向，請使用 1 尾檢定。
例子： 「園丁懷疑種子的發芽率增加了。」
這裡，\(H_1: p > \text{舊數值}\)。我們只關心結果分佈中的「高位」端。

雙尾檢定 (Two-Tail Tests)

如果題目說「機率改變了」或「有所不同」，請使用 2 尾檢定。
例子： 「科學家想檢查機器是否仍然校準正確。」
這裡，\(H_1: p \neq \text{舊數值}\)。我們關心結果是否太高 OR 太低。
重要技巧： 在 2 尾檢定中，我們將顯著性水平平分。如果總水平是 5%，我們會在底部尋找 2.5%，在頂部尋找 2.5%。

重點總結： 仔細讀題！像「增加」、「減少」、「更好」或「更差」等詞意味著 1 尾檢定。像「改變」、「不同」或「受影響」等詞則意味著 2 尾檢定。

3. 臨界區域與 \(p\)-值

得到數據後，我們如何決定 \(H_0\) 是「有罪」（拒絕）還是「無罪」（接受）？主要有兩種方法。

臨界區域法 (The Critical Region Method)

臨界區域 (Critical Region)（或拒絕域）是指一系列極不可能純屬偶然發生的數值，如果我們的檢定統計量落在此區域內，我們就拒絕 \(H_0\)。
臨界值 (Critical Value) 是劃分此區域的「界線」數字。

\(p\)-值法 (The \(p\)-value Method)

\(p\)-值 (\(p\)-value) 是在假設 \(H_0\) 為真的前提下，觀察到結果至少與實際觀測值一樣極端的機率。
- 如果 \(p\)-值 \(\leq\) 顯著性水平 \(\rightarrow\) 拒絕 \(H_0\)（這結果非常罕見！）
- 如果 \(p\)-值 \( > \) 顯著性水平 \(\rightarrow\) 不拒絕 \(H_0\)（這結果可能只是運氣好。）

你知道嗎？ 顯著性水平實際上是犯下「第一型錯誤 (Type I error)」的機率，意即當虛無假設實際上為真時，你卻拒絕了它！我們將這個水平保持在較低數值，以避免犯錯。

4. 進行檢定的步驟指南

如果一開始覺得很困難，別擔心；每次都遵循這五個步驟即可：

第 1 步：列出你的假設。 先定義 \(p\)（例如：「令 \(p\) 為種子發芽的機率」），然後寫出 \(H_0\) 和 \(H_1\)。

第 2 步：列出分佈。 在虛無假設下，變數 \(X\) 服從二項分佈：\(X \sim B(n, p)\)。

第 3 步：計算機率。 使用計算機的二項累積分佈函數 (BCD) 來找出結果「至少與此一樣極端」的機率。
- 對於「大於」檢定，找出 \(P(X \geq x) = 1 - P(X \leq x-1)\)。
- 對於「小於」檢定，找出 \(P(X \leq x)\)。

第 4 步：比較。 將你的 \(p\)-值與顯著性水平進行比較。

第 5 步：在語境中得出結論。 這是學生最容易丟分的地方！你必須提到具體的情境。

常見錯誤： 永遠不要說「H0 絕對是真的」或「H1 絕對是假的」。統計學是關於證據，而不是絕對確定。請使用非肯定語氣，例如「沒有足夠證據顯示……」。

5. 真實世界案例

情境： 一枚硬幣擲了 20 次，其中 15 次為正面。在 5% 的顯著性水平下，這枚硬幣是否偏向正面？

1. 假設： \(p\) 為正面機率。\(H_0: p = 0.5\)；\(H_1: p > 0.5\)（1 尾檢定）。

2. 分佈： 在 \(H_0\) 下，\(X \sim B(20, 0.5)\)。

3. 計算： 我們觀察到 15 次正面。我們需要得到 15 或更多次的機率。
\(P(X \geq 15) = 1 - P(X \leq 14) \approx 0.0207\)。

4. 比較： \(0.0207\) (2.07%) 小於 \(0.05\) (5%)。

5. 結論： 0.0207 小於 0.05，因此我們拒絕 \(H_0\)。在 5% 的水平下，有足夠證據顯示這枚硬幣偏向正面。

重點總結： 如果你結果的發生機率小於顯著性水平，代表它太奇怪了，不可能是巧合。拒絕那個「平庸」的 \(H_0\) 吧！

常見錯誤總結

- 使用樣本比例： 不要寫 \(H_0: p = 15/20\)。假設永遠是關於理論機率（如 \(0.5\)）。
- 方向錯誤： 在「大於」檢定中，確保你計算的是上尾 (\(P(X \geq x)\))。
- 遺忘情境： 在最後的句子中，務必提到硬幣、種子或題目涉及的具體事物。
- 雙尾混淆： 記得在 2 尾檢定中，將你的 \(p\)-值與顯著性水平的一半比較（或將你的 \(p\)-值乘以 2）。

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。