Hypothesis test for the proportion in a binomial distribution - Mathematics A - H240 - Cambridge OCR A Level

歡迎來到假設檢定 (Hypothesis Testing) 的世界！

你有沒有聽過別人誇下海口——例如「我擲硬幣有 80% 的機率會出現正面」——然後心想：「我敢說他們只是運氣好罷了」？其實，假設檢定正是數學上用來證明一個人是真的有「實力」（或是某個情況真的發生了變化），還是純粹「運氣好」的工具。

在本章中，我們將學習如何利用二項分佈 (Binomial Distribution) 來檢定關於比例 (proportions) 的主張。如果一開始覺得有點棘手也不用擔心，我們會一步步拆解教學！

1. 「數學偵探」的專用語言

在開始計算之前，我們必須先掌握一些術語。你可以把假設檢定想像成一場法庭審判。

假設 (The Hypotheses)

虛無假設 \( (H_0) \)： 這就是「現狀」。它假設一切都沒有改變，原有的主張是正確的。我們總是將其寫作 \( H_0: p = \text{某個數值} \)。
對立假設 \( (H_1) \)： 這就是「有事情發生了」的假設。這是你懷疑實際發生的情況。它可以是 \( p > \)、\( p < \) 或 \( p \neq \)。

檢定工具

檢定統計量 (Test Statistic)： 這是你在樣本中觀察到的實際結果（例如：「我擲了 20 次硬幣，結果出現 15 次正面」）。
顯著性水平 \( (\alpha) \)： 這是我們設立的「懷疑閾值」，通常為 5% (0.05) 或 1% (0.01)。這代表我們願意承擔犯錯的風險上限。
p 值 (p-value)： 若虛無假設為真，獲得你目前觀察到之結果（或更極端結果）的機率。

小提醒： 在作答時，你必須明確定義 \( p \) 代表什麼。例如：「其中 \( p \) 代表喜歡吃辣的人口比例。」

2. 單尾檢定 vs. 雙尾檢定

我們設定對立假設 \( (H_1) \) 的方式，取決於我們想要檢測什麼。

單尾檢定 (One-Tail Test)

當我們懷疑比例有明確的增加或明確的減少時使用。
例子：「我認為這種新藥比舊藥更有效。」
\( H_1: p > 0.5 \)

雙尾檢定 (Two-Tail Test)

當我們懷疑比例只是有所改變（我們不知道是變多還是變少）時使用。
例子：「我認為袋子裡紅糖果的比例與標籤上寫的不同。」
\( H_1: p \neq 0.5 \)

記憶小撇步：
單尾 = 單一方向（更高或更低）。
雙尾 = 兩個方向（更高或更低——總之就是不一樣！）。

重要貼士： 在雙尾檢定中，你必須將顯著性水平平分到兩端。如果總顯著性水平是 5%，你需要在兩端各自尋找 2.5% (0.025) 的機率區間。

3. 臨界區間法 (The Critical Region Approach)

臨界區間 (Critical Region)（又稱拒絕區間）就是「禁區」。如果我們的檢定統計量落入這個區域，我們就拒絕虛無假設。

如何找出它：
使用計算機的二項累積分布函數 (Binomial Cumulative Distribution, BCD)。你要尋找的是使得機率首次低於（或等於）顯著性水平的那個 \( x \) 值。

例子： 如果我們在 5% 的顯著性水平下，針對 \( X \sim B(20, 0.5) \) 檢測比例是否增加：
我們檢查 \( P(X \geq 15) \)、\( P(X \geq 16) \) 等。如果 \( P(X \geq 15) = 0.0207 \)（小於 0.05），那麼 15 就在我們的臨界區間內。

你知道嗎？ 顯著性水平實際上就是錯誤拒絕虛無假設的機率。這就是所謂的「誤報」率！

4. 步驟教學：執行檢定

每次執行檢定時請遵循以下步驟，以確保不會失分：

列出假設： 清晰寫下 \( H_0 \) 和 \( H_1 \)，並定義 \( p \)。
定義分佈： 說明模型，例如在 \( H_0 \) 下 \( X \sim B(n, p) \)。
選擇顯著性水平： 通常題目會給定（例如 5%）。
計算機率： 計算得到你的結果或更極端結果的機率。
- 如果 \( H_1: p > k \)，計算 \( P(X \geq \text{observed}) \)。
- 如果 \( H_1: p < k \)，計算 \( P(X \leq \text{observed}) \)。
比較： 你的機率（p 值）是否小於顯著性水平？
總結： 寫出正式的結論。一定要結合題目背景來寫！

避免常見錯誤： 不要只寫「拒絕 \( H_0 \)」。你必須加上背景描述，例如：「在 5% 的顯著性水平下，有足夠的證據顯示故障燈泡的比例已經下降。」

5. 總結與重點摘要

假設檢定並不是要追求 100% 的確定性；它的重點在於我們是否有足夠的證據來改變我們的看法。

速查表：
- 接受區間 (Acceptance Region)： 我們保留 \( H_0 \) 的數值範圍。
- 臨界值 (Critical Value)： 落入臨界區間的第一個數值。
- 顯著性水平： 「截止」機率（誤報的風險）。
- 計算機： 務必使用累積函數（List 或 Variable 模式）來檢查分佈「尾端」的機率。

現實類比： 想像一個煙霧警報器。如果它太靈敏（顯著性水平過高），烤吐司時它就會響（錯誤地拒絕了 \( H_0 \)）。如果它不夠靈敏（顯著性水平太低），它可能會漏掉真正的火災。我們選擇一個水平（如 5%）來平衡這些風險！

核心建議： 檢查時務必留意檢定的方向。對於 \( P(X \geq x) \)，請記住大多數計算機直接計算的是 \( P(X \leq x) \)，因此你可能需要用 \( 1 - P(X \leq x-1) \)。如果不確定，請檢查你的計算機說明書！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。