Hypothesis tests - Mathematics (9709) - Cambridge International AS Level

歡迎來到假設檢定 (Hypothesis Testing) 的世界！

你有沒有試過提出一個觀點，然後被別人要求：「拿出證據來！」？簡而言之，這就是假設檢定的核心概念。在這個章節中，我們不僅僅是在做數學運算；我們正在學習如何運用數據來判斷一個關於母體的論點是真有其事，還是僅僅出於隨機巧合。

無論你是在測試一種新藥是否有效，還是測試一枚硬幣是否被動過手腳，背後的邏輯都是一樣的。如果剛開始覺得這有點像「數學界律師」的辯論，別擔心——我們將會一步步為你拆解！

1. 假設檢定的術語

在我們開始計算之前，需要先掌握這些專有名詞。你可以把假設檢定想像成一場法庭審判。

虛無假設 (Null Hypothesis) \( (H_0) \)

這代表「現狀」或「無罪推定」的立場。它假設一切都沒有改變，或者某個因素並沒有產生特別的效應。
例如：「硬幣是公平的」或「藥物沒有任何療效」。

對立假設 (Alternative Hypothesis) \( (H_1) \)

這是我們真正想要檢定的論點。也就是你懷疑可能為真的情況。
例如：「硬幣傾向於出現正面」或「藥物確實有效」。

顯著性水平 (Significance Level) \( (\alpha) \)

這是我們評估證據的「門檻」。通常我們使用 5% (0.05) 或 1% (0.01)。這代表當我們拒絕虛無假設時，願意承擔「判斷錯誤」的風險概率。百分比越小，我們所需要的證據就必須越強而有力！

重點複習框：
• \(H_0\)： 沒有改變、沒有影響（一律使用 \( = \) 符號）。
• \(H_1\)： 有所變化或出現影響（使用 \( < \)、\( > \) 或 \( \neq \)）。
• 檢定統計量 (Test Statistic)： 我們從樣本中實際得到的結果。

2. 單尾檢定 vs. 雙尾檢定

我們如何撰寫 \(H_1\) 取決於我們想尋找什麼結果：

1. 單尾檢定 (One-Tailed Test)： 當我們懷疑變化是朝著特定方向時使用（例如：「平均值增加了」\( \mu > 10 \) 或「機率減少了」\( p < 0.5 \)）。
2. 雙尾檢定 (Two-Tailed Test)： 當我們認為情況已經改變，但不知道是變大還是變小時使用（例如：「平均值不再是 10」\( \mu \neq 10 \)）。

記憶小撇步： 如果題目提到「增加」(increased) 或「減少」(decreased)，那就是單尾檢定。如果題目提到「改變」(changed) 或「不同」(is different)，那就是雙尾檢定！

3. 出錯的可能：第一型錯誤與第二型錯誤

在統計學中，我們永遠無法達到 100% 的確定性。這導致了兩種「尷尬」的時刻：

第一型錯誤 (Type I Error)： 在 \(H_0\) 其實是真的情況下，卻拒絕了它。
類比：將一個無辜的人定罪。
第一型錯誤的機率正好等於顯著性水平！

第二型錯誤 (Type II Error)： 在 \(H_0\) 其實是假的情況下，卻接受（未能拒絕）它。
類比：讓一個有罪的人逍遙法外。

核心觀念： 我們希望將這些錯誤保持在盡可能低的水平，但通常情況下，若要減少其中一種錯誤發生的機率，另一種錯誤發生的機率就會升高！

4. 比率檢定 (二項分佈)

當你面對的是「成功」與「失敗」的二元結果時使用。例如，測試一枚骰子擲出 '6' 的機率是否比預期高。

步驟流程：

1. 列出 \(H_0\) 和 \(H_1\)： 例如：\(H_0: p = 0.2\)，\(H_1: p > 0.2\)。
2. 列出分佈模型： 使用 \(H_0\) 中的 \(p\) 值，寫出 \( X \sim B(n, p) \)。
3. 計算機率： 找出獲得你觀察到的結果或更極端結果的機率。如果你觀察到 \(k\) 次成功，找出 \( P(X \geq k) \)。
4. 與 \(\alpha\) 比較：
• 如果機率 \( < \alpha \)：拒絕 \(H_0\)（證據顯示情況有變）。
• 如果機率 \( \geq \alpha \)：不拒絕 \(H_0\)（證據不足）。

常犯錯誤： 當進行雙尾檢定時，你必須將顯著性水平在兩端各減半，或是將計算出的 p-value 加倍後再與 \(\alpha\) 比較！

5. 卜瓦松分佈的平均值檢定

這適用於在時間或空間中發生的事件（例如一場球賽中的進球數或電線上的瑕疵點）。

若 \( X \sim Po(\lambda) \)，我們檢定的是速率 \( \lambda \)。
步驟與二項分佈檢定完全相同，但請使用卜瓦松公式：\( P(X = r) = \frac{e^{-\lambda} \lambda^r}{r!} \)。

你知道嗎？ 如果你的卜瓦松平均值 \( \lambda \) 很大（通常 \( > 15 \)），你可以使用常態分佈近似法 (Normal Approximation) 來簡化檢定過程！

6. 常態分佈的平均值檢定

這是考試中最常見的題目之一。當我們知道母體變異數 \( \sigma^2 \)，但想檢定平均值 \( \mu \) 是否改變時使用。

中央極限定理 (CLT) 提醒：

當我們抽取樣本大小為 \(n\) 時，樣本平均值 \( \bar{X} \) 會服從常態分佈：
\( \bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right) \)

如何計算檢定統計量 (Z-score)：

\( Z = \frac{\bar{x} - \mu}{\frac{\sigma}{\sqrt{n}}} \)

步驟：
1. 使用上述公式計算你的 Z值。
2. 從統計表中根據給定的顯著性水平找出臨界值 (Critical Value)（例如：5% 單尾檢定時為 1.645）。
3. 比較： 如果你的 Z值距離零比臨界值更遠，則拒絕 \(H_0\)。

小提示： 永遠畫一張常態分佈曲線的草圖，並將「拒絕域」(Rejection Region，即尾部) 塗陰影。如果你的 Z-score 落入陰影區，\(H_0\) 就被「淘汰」了！

7. 總結清單

在你闔上課本之前，請確認你已經做到：
• 能正確使用正確符號 (\(p, \lambda, \text{ 或 } \mu\)) 撰寫 \(H_0\) 和 \(H_1\)。
• 能辨識檢定是單尾還是雙尾。
• 能計算二項分佈和卜瓦松分佈檢定的 p-value。
• 能計算常態檢定的 Z-score 並與臨界值進行比較。
• 能在題目背景下陳述你的結論（例如：「有 5% 水平的證據顯示平均高度有所增加」）。

最後的鼓勵： 假設檢定不過是一個由數據支持的邏輯論證。熟練掌握這些步驟，你會發現這是考綱中最具規律性且容易拿高分的部分！你可以做到的！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。