Statistical hypothesis testing - Mathematics (8MA0) - Pearson Edexcel AS Level

歡迎來到統計偵探的世界！

你有沒有好奇過，一枚「幸運」硬幣是否真的有偏向，或者一種新藥是否真的比舊藥有效？在統計假設檢定（Statistical Hypothesis Testing）中，我們利用數學來判斷一個結果是真正的發現，還是純屬巧合。如果初看這些概念覺得有點抽象，別擔心——我們其實就是在學習如何成為「數學偵探」！

1. 假設檢定的語言

在開始計算之前，我們需要先了解統計學的「法律制度」。你可以把假設檢定想像成法庭審判。

兩大對立假設

每一個檢定都涉及兩個關於母體參數（Population Parameter）（通常是二項分佈中的機率 \( p \)）的對立陳述：

1. 虛無假設（Null Hypothesis, \( H_0 \)）： 這是「現狀」。它假設沒有任何事情改變，或者硬幣是公平的。在法庭的比喻中，被告在被證明有罪前是無罪的。我們總是寫成 \( H_0: p = \text{something} \)。

2. 對立假設（Alternative Hypothesis, \( H_1 \)）： 這是我們正在調查的說法。這相當於「有罪」的判決。我們將其寫作 \( H_1: p < \dots \)、\( H_1: p > \dots \) 或 \( H_1: p \neq \dots \)。

必須掌握的關鍵術語

檢定統計量（Test Statistic）： 我們在樣本中觀察到的實際結果（例如：拋擲硬幣時得到的正面次數）。
顯著性水平（Significance Level, \( \alpha \)）： 這是證明的「門檻」。常見水平為 5% (\( 0.05 \)) 或 1% (\( 0.01 \))。如果我們的結果純屬偶然發生的機率低於這個水平，我們就會「拒絕」虛無假設。
拒絕域（Critical Region）： 導致我們拒絕 \( H_0 \) 的檢定統計量取值範圍。如果我們的結果落入這個「拒絕區域」，就代表我們已找到足夠證據證明發生了變化。
臨界值（Critical Value）： 拒絕域中的第一個數值。它是我們偵探工作的「界線」。

記憶小撇步： 把 \( H_0 \) 想成 "Ho-hum"（平淡無奇）——沒什麼有趣的事發生！把 \( H_1 \) 想成 "Hypothesis of Hope"（希望的假設）——這正是你希望能證明的東西。

核心觀念： 我們總是先假設 \( H_0 \) 為真，只有在證據非常確鑿時才會改變想法。

2. 單尾檢定 vs. 雙尾檢定

根據我們想要尋找的目標，我們會選擇特定方向的檢定。

單尾檢定（One-Tail Test）

當我們關注特定方向的變化時使用。例如：「新種子的發芽率較高」(\( p > \dots \)) 或「該藥物縮短了恢復時間」(\( p < \dots \))。

雙尾檢定（Two-Tail Test）

當我們想知道數值是否發生了任何變化，但不在乎（或不確定）它是上升還是下降時使用。例如：「機器錯誤的機率發生了改變」(\( p \neq \dots \))。

重要提示： 在雙尾檢定中，你必須將顯著性水平一分為二。如果你的總顯著性水平是 5%，你需要尋找底部 2.5% 的尾部和頂部 2.5% 的尾部！

你知道嗎？ 大多數科學論文使用 5% 的顯著性水平。這意味著他們接受有 1/20 的機率，他們的「發現」其實只是隨機巧合！

3. 使用二項分佈進行檢定

在 AS Level 中，你的假設檢定將基於二項分佈模型（Binomial Model） \( X \sim B(n, p) \)。

執行檢定的步驟指南：

第 1 步：寫出假設。 使用參數 \( p \) 清晰地列出 \( H_0 \) 和 \( H_1 \)。

第 2 步：定義分佈。 陳述如果 \( H_0 \) 為真時的分佈情況（例如：\( X \sim B(10, 0.5) \)）。

第 3 步：求出觀察結果的機率。 使用計算機找出獲得「與觀察結果相同或更極端」結果的機率。

若檢定 \( p > \dots \)，計算 \( P(X \geq \text{observed value}) \)。
若檢定 \( p < \dots \)，計算 \( P(X \leq \text{observed value}) \)。

第 4 步：與顯著性水平比較。

如果機率小於顯著性水平，拒絕 \( H_0 \)。
如果機率大於顯著性水平，不拒絕 \( H_0 \)。

第 5 步：在語境中寫下結論。 永遠要聯繫題目背景（例如：「有足夠的證據顯示該硬幣存在偏向」）。

4. 理解「P值」（P-value）

P值就是如果虛無假設為真，獲得觀察結果（或更極端結果）的機率。

類比： 想像你拋 10 次硬幣，結果 10 次都是正面。P值就是公平硬幣出現這種情況的機率（\( 0.5^{10} \approx 0.0009 \)）。因為 0.0009 遠小於 0.05（5%），你就會判定這枚硬幣絕對不公平！

快速複習盒：
- P值小 (\( < \alpha \)) = 證據充分 = 拒絕 \( H_0 \)。
- P值大 (\( > \alpha \)) = 證據不足 = 無法拒絕 \( H_0 \)。

5. 避免常見錯誤

符號錯誤： 永遠不要用 \( \bar{x} \) 或 \( X \) 來寫假設。一定要用母體參數 \( \mathbf{p} \)。
遺漏語境： 不要只停留在「拒絕 \( H_0 \)」。你必須說明這對題目中的園丁、醫生或賭徒意味著什麼。
雙尾混淆： 當題目說「改變」或「不同」時，忘記將顯著性水平減半。
尾部計算錯誤： 如果觀察值高於預期，計算 \( P(X \geq x) \)。如果低於預期，計算 \( P(X \leq x) \)。

總結：宏觀視野

假設檢定不是為了達到 100% 的確定性，而是為了判斷一個結果是否具有統計顯著性（Statistically Significant）——即該結果極不可能僅由巧合造成。

核心觀念： 顯著性水平是錯誤拒絕虛無假設的機率。它代表了我們在宣稱有發現時，願意承擔「判斷錯誤」的風險。

如果剛開始覺得很難，別擔心！練習越多題目，你對邏輯的掌握就會越純熟。你一定沒問題的！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。