Type I and Type II errors - Further Mathematics 7367 - AQA A Level

歡迎來到錯誤的世界（這是好事！）

在之前的統計學課程中，你已經學過如何進行假設檢定（hypothesis tests）。你設定了一個虛無假設（Null Hypothesis，\(H_0\)）和一個對立假設（Alternative Hypothesis，\(H_1\)），透過觀察數據來決定是否拒絕 \(H_0\)。

但關鍵在於：統計學是基於機率，而非絕對的確定性。即便你做得盡善盡美，總還是有一小部分機會會做出錯誤的判斷。在本章中，我們將學習如何命名、計算並管理這些錯誤。這些被稱為第一類型錯誤（Type I error）和第二類型錯誤（Type II error）。如果一開始覺得有點抽象，別擔心——我們會用簡單的類比來為你拆解！

1. 什麼是第一類型錯誤和第二類型錯誤？

試想一個法庭上的陪審團審判。「虛無假設」(\(H_0\)) 是被告無罪。「對立假設」(\(H_1\)) 是被告有罪。陪審團有兩種犯錯的可能：

第一類型錯誤：被告實際上是無罪的（\(H_0\) 為真），但陪審團判定其有罪（拒絕 \(H_0\)）。這是一個偽陽性（false positive）。
第二類型錯誤：被告實際上是有罪的（\(H_1\) 為真），但陪審團讓其無罪釋放（未能拒絕 \(H_0\)）。這是一個偽陰性（false negative）。

必須記住的定義：

• 第一類型錯誤：當 \(H_0\) 為真時，拒絕了 \(H_0\)。
• 第二類型錯誤：當 \(H_1\) 為真時，未能拒絕 \(H_0\)。

記憶小撇步：「False」口訣
把它想像成醫療檢測某種「疾病」：
• 第一類（Type I）是偽陽性（告訴某人患病，但其實他沒病）。
• 第二類（Type II）是偽陰性（告訴某人沒事，但其實他患有該病）。

你知道嗎？
在現實生活中，「錯誤代價」各有不同。在審判中，第一類型錯誤（無辜者入獄）通常被認為比第二類型錯誤更嚴重。但在煙霧感應器中，第一類型錯誤（沒火卻警報）頂多讓人心煩，但第二類型錯誤（火災時卻不響）則是致命的！

關鍵摘要：第一類型錯誤是「錯判無辜」，而第二類型錯誤是「錯失真相」。

2. 計算第一類型錯誤的機率

我們犯下第一類型錯誤的可能性有多大？答案其實你已經知道了！犯下第一類型錯誤的機率直接與檢定的顯著水準（significance level，\(\alpha\)）掛鉤。

對於連續分配（常態分配）

在常態分配檢定中，第一類型錯誤的機率正好等於顯著水準。如果你在 5% 的水準下進行檢定，那麼 \(P(\text{Type I Error}) = 0.05\)。

\(P(\text{Type I error}) = P(\text{Rejecting } H_0 | H_0 \text{ is true})\)

對於離散分配（二項分配和卜瓦松分配）

由於二項分配和卜瓦松分配是跳躍性的（你不可能有 2.5 次成功），實際的顯著水準可能會與預期的 5% 或 10% 略有不同。

離散型第一類型錯誤的步驟：
1. 找出臨界區域（critical region）（即導致你拒絕 \(H_0\) 的 \(X\) 值）。
2. 在假設 \(H_0\) 為真的前提下，計算檢定統計量落在該臨界區域的機率。
3. 這個機率就是你的第一類型錯誤機率。

例子：針對一個卜瓦松分配進行 \(H_0: \lambda = 5\) 對 \(H_1: \lambda > 5\) 的檢定。如果你的臨界區域是 \(X \ge 10\)，那麼你的第一類型錯誤機率就是 \(P(X \ge 10 | \lambda = 5)\)。

重點複習：
第一類型錯誤機率 = 檢定的實際顯著水準。

3. 第二類型錯誤與檢定力

當我們「錯失」了 \(H_1\) 為真這一事實時，就會發生第二類型錯誤。我們將第二類型錯誤的機率標記為 \(\beta\)。

要計算 \(\beta\)，我們必須得到對立假設下參數的一個特定值。例如：「如果真實平均值實際上是 12.5，求發生第二類型錯誤的機率。」

計算第二類型錯誤 (\(\beta\))

步驟：
1. 找出接受區域（Acceptance Region）（即不在臨界區域內的所有值）。
2. 計算檢定統計量落在該接受區域的機率，但這次要使用來自 \(H_1\) 的新參數。

\(P(\text{Type II error}) = P(\text{Accepting } H_0 | H_1 \text{ is true})\)

什麼是「檢定力」（Power）？

檢定力（Power of a Test）是指檢定正確地拒絕了一個錯誤虛無假設的機率。它是你檢定「偵測出變化」的能力。

檢定力 = \(1 - P(\text{Type II error})\) 或 檢定力 = \(1 - \beta\)

類比：望遠鏡
把「檢定力」想像成望遠鏡的放大倍率。高倍率的望遠鏡（高檢定力檢定）非常有機會觀測到遠方的行星（真相）；低倍率的望遠鏡則可能會錯過它（第二類型錯誤）。

常見錯誤：
學生在計算第二類型錯誤時，常會弄錯平均值（\(\mu\)）或率（\(\lambda\)）。務必使用 \(H_0\) 的值來尋找臨界區域邊界，但一定要使用 \(H_1\) 的「真實值」來計算錯誤的機率。

關鍵摘要：檢定力是指當 \(H_0\) 是錯的時候，你能正確判斷出來的機率。高檢定力是好事！

4. 權衡與取捨

第一類型與第二類型錯誤之間存在著自然的「拉鋸戰」。

• 如果你把顯著水準設得更小（例如從 5% 降至 1%），你會讓拒絕 \(H_0\) 變得更困難。這會降低發生第一類型錯誤的機率，但同時會增加發生第二類型錯誤的機率（你更容易錯過真實的效果）。
• 如果你把顯著水準設得更大（例如 10%），你就會增加發生第一類型錯誤的機率，但降低了第二類型錯誤的機率。

我們該如何同時降低兩者？

要同時降低這兩類錯誤，只有一種方法：增加樣本量 (\(n\))。更大的樣本能提供更多「資訊」，使檢定更可靠，並提升其檢定力。

重點總結表：
動作：降低顯著水準 (\(\alpha\))
第一類型錯誤：降低
第二類型錯誤：增加
檢定力：降低

動作：增加樣本量 (\(n\))
第一類型錯誤：保持不變（若調整 \(\alpha\) 則可能會降低）
第二類型錯誤：降低
檢定力：增加

最後檢查清單

• 我知道第一類型錯誤 = 拒絕了正確的 \(H_0\) 嗎？
• 我知道第二類型錯誤 = 接受了錯誤的 \(H_0\) 嗎？
• 我會找出二項分配、卜瓦松分配和常態分配檢定的臨界區域嗎？
• 我記得檢定力 = \(1 - \beta\) 嗎？
• 我是否只有在計算第二類型錯誤/檢定力時才使用 \(H_1\) 的值？

你一定沒問題的！只要記住：第一類型錯誤是太敏感（把不存在的東西找出來），而第二類型錯誤是太謹慎（錯過了實際存在的東西）。

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。