Type I and Type II errors - Further Mathematics 7366 - AQA AS Level

簡介：做出正確的判斷

在進階數學（Further Mathematics）中，我們利用假設檢定（Hypothesis Testing）來判斷現實世界中是否發生了變化。但這裡有一個秘訣：統計學永遠無法做到 100% 的確定性。即使我們做得再完美，抽樣總是有可能導致我們得出錯誤的結論。

在本章中，我們將探討假設檢定中可能會出現的兩種特定錯誤，稱為第一型錯誤 (Type I error) 和第二型錯誤 (Type II error)。理解這些錯誤有助於我們評估任何統計決策中所涉及的「風險」。如果一開始覺得這些概念有點抽象也不用擔心，我們會透過大量現實生活中的例子讓你豁然開朗！

1. 定義錯誤：「虛驚一場」與「錯失訊號」

要理解這些錯誤，我們先回顧一下假設檢定的目的。我們從虛無假設 (Null Hypothesis, \( H_0 \)) 開始，它代表「現狀」或「無變化」。然後，我們檢視證據，判斷是否應該拒絕 \( H_0 \)**。

我們可能會犯兩種錯誤：

第一型錯誤：虛驚一場 (The False Alarm)

當虛無假設 (\( H_0 \)) 實際上是正確的，但我們的檢定結果卻導致我們拒絕了它，這就是第一型錯誤。

比喻：想像一個煙霧警報器。如果你因為烤焦了吐司而導致警報響起（但實際上並沒有火災），這就是第一型錯誤。「虛無假設」是沒有火災，而警報器錯誤地「拒絕」了這個假設。

第二型錯誤：錯失訊號 (The Missed Signal)

當虛無假設 (\( H_0 \)) 實際上是錯誤的，但我們的檢定結果卻導致我們無法拒絕它，這就是第二型錯誤。

比喻：如果房子裡真的發生了火災，但煙霧警報器卻保持靜默，沒有發出嗶嗶聲，這就是第二型錯誤。「虛無假設」（沒有火災）是錯誤的，但警報器卻沒能檢測出來。

快速回顧箱：
• 第一型錯誤：當 \( H_0 \) 正確時，卻拒絕了 \( H_0 \)。(「偽陽性」)
• 第二型錯誤：當 \( H_0 \) 錯誤時，卻無法拒絕 \( H_0 \)。(「偽陰性」)

記憶法：法庭比喻

想像一個正在受審的人。虛無假設 (\( H_0 \)) 是他們是無辜的。
• 第一型錯誤：無辜者被判有罪（錯誤地拒絕了無辜的假設）。
• 第二型錯誤：有罪者被判無罪（當他們確實犯了罪，卻無法拒絕無辜的假設）。

2. 計算第一型錯誤的機率

在 AQA 考試中，你將會被明確要求計算使用二項分佈 (Binomial) 或卜瓦松分佈 (Poisson) 進行檢定時，出現第一型錯誤的機率。

好消息是，只要你知道臨界區 (Critical Region)，計算過程就非常直接。

核心概念：第一型錯誤的機率，單純就是假設 \( H_0 \) 為真時，檢定統計量落在臨界區內的機率。

逐步計算

1. 確定虛無假設 (\( H_0 \)) 和分佈參數。
2. 確定臨界區（即導致你拒絕 \( H_0 \) 的數值範圍）。
3. 使用 \( H_0 \) 的參數計算該數值落入臨界區的機率。

範例（二項分佈）：
假設擲一枚硬幣 10 次。\( H_0: p = 0.5 \)。臨界區定義為 \( X \geq 9 \)。
第一型錯誤的機率是：\( P(X \geq 9 \text{ 當 } p = 0.5) \)。
利用二項分佈公式或計算機：\( P(X=9) + P(X=10) \approx 0.0107 \)。
因此，當硬幣實際上是公平時，我們有 1.07% 的機會會錯誤地宣稱該硬幣有偏差。

範例（卜瓦松分佈）：
客戶服務中心平均每小時接聽 5 個電話 (\( \lambda = 5 \))。他們測試呼叫率是否有所增加。\( H_0: \lambda = 5 \)。臨界區為 \( X \geq 10 \)。
第一型錯誤的機率是：\( P(X \geq 10 \text{ 當 } \lambda = 5) \)。
使用計算機：\( 1 - P(X \leq 9) \approx 1 - 0.9682 = 0.0318 \)。
因此，第一型錯誤的機率為 0.0318。

你知道嗎？
在許多情況下，第一型錯誤的機率與檢定的實際顯著性水平 (significance level) 完全相同。如果你選擇了 5% 的顯著性水平，你的第一型錯誤機率通常會是 5% 或以下！

3. 在語境中定義錯誤

考試官很喜歡問你「在這個語境下，第一型錯誤代表什麼意思」。要拿到滿分，你必須提到題目中具體的情境。

第一型錯誤模板：「當 [虛無假設] 實際上為真時，卻得出 [對立假設] 的結論。」
第二型錯誤模板：「當 [對立假設] 實際上為真時，卻得出 [虛無假設] 可能為真的結論。」

試試這個比喻：
測試一種新藥是否比舊藥更快緩解頭痛。
\( H_0 \)：新藥與舊藥效果相同。
\( H_1 \)：新藥效果更快。
• 第一型錯誤：我們聲稱新藥更快，但實際上並非如此。（我們在沒用的藥物上浪費了金錢）。
• 第二型錯誤：我們聲稱新藥並不更快，但實際上它更快。（我們錯失了一種優良的新療法）。

關鍵要點：請務必將你的答案聯繫到題目中提到的「現實世界」後果（例如：金錢損失、時間浪費或安全風險）。

4. 常見的錯誤陷阱

如果起初覺得這些很棘手也不用擔心，即使是經驗豐富的統計學家也會反覆檢查這些細節！留意以下常見的陷阱：

1. 混淆類型：記住，第一型 (Type I) 錯誤是先發生的——它是一種對於拒絕虛無假設過於「急躁」的錯誤。第二型 (Type II) 錯誤則是對於察覺變化太過「怠惰」。
2. 忘記「假設 \( H_0 \) 為真」：計算第一型錯誤時，你必須使用來自虛無假設的 \( p \) 或 \( \lambda \) 值。
3. 離散與連續分佈：在二項分佈和卜瓦松分佈中，你無法總是得到剛好 5% 的顯著性水平。你的第一型錯誤機率是臨界區的實際機率，而不僅僅是目標百分比（如 5%）。

總結：宏觀視野

• 第一型錯誤是虛驚一場：當 \( H_0 \) 實際上為真時，卻拒絕了 \( H_0 \)。
• 第二型錯誤是錯失訊號：當 \( H_0 \) 實際上為假時，卻無法拒絕 \( H_0 \)。
• 第一型錯誤的機率是透過使用虛無假設參數計算臨界區的機率而得出的。
• 在考試中，務必根據題目中的具體故事（例如：種子、燈泡或病患）來解釋這些錯誤的含義。

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。

簡介：做出正確的判斷

1. 定義錯誤：「虛驚一場」與「錯失訊號」

第一型錯誤：虛驚一場 (The False Alarm)

第二型錯誤：錯失訊號 (The Missed Signal)

記憶法：法庭比喻

2. 計算第一型錯誤的機率

逐步計算

3. 在語境中定義錯誤

4. 常見的錯誤陷阱

總結：宏觀視野

立即實踐所學