歡迎來到錯誤的世界(這是好事!)

在之前的統計學課程中,你已經學過如何進行假設檢定(hypothesis tests)。你設定了一個虛無假設(Null Hypothesis,\(H_0\))和一個對立假設(Alternative Hypothesis,\(H_1\)),透過觀察數據來決定是否拒絕 \(H_0\)。

但關鍵在於:統計學是基於機率,而非絕對的確定性。即便你做得盡善盡美,總還是有一小部分機會會做出錯誤的判斷。在本章中,我們將學習如何命名、計算並管理這些錯誤。這些被稱為第一類型錯誤(Type I error)第二類型錯誤(Type II error)。如果一開始覺得有點抽象,別擔心——我們會用簡單的類比來為你拆解!

1. 什麼是第一類型錯誤和第二類型錯誤?

試想一個法庭上的陪審團審判。「虛無假設」(\(H_0\)) 是被告無罪。「對立假設」(\(H_1\)) 是被告有罪。陪審團有兩種犯錯的可能:

第一類型錯誤:被告實際上是無罪的(\(H_0\) 為真),但陪審團判定其有罪(拒絕 \(H_0\))。這是一個偽陽性(false positive)
第二類型錯誤:被告實際上是有罪的(\(H_1\) 為真),但陪審團讓其無罪釋放(未能拒絕 \(H_0\))。這是一個偽陰性(false negative)

必須記住的定義:

第一類型錯誤:當 \(H_0\) 為真時,拒絕了 \(H_0\)。
第二類型錯誤:當 \(H_1\) 為真時,未能拒絕 \(H_0\)。

記憶小撇步:「False」口訣
把它想像成醫療檢測某種「疾病」:
• 第一類(Type I)是偽陽性(告訴某人患病,但其實他沒病)。
• 第二類(Type II)是偽陰性(告訴某人沒事,但其實他患有該病)。

你知道嗎?
在現實生活中,「錯誤代價」各有不同。在審判中,第一類型錯誤(無辜者入獄)通常被認為比第二類型錯誤更嚴重。但在煙霧感應器中,第一類型錯誤(沒火卻警報)頂多讓人心煩,但第二類型錯誤(火災時卻不響)則是致命的!

關鍵摘要:第一類型錯誤是「錯判無辜」,而第二類型錯誤是「錯失真相」。

2. 計算第一類型錯誤的機率

我們犯下第一類型錯誤的可能性有多大?答案其實你已經知道了!犯下第一類型錯誤的機率直接與檢定的顯著水準(significance level,\(\alpha\))掛鉤。

對於連續分配(常態分配)

在常態分配檢定中,第一類型錯誤的機率正好等於顯著水準。如果你在 5% 的水準下進行檢定,那麼 \(P(\text{Type I Error}) = 0.05\)。

\(P(\text{Type I error}) = P(\text{Rejecting } H_0 | H_0 \text{ is true})\)

對於離散分配(二項分配和卜瓦松分配)

由於二項分配和卜瓦松分配是跳躍性的(你不可能有 2.5 次成功),實際的顯著水準可能會與預期的 5% 或 10% 略有不同。

離散型第一類型錯誤的步驟:
1. 找出臨界區域(critical region)(即導致你拒絕 \(H_0\) 的 \(X\) 值)。
2. 在假設 \(H_0\) 為真的前提下,計算檢定統計量落在該臨界區域的機率。
3. 這個機率就是你的第一類型錯誤機率。

例子:針對一個卜瓦松分配進行 \(H_0: \lambda = 5\) 對 \(H_1: \lambda > 5\) 的檢定。如果你的臨界區域是 \(X \ge 10\),那麼你的第一類型錯誤機率就是 \(P(X \ge 10 | \lambda = 5)\)。

重點複習:
第一類型錯誤機率 = 檢定的實際顯著水準。

3. 第二類型錯誤與檢定力

當我們「錯失」了 \(H_1\) 為真這一事實時,就會發生第二類型錯誤。我們將第二類型錯誤的機率標記為 \(\beta\)。

要計算 \(\beta\),我們必須得到對立假設下參數的一個特定值。例如:「如果真實平均值實際上是 12.5,求發生第二類型錯誤的機率。」

計算第二類型錯誤 (\(\beta\))

步驟:
1. 找出接受區域(Acceptance Region)(即不在臨界區域內的所有值)。
2. 計算檢定統計量落在該接受區域的機率,但這次要使用來自 \(H_1\) 的新參數

\(P(\text{Type II error}) = P(\text{Accepting } H_0 | H_1 \text{ is true})\)

什麼是「檢定力」(Power)?

檢定力(Power of a Test)是指檢定正確地拒絕了一個錯誤虛無假設的機率。它是你檢定「偵測出變化」的能力。

檢定力 = \(1 - P(\text{Type II error})\)檢定力 = \(1 - \beta\)

類比:望遠鏡
把「檢定力」想像成望遠鏡的放大倍率。高倍率的望遠鏡(高檢定力檢定)非常有機會觀測到遠方的行星(真相);低倍率的望遠鏡則可能會錯過它(第二類型錯誤)。

常見錯誤:
學生在計算第二類型錯誤時,常會弄錯平均值(\(\mu\))或率(\(\lambda\))。務必使用 \(H_0\) 的值來尋找臨界區域邊界,但一定要使用 \(H_1\) 的「真實值」來計算錯誤的機率。

關鍵摘要:檢定力是指當 \(H_0\) 是錯的時候,你能正確判斷出來的機率。高檢定力是好事!

4. 權衡與取捨

第一類型與第二類型錯誤之間存在著自然的「拉鋸戰」。

• 如果你把顯著水準設得更小(例如從 5% 降至 1%),你會讓拒絕 \(H_0\) 變得更困難。這會降低發生第一類型錯誤的機率,但同時會增加發生第二類型錯誤的機率(你更容易錯過真實的效果)。
• 如果你把顯著水準設得更大(例如 10%),你就會增加發生第一類型錯誤的機率,但降低了第二類型錯誤的機率。

我們該如何同時降低兩者?

要同時降低這兩類錯誤,只有一種方法:增加樣本量 (\(n\))。更大的樣本能提供更多「資訊」,使檢定更可靠,並提升其檢定力。

重點總結表:
動作:降低顯著水準 (\(\alpha\))
第一類型錯誤:降低
第二類型錯誤:增加
檢定力:降低

動作:增加樣本量 (\(n\))
第一類型錯誤:保持不變(若調整 \(\alpha\) 則可能會降低)
第二類型錯誤:降低
檢定力:增加

最後檢查清單

• 我知道第一類型錯誤 = 拒絕了正確的 \(H_0\) 嗎?
• 我知道第二類型錯誤 = 接受了錯誤的 \(H_0\) 嗎?
• 我會找出二項分配、卜瓦松分配和常態分配檢定的臨界區域嗎?
• 我記得檢定力 = \(1 - \beta\) 嗎?
• 我是否只有在計算第二類型錯誤/檢定力時才使用 \(H_1\) 的值?

你一定沒問題的!只要記住:第一類型錯誤是太敏感(把不存在的東西找出來),而第二類型錯誤是太謹慎(錯過了實際存在的東西)。