貝氏定理 (Bayes’ Theorem) 簡介

歡迎學習統計學中最具威力的工具之一!貝氏定理聽起來可能很深奧,但它實際上是一種非常符合邏輯的方法,讓我們在獲得新資訊時能夠「更新」我們原有的認知。在 Pearson Edexcel 9ST0 課程中,這個課題會出現在 Paper 1,其核心在於如何巧妙地運用條件概率 (conditional probability)

你可以把它想像成當偵探。你先對誰可能犯罪有一個初步的預測(即先驗概率,prior probability),接著你發現了新的證據,然後利用這些證據來改變你對誰是最有可能的嫌疑人的看法(即後驗概率,posterior probability)。在本章中,我們將學習如何將這些邏輯推測轉化為精確的計算。

快速複習:在深入探討之前,請記住條件概率的寫法是 \(P(A|B)\),意思是「在事件 B 已經發生的情況下,事件 A 發生的概率」。

1. 全概率公式 (The Law of Total Probability)

在我們使用貝氏定理之前,需要先理解公式的「下半部分」。這被稱為全概率公式
別擔心這個名字聽起來很高深——它僅僅是指透過檢視所有可能發生的途徑,來計算某個事件發生的總概率。

想像你要計算一名學生考試及格的概率 (\(P(Pass)\))。學生分為兩類:有溫習的 (\(S\)) 和沒有溫習的 (\(S'\))。
要計算及格的總概率,你需要將以下兩項相加:
1. 有溫習且及格的概率: \(P(S \cap Pass)\)
2. 沒有溫習但及格的概率: \(P(S' \cap Pass)\)

以數學術語來說,如果你有三個涵蓋所有可能性的事件 \(A_1, A_2, A_3\),那麼事件 \(B\) 的總概率為:
\(P(B) = P(B|A_1)P(A_1) + P(B|A_2)P(A_2) + P(B|A_3)P(A_3)\)

核心重點:要找到某個結果的總概率,只需將所有導致該結果的可能路徑的概率相加即可。

2. 理解貝氏定理

貝氏定理本質上是一個分數。它問的是:「已知結果 B 已經發生,那麼它是由事件 A 引起的概率是多少?」

貝氏定理的公式為:
\(P(A|B) = \frac{P(B|A)P(A)}{P(B)}\)

讓我們拆解這些部分:
\(P(A|B)\)後驗概率 (Posterior)。在我們獲得新證據後,想要找出更新後的概率。
\(P(A)\)先驗概率 (Prior)。在獲得新證據之前我們已知的概率。
\(P(B|A)\)概似度 (Likelihood)。如果 A 為真,出現證據 B 的可能性有多大?
\(P(B)\)全概率 (Total Probability)。證據發生的總概率(所有路徑之和)。

一個簡單的類比:
想像你聽到一聲「喵」(\(B\))。你想知道這聲音來自貓 (\(A\)) 的概率。
「喵」聲就是你的證據。分數的分子是「有一隻貓且發出該聲音」的概率。分數的分母是「任何事物」發出「喵」聲的總概率(也許是你的朋友在惡作劇!)。

3. 使用樹狀圖(秘密武器)

課程大綱明確提到,對於最多三個事件的情況,可以使用樹狀圖 (tree diagrams)。這是解決貝氏定理題目且不會迷失在公式中的最可靠方法。

逐步解題步驟:
1. 畫出樹狀圖:從「原因」或「先驗」事件開始(例如:工廠 A、工廠 B、工廠 C)。
2. 添加第二層分支:這些是「結果」(例如:次品或良品)。
3. 沿路徑相乘:將每條路徑上的概率相乘,得出該特定路徑的概率。
4. 計算總和:將所有導致你感興趣結果的路徑的結果相加(這就是你的分母)。
5. 應用貝氏定理:將題目要求的那一條特定路徑的概率,除以你剛剛計算出的總和 (Total)

記憶法:貝氏定理就是:(目標路徑)÷(所有可能路徑的總和)

4. 現實範例:醫療檢測

這是一道經典的考試題型。假設某疾病影響了 1% 的人口 (\(P(D) = 0.01\))。一種針對該疾病的檢測對於患病者有 99% 的準確率 (\(P(Positive|D) = 0.99\)),但對於健康的人,會有 2% 的假陽性率 (\(P(Positive|Healthy) = 0.02\))。如果你檢測結果呈陽性,你實際上患病的概率是多少?

步驟 1:分子(患病且檢測呈陽性的路徑):
\(P(D \cap Positive) = 0.01 \times 0.99 = 0.0099\)

步驟 2:分母(檢測呈陽性的總概率):
路徑 1(患病且陽性): \(0.01 \times 0.99 = 0.0099\)
路徑 2(健康且陽性): \(0.99 \times 0.02 = 0.0198\)
總 \(P(Positive) = 0.0099 + 0.0198 = 0.0297\)

步驟 3:計算:
\(P(D|Positive) = \frac{0.0099}{0.0297} \approx 0.333\) 或 33.3%

等等!你看到了嗎?即使檢測的「準確率」高達 99%,如果你檢測呈陽性,實際患病的概率也只有 33%!這就是為什麼貝氏定理如此重要——它考慮到了該疾病本身非常罕見這一事實。

5. 常見錯誤避坑指南

1. 搞混 \(P(A|B)\) 和 \(P(B|A)\):
一定要仔細閱讀題目。 \(P(Defective|Machine A)\) 是機器 A 生產出次品的機率;而 \(P(Machine A|Defective)\) 則是在已知物品是次品的情況下,它由機器 A 生產的機率。貝氏定理就是連接這兩者的橋樑。

2. 忘記分母:
許多學生只計算了分數的「上半部分」。請記住,你必須除以該證據發生的總概率。

3. 未檢查概率之和是否為 1:
樹狀圖的第一層分支(先驗概率)之和必須始終等於 1。如果你有三家工廠,它們的生產份額總和必須是 100%。

快速複習框:
先驗概率 (Prior):獲得證據前的概率。
條件概率 (Conditional):「如果」部分(例如:如果來自工廠 A,則有 5% 機率是次品)。
後驗概率 (Posterior):獲知證據後的「更新」概率。
樹狀圖:整理數據的最佳夥伴。

總結

貝氏定理只是一種反轉條件概率的方法。我們使用樹狀圖來找出事件發生的所有途徑(全概率),然後建立一個分數,算出特定的「原因」導致我們觀察到的「結果」的概率。保持分支清晰,沿路徑相乘,並用「目標路徑」除以「總路徑」,你就能掌握它!