Bayes’ Theorem - Further Mathematics (9665) - Oxford AQA International A-level

貝葉斯定理 (Bayes’ Theorem)：高等數學 (9665) 學習筆記

你好，未來的統計學家！本章將深入探討概率論中最強大且最迷人的概念之一：貝葉斯定理 (Bayes’ Theorem)。當我們獲得新證據時，它是用來更新我們對事物認知的一種數學工具。

別擔心，這聽起來可能很複雜，但我們會通過清晰的步驟和樹狀圖 (Tree diagrams) 等視覺輔助工具來將其拆解。掌握貝葉斯定理不僅對通過 FS1 考試至關重要，還能幫助你理解概率如何在現實世界中運作，從醫學診斷到人工智能 (AI) 都離不開它！

1. 重溫條件概率 (Conditional Probability) — 基礎知識

貝葉斯定理的核心就是條件概率，只不過是反向運用。讓我們快速回顧一下基本公式：

在事件 $B$ 已經發生的前提下，事件 $A$ 發生的概率為：

$$P(A|B) = \frac{P(A \cap B)}{P(B)}$$

其中：

$P(A|B)$ 是在給定 $B$ 的情況下 $A$ 發生的概率。
$P(A \cap B)$ 是 $A$ 和 $B$ 同時發生的概率（交集）。
$P(B)$ 是事件 $B$ 發生的概率。

貝葉斯定理所解決的問題

在許多現實場景中，我們通常知道 $P(B|A)$（給定原因後的結果概率），但我們需要找出的是 $P(A|B)$（給定結果後的原因概率）。請注意，這兩者是不相等的！

類比：想像一間工廠。要知道機器生產出次品的概率 ($P(\text{Faulty} | \text{Machine A})$) 很簡單。但若要反過來推算，已知一個產品是次品，它是來自機器 A 的概率 ($P(\text{Machine A} | \text{Faulty})$)，這雖然比較困難，但卻非常有實用價值。而這正是貝葉斯定理能幫助我們計算的內容。

✅ 快速回顧：關鍵區別

千萬不要混淆 $P(A|B)$ 和 $P(B|A)$！它們幾乎總是不同的數值。貝葉斯定理就是用來連結這兩者的橋樑。

2. 全概率與樹狀圖

課程大綱要求你使用樹狀圖，它是視覺化和計算條件概率的絕佳工具，特別是在處理貝葉斯公式中的分母時，通常需要用到全概率定律 (Law of Total Probability)。

樹狀圖的建構

樹狀圖從初始事件開始，這些事件必須是互斥的 (mutually exclusive)（不能同時發生）且詳盡的 (exhaustive)（涵蓋所有可能的結果）。

設初始事件為 $A_1$ 和 $A_2$。次要事件 $B$ 可能在 $A_1$ 或 $A_2$ 之後發生。

步驟 1：初始分支
第一組分支代表無條件概率，例如 $P(A_1)$ 和 $P(A_2)$。
步驟 2：次要分支
第二組分支代表條件概率，例如 $P(B|A_1)$ 和 $P(B'|A_1)$。

乘法規則（沿著路徑）

要找到交集的概率（沿著一條路徑走），你需要進行乘法運算：

$$P(A_1 \cap B) = P(A_1) \times P(B|A_1)$$

全概率定律（分支求和）

要找到事件 $B$ 的總概率，你需要將所有導致 $B$ 的路徑的概率相加。這是貝葉斯定理分母所需的關鍵步驟。

如果 $A_1$ 和 $A_2$ 分割了樣本空間：

$$P(B) = P(A_1 \cap B) + P(A_2 \cap B)$$

代入乘法規則，即得出正式的全概率定律：

$$P(B) = P(B|A_1)P(A_1) + P(B|A_2)P(A_2)$$

課程大綱備註：你必須能夠將此方法應用於最多三個事件的問題（例如，三台不同的機器 $A_1, A_2, A_3$ 生產出物件 $B$）。

你知道嗎？
英國長老會牧師托馬斯·貝葉斯 (Thomas Bayes) 在 18 世紀發展了這個定理，但直到他去世後才發表！它在 20 世紀之前一直相對鮮為人知，直到複雜計算的出現，使其成為現代數據分析和機器學習不可或缺的核心。

3. 正式的貝葉斯定理

貝葉斯定理連接了兩個條件概率 $P(A|B)$ 和 $P(B|A)$。它是通過將全概率定律代入標準條件概率公式中推導出來的。

公式

對於兩個事件 $A$ 和 $B$：

$$P(A|B) = \frac{P(B|A)P(A)}{P(B)}$$

在 $A$ 是導致 $B$ 的一組互斥且詳盡事件 ($A_i$) 其中之一的情況下：

$$P(A_i|B) = \frac{P(B|A_i)P(A_i)}{\sum_j P(B|A_j)P(A_j)}$$

這看起來很嚇人，但請記住它的結構：

$$P(\text{原因} | \text{結果}) = \frac{P(\text{結果} | \text{原因}) \times P(\text{原因})}{\text{結果的總概率}}$$

術語理解

$P(A_i)$：先驗概率 (Prior Probability)
這是你在引入任何新證據 ($B$) 之前，對原因 $A_i$ 的初步信念或認知。
$P(B|A_i)$：似然度 (Likelihood)
這是假設原因 $A_i$ 為真時，出現證據 $B$ 的可能性。
$P(A_i|B)$：後驗概率 (Posterior Probability)
這是觀察到證據 $B$ 後，更新後的事件 $A_i$ 發生的概率。這就是你要求解的目標。
$P(B)$：證據 (Evidence 或邊際概率)
這是觀察到事件 $B$ 的總概率，使用全概率定律計算得出。

4. 貝葉斯定理的步驟化應用

貝葉斯定理的題目通常有固定的程序。如果你按照這些步驟操作，即使數字看起來很亂，你通常也能找到答案。

範例場景：醫學檢測

某種罕見疾病影響 1% 的人口。一項測試的準確率為 90%（它可以檢測出 90% 的疾病患者，若受測者健康，它也能給出 90% 的陰性結果）。

如果一個人測試呈陽性，他們真的患有該疾病的概率是多少？

目標：尋找 $P(\text{疾病} | \text{陽性檢測})$

步驟 1：定義事件並分配先驗概率

$D$：患有疾病。 $P(D) = 0.01$ (先驗概率)
$D'$：未患疾病（健康）。 $P(D') = 1 - 0.01 = 0.99$
$T$：測試結果呈陽性。

步驟 2：分配似然度（條件概率）

測試檢測出疾病（真陽性）： $P(T|D) = 0.90$
測試遺漏疾病（假陰性）： $P(T'|D) = 1 - 0.90 = 0.10$
健康時測試呈陰性（真陰性）： $P(T'|D') = 0.90$
健康時測試呈陽性（假陽性）： $P(T|D') = 1 - 0.90 = 0.10$

步驟 3：計算分子（交集）

我們需要同時患病 AND 測試呈陽性的概率：

$$P(D \cap T) = P(T|D)P(D) = 0.90 \times 0.01 = 0.009$$

步驟 4：計算分母（陽性檢測的總概率，$P(T)$）

陽性測試結果可能以兩種方式發生：真陽性（路徑 1）或假陽性（路徑 2）。

路徑 1： $P(D \cap T) = 0.009$ (來自步驟 3)
路徑 2： $P(D' \cap T) = P(T|D')P(D') = 0.10 \times 0.99 = 0.099$

$$P(T) = P(D \cap T) + P(D' \cap T) = 0.009 + 0.099 = 0.108$$

步驟 5：應用貝葉斯公式（計算後驗概率）

$$P(D|T) = \frac{P(D \cap T)}{P(T)} = \frac{0.009}{0.108} \approx 0.0833$$

關鍵收穫：儘管測試準確率為 90%，但測試呈陽性的人實際上患病的概率僅為 8.33%！這是因為該疾病非常罕見（低先驗概率），這意味著健康的假陽性人數 (0.099) 遠大於患病的真陽性人數 (0.009)。

避免常見錯誤

沒有使用全概率定律：最大的錯誤是忘記通過將事件 $B$ 可能發生的所有方式相加來計算分母 $P(B)$。
混淆條件概率：務必再次檢查題目中給出的是 $P(A|B)$ 還是 $P(B|A)$。結構至關重要。
非詳盡事件：確保你的初始事件 ($A_1, A_2, \dots$) 涵蓋了 100% 的可能性。如果它們相加不等於 1，你的全概率計算就會出錯。

5. 多事件的貝葉斯定理（最多三個事件）

在高等數學 (9665) 中，你可能會遇到涉及多達三個互斥且詳盡事件的問題，例如 $A_1, A_2$ 和 $A_3$。當貨物由三個不同的來源（工廠、班次、機器）生產時，通常會出現這種情況。

如果我們要計算觀察到的結果 $B$ 特別來自來源 $A_1$ 的概率，我們使用擴展公式：

$$P(A_1|B) = \frac{P(B|A_1)P(A_1)}{P(B|A_1)P(A_1) + P(B|A_2)P(A_2) + P(B|A_3)P(A_3)}$$

三個事件的樹狀圖處理流程

方法保持不變，只是多了一個分支！

全概率分母 $P(B)$ 將是三個乘積的總和：
路徑 1： $P(B|A_1)P(A_1)$

路徑 2： $P(B|A_2)P(A_2)$

路徑 3： $P(B|A_3)P(A_3)$

範例背景：三個班次（早班 $A_1$、中班 $A_2$、夜班 $A_3$）生產螺栓。我們知道它們的生產百分比 ($P(A_i)$) 和各自的次品率 ($P(B|A_i)$)。如果發現一個隨機的次品螺栓 ($B$)，我們可以使用上面的公式來確定它來自夜班的概率 $P(A_3|B)$。

💯 貝葉斯定理的關鍵要點

貝葉斯定理是反轉條件概率的規則。當你已知 $P(\text{結果} | \text{原因})$ 時，它可以計算出 $P(\text{原因} | \text{結果})$。始終使用樹狀圖法來構建你的解題過程：計算所需分支的路徑概率（作為分子），然後通過將所有路徑相加來計算結果的總概率（作為分母）。

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。