貝葉斯定理 (Bayes’ Theorem):高等數學 (9665) 學習筆記

你好,未來的統計學家!本章將深入探討概率論中最強大且最迷人的概念之一:貝葉斯定理 (Bayes’ Theorem)。當我們獲得新證據時,它是用來更新我們對事物認知的一種數學工具。

別擔心,這聽起來可能很複雜,但我們會通過清晰的步驟和樹狀圖 (Tree diagrams) 等視覺輔助工具來將其拆解。掌握貝葉斯定理不僅對通過 FS1 考試至關重要,還能幫助你理解概率如何在現實世界中運作,從醫學診斷到人工智能 (AI) 都離不開它!


1. 重溫條件概率 (Conditional Probability) — 基礎知識

貝葉斯定理的核心就是條件概率,只不過是反向運用。讓我們快速回顧一下基本公式:

在事件 \(B\) 已經發生的前提下,事件 \(A\) 發生的概率為:

$$P(A|B) = \frac{P(A \cap B)}{P(B)}$$

其中:

  • \(P(A|B)\) 是在給定 \(B\) 的情況下 \(A\) 發生的概率。
  • \(P(A \cap B)\) 是 \(A\) 和 \(B\) 同時發生的概率(交集)。
  • \(P(B)\) 是事件 \(B\) 發生的概率。

貝葉斯定理所解決的問題

在許多現實場景中,我們通常知道 \(P(B|A)\)(給定原因後的結果概率),但我們需要找出的是 \(P(A|B)\)(給定結果後的原因概率)。請注意,這兩者是不相等的!

類比:想像一間工廠。要知道機器生產出次品的概率 (\(P(\text{Faulty} | \text{Machine A})\)) 很簡單。但若要反過來推算,已知一個產品是次品,它是來自機器 A 的概率 (\(P(\text{Machine A} | \text{Faulty})\)),這雖然比較困難,但卻非常有實用價值。而這正是貝葉斯定理能幫助我們計算的內容。

✅ 快速回顧:關鍵區別

千萬不要混淆 \(P(A|B)\) 和 \(P(B|A)\)!它們幾乎總是不同的數值。貝葉斯定理就是用來連結這兩者的橋樑。

2. 全概率與樹狀圖

課程大綱要求你使用樹狀圖,它是視覺化和計算條件概率的絕佳工具,特別是在處理貝葉斯公式中的分母時,通常需要用到全概率定律 (Law of Total Probability)

樹狀圖的建構

樹狀圖從初始事件開始,這些事件必須是互斥的 (mutually exclusive)(不能同時發生)且詳盡的 (exhaustive)(涵蓋所有可能的結果)。

設初始事件為 \(A_1\) 和 \(A_2\)。次要事件 \(B\) 可能在 \(A_1\) 或 \(A_2\) 之後發生。

  • 步驟 1:初始分支

    第一組分支代表無條件概率,例如 \(P(A_1)\) 和 \(P(A_2)\)。

  • 步驟 2:次要分支

    第二組分支代表條件概率,例如 \(P(B|A_1)\) 和 \(P(B'|A_1)\)。

乘法規則(沿著路徑)

要找到交集的概率(沿著一條路徑走),你需要進行乘法運算:

$$P(A_1 \cap B) = P(A_1) \times P(B|A_1)$$

全概率定律(分支求和)

要找到事件 \(B\) 的總概率,你需要將所有導致 \(B\) 的路徑的概率相加。這是貝葉斯定理分母所需的關鍵步驟。

如果 \(A_1\) 和 \(A_2\) 分割了樣本空間:

$$P(B) = P(A_1 \cap B) + P(A_2 \cap B)$$

代入乘法規則,即得出正式的全概率定律:

$$P(B) = P(B|A_1)P(A_1) + P(B|A_2)P(A_2)$$

課程大綱備註:你必須能夠將此方法應用於最多三個事件的問題(例如,三台不同的機器 \(A_1, A_2, A_3\) 生產出物件 \(B\))。

你知道嗎?
英國長老會牧師托馬斯·貝葉斯 (Thomas Bayes) 在 18 世紀發展了這個定理,但直到他去世後才發表!它在 20 世紀之前一直相對鮮為人知,直到複雜計算的出現,使其成為現代數據分析和機器學習不可或缺的核心。

3. 正式的貝葉斯定理

貝葉斯定理連接了兩個條件概率 \(P(A|B)\) 和 \(P(B|A)\)。它是通過將全概率定律代入標準條件概率公式中推導出來的。

公式

對於兩個事件 \(A\) 和 \(B\):

$$P(A|B) = \frac{P(B|A)P(A)}{P(B)}$$

在 \(A\) 是導致 \(B\) 的一組互斥且詳盡事件 (\(A_i\)) 其中之一的情況下:

$$P(A_i|B) = \frac{P(B|A_i)P(A_i)}{\sum_j P(B|A_j)P(A_j)}$$

這看起來很嚇人,但請記住它的結構:

$$P(\text{原因} | \text{結果}) = \frac{P(\text{結果} | \text{原因}) \times P(\text{原因})}{\text{結果的總概率}}$$

術語理解

  • \(P(A_i)\):先驗概率 (Prior Probability)

    這是你在引入任何新證據 (\(B\)) 之前,對原因 \(A_i\) 的初步信念或認知。

  • \(P(B|A_i)\):似然度 (Likelihood)

    這是假設原因 \(A_i\) 為真時,出現證據 \(B\) 的可能性。

  • \(P(A_i|B)\):後驗概率 (Posterior Probability)

    這是觀察到證據 \(B\) 後,更新後的事件 \(A_i\) 發生的概率。這就是你要求解的目標。

  • \(P(B)\):證據 (Evidence 或邊際概率)

    這是觀察到事件 \(B\) 的總概率,使用全概率定律計算得出。

4. 貝葉斯定理的步驟化應用

貝葉斯定理的題目通常有固定的程序。如果你按照這些步驟操作,即使數字看起來很亂,你通常也能找到答案。

範例場景:醫學檢測

某種罕見疾病影響 1% 的人口。一項測試的準確率為 90%(它可以檢測出 90% 的疾病患者,若受測者健康,它也能給出 90% 的陰性結果)。

如果一個人測試呈陽性,他們真的患有該疾病的概率是多少?

目標:尋找 \(P(\text{疾病} | \text{陽性檢測})\)

步驟 1:定義事件並分配先驗概率

  • \(D\):患有疾病。 \(P(D) = 0.01\) (先驗概率)
  • \(D'\):未患疾病(健康)。 \(P(D') = 1 - 0.01 = 0.99\)
  • \(T\):測試結果呈陽性。

步驟 2:分配似然度(條件概率)

  • 測試檢測出疾病(真陽性): \(P(T|D) = 0.90\)
  • 測試遺漏疾病(假陰性): \(P(T'|D) = 1 - 0.90 = 0.10\)
  • 健康時測試呈陰性(真陰性): \(P(T'|D') = 0.90\)
  • 健康時測試呈陽性(假陽性): \(P(T|D') = 1 - 0.90 = 0.10\)

步驟 3:計算分子(交集)

我們需要同時患病 AND 測試呈陽性的概率:

$$P(D \cap T) = P(T|D)P(D) = 0.90 \times 0.01 = 0.009$$

步驟 4:計算分母(陽性檢測的總概率,\(P(T)\))

陽性測試結果可能以兩種方式發生:真陽性(路徑 1)或假陽性(路徑 2)。

  • 路徑 1: \(P(D \cap T) = 0.009\) (來自步驟 3)
  • 路徑 2: \(P(D' \cap T) = P(T|D')P(D') = 0.10 \times 0.99 = 0.099\)

$$P(T) = P(D \cap T) + P(D' \cap T) = 0.009 + 0.099 = 0.108$$

步驟 5:應用貝葉斯公式(計算後驗概率)

$$P(D|T) = \frac{P(D \cap T)}{P(T)} = \frac{0.009}{0.108} \approx 0.0833$$

關鍵收穫:儘管測試準確率為 90%,但測試呈陽性的人實際上患病的概率僅為 8.33%!這是因為該疾病非常罕見(低先驗概率),這意味著健康的假陽性人數 (0.099) 遠大於患病的真陽性人數 (0.009)。

避免常見錯誤

  • 沒有使用全概率定律:最大的錯誤是忘記通過將事件 \(B\) 可能發生的所有方式相加來計算分母 \(P(B)\)。
  • 混淆條件概率:務必再次檢查題目中給出的是 \(P(A|B)\) 還是 \(P(B|A)\)。結構至關重要。
  • 非詳盡事件:確保你的初始事件 (\(A_1, A_2, \dots\)) 涵蓋了 100% 的可能性。如果它們相加不等於 1,你的全概率計算就會出錯。

5. 多事件的貝葉斯定理(最多三個事件)

在高等數學 (9665) 中,你可能會遇到涉及多達三個互斥且詳盡事件的問題,例如 \(A_1, A_2\) 和 \(A_3\)。當貨物由三個不同的來源(工廠、班次、機器)生產時,通常會出現這種情況。

如果我們要計算觀察到的結果 \(B\) 特別來自來源 \(A_1\) 的概率,我們使用擴展公式:

$$P(A_1|B) = \frac{P(B|A_1)P(A_1)}{P(B|A_1)P(A_1) + P(B|A_2)P(A_2) + P(B|A_3)P(A_3)}$$

三個事件的樹狀圖處理流程

方法保持不變,只是多了一個分支!

  • 全概率分母 \(P(B)\) 將是三個乘積的總和:

    路徑 1: \(P(B|A_1)P(A_1)\)

    路徑 2: \(P(B|A_2)P(A_2)\)

    路徑 3: \(P(B|A_3)P(A_3)\)

範例背景:三個班次(早班 \(A_1\)、中班 \(A_2\)、夜班 \(A_3\))生產螺栓。我們知道它們的生產百分比 (\(P(A_i)\)) 和各自的次品率 (\(P(B|A_i)\))。如果發現一個隨機的次品螺栓 (\(B\)),我們可以使用上面的公式來確定它來自夜班的概率 \(P(A_3|B)\)。

💯 貝葉斯定理的關鍵要點

貝葉斯定理是反轉條件概率的規則。當你已知 \(P(\text{結果} | \text{原因})\) 時,它可以計算出 \(P(\text{原因} | \text{結果})\)。始終使用樹狀圖法來構建你的解題過程:計算所需分支的路徑概率(作為分子),然後通過將所有路徑相加來計算結果的總概率(作為分母)。