Bayes’ Theorem - Further Mathematics (9665) - Oxford AQA International A-level

贝叶斯定理 (Bayes’ Theorem)：高等数学 (9665) 学习笔记

你好，未来的统计学家！本章我们将深入探讨概率论中最强大且迷人的概念之一：贝叶斯定理。它是我们在获得新证据时，用以更新自身认知（概率预测）的数学工具。

如果这听起来有些复杂，请不要担心——我们将通过清晰的步骤和树状图（Tree Diagrams）等可视化辅助工具将其拆解。掌握贝叶斯定理不仅对于通过 FS1 考试至关重要，更是理解从医学诊断到人工智能等现实世界中概率运作逻辑的核心！

1. 重温条件概率（基础知识）

贝叶斯定理本质上是条件概率的逆向应用。让我们先快速回顾一下基础公式：

已知事件 $B$ 已经发生的情况下，事件 $A$ 发生的条件概率为：

$$P(A|B) = \frac{P(A \cap B)}{P(B)}$$

其中：

$P(A|B)$ 是在 $B$ 发生的条件下 $A$ 发生的概率。
$P(A \cap B)$ 是 $A$ 和 $B$ 同时发生的概率（交集）。
$P(B)$ 是事件 $B$ 发生的概率。

贝叶斯定理解决的问题

在许多现实场景中，我们往往知道 $P(B|A)$（即“已知原因求结果”的概率），但我们需要求解的是 $P(A|B)$（即“已知结果求原因”的概率）。这两者绝不相同！

类比： 想象一家工厂。知道机器生产出次品的概率 ($P(\text{Faulty} | \text{Machine A})$) 很容易。但如果要反过来计算——在已知某件产品是次品的情况下，它是 A 机器生产出来的概率 ($P(\text{Machine A} | \text{Faulty})$)，虽然难度更大，但其价值却高得多。这正是贝叶斯定理能帮我们计算的内容。

✅ 快速回顾：核心区别

千万不要把 $P(A|B)$ 和 $P(B|A)$ 搞混了！它们的值几乎总是不同的。贝叶斯定理就是连接这两者的桥梁。

2. 全概率公式与树状图

教学大纲要求你熟练使用树状图。这是可视化和计算条件概率的绝佳工具，尤其是在处理贝叶斯公式中的分母时，通常需要用到全概率公式（Law of Total Probability）。

构建树状图

树状图通常从一系列初始事件开始，这些事件必须是互斥的（不能同时发生）且完备的（涵盖了所有可能的结果）。

假设初始事件为 $A_1$ 和 $A_2$，且次要事件 $B$ 可能在 $A_1$ 或 $A_2$ 发生之后出现。

第一步：初始分支
第一组分支代表无条件概率，例如 $P(A_1)$ 和 $P(A_2)$。
第二步：次级分支
第二组分支代表条件概率，例如 $P(B|A_1)$ 和 $P(B'|A_1)$。

乘法法则（沿分支路径）

要计算交集的概率（即沿着某条特定路径走到底），你需要进行乘法运算：

$$P(A_1 \cap B) = P(A_1) \times P(B|A_1)$$

全概率公式（求和分支）

要计算事件 $B$ 的总概率，你需要将所有导致 $B$ 发生的路径的概率相加。这是贝叶斯定理分母部分的关键步骤。

如果 $A_1$ 和 $A_2$ 构成了样本空间的一个划分：

$$P(B) = P(A_1 \cap B) + P(A_2 \cap B)$$

代入乘法法则后，得到全概率公式的正式表达：

$$P(B) = P(B|A_1)P(A_1) + P(B|A_2)P(A_2)$$

大纲提示： 你必须能够将此方法应用于涉及最多三个事件的问题（例如：三台不同的机器 $A_1, A_2, A_3$ 共同生产产品 $B$）。

你知道吗？
英国长老会牧师托马斯·贝叶斯在 18 世纪提出了这个定理，但直到他去世后才被发表！它在很长一段时间里都默默无闻，直到 20 世纪，随着计算机算力的飞速发展，它才成为现代数据分析和机器学习的核心基础。

3. 正式的贝叶斯定理

贝叶斯定理将 $P(A|B)$ 和 $P(B|A)$ 这两个条件概率联系在了一起。它只需将全概率公式代入标准条件概率公式即可推导出来。

公式表达

对于两个事件 $A$ 和 $B$：

$$P(A|B) = \frac{P(B|A)P(A)}{P(B)}$$

在 $A$ 是导致 $B$ 发生的一组互斥且完备事件（$A_i$）中的一个时：

$$P(A_i|B) = \frac{P(B|A_i)P(A_i)}{\sum_j P(B|A_j)P(A_j)}$$

这看起来很吓人，但请记住它的结构：

$$P(\text{原因} | \text{结果}) = \frac{P(\text{结果} | \text{原因}) \times P(\text{原因})}{\text{结果的总概率}}$$

术语解析

$P(A_i)$：先验概率 (Prior Probability)
这是在引入任何新证据 ($B$) 之前，你对原因 $A_i$ 的初始信念或已知概率。
$P(B|A_i)$：似然概率 (Likelihood)
这是假设原因 $A_i$ 为真时，观察到证据 $B$ 的可能性。
$P(A_i|B)$：后验概率 (Posterior Probability)
这是在观察到证据 $B$ 之后，对原因 $A_i$ 更新后的概率。这就是我们要计算的目标值。
$P(B)$：证据（或边际概率）
这是观察到事件 $B$ 的总概率，使用全概率公式计算得出。

4. 贝叶斯定理的步骤化应用

贝叶斯定理的题目遵循固定的程序。如果你按照以下步骤操作，即使数字看起来很乱，通常也能顺利求解。

示例场景：医学检测

某种罕见疾病在人口中的发病率为 1%。某项检测的准确率为 90%（即如果患病，有 90% 的概率检测出阳性；如果健康，有 90% 的概率检测出阴性）。

如果一个人检测结果为阳性，他确实患病的概率是多少？

目标：求解 $P(\text{患病} | \text{阳性检测结果})$

第一步：定义事件并设定先验概率

$D$：患病。$P(D) = 0.01$（先验概率）
$D'$：不患病（健康）。$P(D') = 1 - 0.01 = 0.99$
$T$：检测结果阳性。

第二步：设定似然概率（条件概率）

检测出患病（真阳性）：$P(T|D) = 0.90$
漏诊（假阴性）：$P(T'|D) = 1 - 0.90 = 0.10$
健康人检测阴性（真阴性）：$P(T'|D') = 0.90$
健康人检测阳性（假阳性）：$P(T|D') = 1 - 0.90 = 0.10$

第三步：计算分子（交集）

我们需要“患病且检测阳性”的概率：

$$P(D \cap T) = P(T|D)P(D) = 0.90 \times 0.01 = 0.009$$

第四步：计算分母（阳性检测的总概率 $P(T)$）

阳性检测结果可能由两种情况引起：真阳性（路径 1）或假阳性（路径 2）。

路径 1：$P(D \cap T) = 0.009$（来自第三步）
路径 2：$P(D' \cap T) = P(T|D')P(D') = 0.10 \times 0.99 = 0.099$

$$P(T) = P(D \cap T) + P(D' \cap T) = 0.009 + 0.099 = 0.108$$

第五步：应用贝叶斯公式（计算后验概率）

$$P(D|T) = \frac{P(D \cap T)}{P(T)} = \frac{0.009}{0.108} \approx 0.0833$$

核心要点： 尽管检测的准确率高达 90%，但一个阳性结果的人真正患病的概率却只有约 8.33%！这是因为该病非常罕见（先验概率低），导致健康人出现假阳性的总数（0.099）远高于真正患病者被检测出的数量（0.009）。

常见的易错点

没有使用全概率公式： 最大的错误就是忘记通过求和所有可能导致事件 $B$ 发生的路径来计算分母 $P(B)$。
搞混条件： 一定要仔细检查题目给出的是 $P(A|B)$ 还是 $P(B|A)$。结构至关重要。
事件非完备： 确保你的初始事件 ($A_1, A_2, \dots$) 涵盖了 100% 的可能性。如果它们相加不等于 1，你的全概率计算就会出错。

5. 多个事件下的贝叶斯定理（最多三个）

在高等数学 (9665) 中，你可能会遇到包含多达三个互斥且完备事件的问题，例如 $A_1, A_2, A_3$。这通常发生在产品由三个不同来源（工厂、班次、机器）生产的情况下。

如果我们想求已知结果 $B$ 专门来自来源 $A_1$ 的概率，我们使用扩展后的公式：

$$P(A_1|B) = \frac{P(B|A_1)P(A_1)}{P(B|A_1)P(A_1) + P(B|A_2)P(A_2) + P(B|A_3)P(A_3)}$$

使用树状图处理三个事件的流程

方法与之前一致，只是多了一个分支！

全概率分母 $P(B)$ 将是三个乘积之和：
路径 1：$P(B|A_1)P(A_1)$

路径 2：$P(B|A_2)P(A_2)$

路径 3：$P(B|A_3)P(A_3)$

示例背景： 三个班次（早班 $A_1$、中班 $A_2$、晚班 $A_3$）生产螺栓。我们已知各班次的生产百分比 ($P(A_i)$) 和各自的次品率 ($P(B|A_i)$)。如果发现一个随机的次品 ($B$)，我们可以利用上述公式来确定它来自晚班的概率，即 $P(A_3|B)$。

💯 关于贝叶斯定理的核心总结

贝叶斯定理是反转条件概率的规则。当你已知 $P(\text{结果} | \text{原因})$ 时，它能帮你算出 $P(\text{原因} | \text{结果})$。务必使用树状图法来组织解题步骤：计算目标路径的概率作为分子，然后将所有导致结果的路径概率求和作为分母。

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。