贝叶斯定理 (Bayes’ Theorem) 简介

欢迎学习统计学中最具威力的工具之一!贝叶斯定理听起来可能很深奥,但它实际上是一种非常符合逻辑的方法,让我们在获得新资讯时能够“更新”我们原有的认知。在 Pearson Edexcel 9ST0 课程中,这个课题会出现在 Paper 1,其核心在于如何巧妙地运用条件概率 (conditional probability)

你可以把它想象成当侦探。你先对谁可能犯罪有一个初步的预测(即先验概率,prior probability),接着你发现了新的证据,然后利用这些证据来改变你对谁是最有可能的嫌疑人的看法(即后验概率,posterior probability)。在本章中,我们将学习如何将这些逻辑推测转化为精确的计算。

快速复习:在深入探讨之前,请记住条件概率的写法是 \(P(A|B)\),意思是“在事件 B 已经发生的情况下,事件 A 发生的概率”。

1. 全概率公式 (The Law of Total Probability)

在我们使用贝叶斯定理之前,需要先理解公式的“下半部分”。这被称为全概率公式
别担心这个名字听起来很高深——它仅仅是指通过检视所有可能发生的途径,来计算某个事件发生的总概率。

想象你要计算一名学生考试及格的概率 (\(P(Pass)\))。学生分为两类:有复习的 (\(S\)) 和没有复习的 (\(S'\))。
要计算及格的总概率,你需要将以下两项相加:
1. 有复习且及格的概率: \(P(S \cap Pass)\)
2. 没有复习但及格的概率: \(P(S' \cap Pass)\)

以数学术语来说,如果你有三个涵盖所有可能性的事件 \(A_1, A_2, A_3\),那么事件 \(B\) 的总概率为:
\(P(B) = P(B|A_1)P(A_1) + P(B|A_2)P(A_2) + P(B|A_3)P(A_3)\)

核心重点:要找到某个结果的总概率,只需将所有导致该结果的可能路径的概率相加即可。

2. 理解贝叶斯定理

贝叶斯定理本质上是一个分数。它问的是:“已知结果 B 已经发生,那么它是由事件 A 引起的概率是多少?”

贝叶斯定理的公式为:
\(P(A|B) = \frac{P(B|A)P(A)}{P(B)}\)

让我们拆解这些部分:
\(P(A|B)\)后验概率 (Posterior)。在我们获得新证据后,想要找出更新后的概率。
\(P(A)\)先验概率 (Prior)。在获得新证据之前我们已知的概率。
\(P(B|A)\)概似度 (Likelihood)。如果 A 为真,出现证据 B 的可能性有多大?
\(P(B)\)全概率 (Total Probability)。证据发生的总概率(所有路径之和)。

一个简单的类比:
想象你听到一声“喵”(\(B\))。你想知道这声音来自猫 (\(A\)) 的概率。
“喵”声就是你的证据。分数的分子是“有一只猫且发出该声音”的概率。分数的分母是“任何事物”发出“喵”声的总概率(也许是你的朋友在恶作剧!)。

3. 使用树状图(秘密武器)

课程大纲明确提到,对于最多三个事件的情况,可以使用树状图 (tree diagrams)。这是解决贝叶斯定理题目且不会迷失在公式中的最可靠方法。

逐步解题步骤:
1. 画出树状图:从“原因”或“先验”事件开始(例如:工厂 A、工厂 B、工厂 C)。
2. 添加第二层分支:这些是“结果”(例如:次品或良品)。
3. 沿路径相乘:将每条路径上的概率相乘,得出该特定路径的概率。
4. 计算总和:将所有导致你感兴趣结果的路径的结果相加(这就是你的分母)。
5. 应用贝叶斯定理:将题目要求的那一条特定路径的概率,除以你刚刚计算出的总和 (Total)

记忆法:贝叶斯定理就是:(目标路径)÷(所有可能路径的总和)

4. 现实范例:医疗检测

这是一道经典的考试题型。假设某疾病影响了 1% 的人口 (\(P(D) = 0.01\))。一种针对该疾病的检测对于患病者有 99% 的准确率 (\(P(Positive|D) = 0.99\)),但对于健康的人,会有 2% 的假阳性率 (\(P(Positive|Healthy) = 0.02\))。如果你检测结果呈阳性,你实际上患病的概率是多少?

步骤 1:分子(患病且检测呈阳性的路径):
\(P(D \cap Positive) = 0.01 \times 0.99 = 0.0099\)

步骤 2:分母(检测呈阳性的总概率):
路径 1(患病且阳性): \(0.01 \times 0.99 = 0.0099\)
路径 2(健康且阳性): \(0.99 \times 0.02 = 0.0198\)
总 \(P(Positive) = 0.0099 + 0.0198 = 0.0297\)

步骤 3:计算:
\(P(D|Positive) = \frac{0.0099}{0.0297} \approx 0.333\) 或 33.3%

等等!你看到了吗?即使检测的“准确率”高达 99%,如果你检测呈阳性,实际患病的概率也只有 33%!这就是为什么贝叶斯定理如此重要——它考虑到了该疾病本身非常罕见这一事实。

5. 常见错误避坑指南

1. 搞混 \(P(A|B)\) 和 \(P(B|A)\):
一定要仔细阅读题目。 \(P(Defective|Machine A)\) 是机器 A 生产出次品的概率;而 \(P(Machine A|Defective)\) 则是在已知物品是次品的情况下,它由机器 A 生产的概率。贝叶斯定理就是连接这两者的桥梁。

2. 忘记分母:
许多学生只计算了分数的“上半部分”。请记住,你必须除以该证据发生的总概率。

3. 未检查概率之和是否为 1:
树状图的第一层分支(先验概率)之和必须始终等于 1。如果你有三家工厂,它们的生产份额总和必须是 100%。

快速复习框:
先验概率 (Prior):获得证据前的概率。
条件概率 (Conditional):“如果”部分(例如:如果来自工厂 A,则有 5% 概率是次品)。
后验概率 (Posterior):获知证据后的“更新”概率。
树状图:整理数据的最佳伙伴。

总结

贝叶斯定理只是一种反转条件概率的方法。我们使用树状图来找出事件发生的所有途径(全概率),然后建立一个分数,算出特定的“原因”导致我们观察到的“结果”的概率。保持分支清晰,沿路径相乘,并用“目标路径”除以“总路径”,你就能掌握它!