Probability

欢迎来到概率章节！

你好，未来的统计学家！本章是整个统计学 1 (S1) 的基石。概率简单来说就是研究“可能性”——即量化某些事件发生的可能性大小。如果起初觉得有些棘手，请不要担心；我们将通过简洁的语言和实用的例子，一步步拆解每一个概念。

为什么要学习概率？ 它是统计学家进行预测、评估风险和解读数据的工具，应用范围极其广泛，从临床试验到经济趋势预测无所不包。掌握了这一章，就等于掌握了统计学的核心语言！

第 1 节：概率的语言与基础

1.1 定义基本概念

为了用数学方式讨论随机性，我们需要精确的术语：

试验 (Experiment/Trial)： 一种结果不确定的动作或过程（例如：掷硬币、掷骰子）。
结果 (Outcome)： 试验的一个可能发生的结果（例如：得到“正面”、掷出“4”）。
样本空间 (Sample Space, $S$)： 所有可能结果的集合。例如：对于掷一颗标准骰子，$S = \{1, 2, 3, 4, 5, 6\}$。
事件 (Event, A, B 等)： 特定的结果集合（样本空间的子集）。事件 A 可以是“掷出奇数”，那么 $A = \{1, 3, 5\}$。

1.2 计算简单概率

如果所有结果是等可能 (equally likely) 的，我们使用以下基本规则计算事件 A 的概率 $P(A)$：

$$P(A) = \frac{\text{事件 A 中包含的结果数量}}{\text{样本空间中的总结果数量}}$$

概率尺度： 概率必须始终在 0 到 1 之间（包含 0 和 1）。

$P(A) = 0$：该事件是不可能事件 (impossible)。
$P(A) = 1$：该事件是必然事件 (certain)。
$P(A) = 0.5$：该事件发生与不发生的可能性相等。

符号表示与对立事件

事件 A 的对立事件 (complement)，记作 $A'$（读作“A prime”或“A complement”），是指 A 不发生的事件。

由于 A 和 A' 覆盖了整个样本空间：

$$P(A) + P(A') = 1$$

由此得出一个有用的规则：

$$P(A') = 1 - P(A)$$

快速回顾： 概率是一个 0 到 1 之间的分数。如果计算某事“不发生”的概率更容易，直接使用对立事件规则即可！

第 2 节：组合事件——加法法则（并集与交集）

当我们处理事件 A 和 B 时，经常想知道它们同时发生的概率，或者至少发生其中之一的概率。

2.1 交集 ($\cap$) 与并集 ($\cup$)

交集 ($A \cap B$)： A 和 B 同时发生的概率。（重叠部分）。
并集 ($A \cup B$)： A 或 B 或两者同时发生的概率。（A 或 B 所覆盖的所有区域）。

记忆小贴士： 想想并集 (Union) 里的字母 'U'，它就像一个口袋，装下了所有内容。符号 $\cap$ 看起来像一座连接两条道路的桥（代表同时发生）。

2.2 互斥事件 (Mutually Exclusive, ME)

如果两个事件 A 和 B 不能同时发生，则称它们是互斥的。它们没有任何共同的结果。

如果 A 和 B 互斥，那么它们交集的概率为零：

$$P(A \cap B) = 0$$

互斥事件的加法法则

如果 A 和 B 互斥，那么 A 或 B 发生的概率仅仅是它们各自概率之和：

$$P(A \cup B) = P(A) + P(B)$$

2.3 一般加法法则（重叠问题）

如果 A 和 B 不是互斥的呢？如果我们直接相加 $P(A) + P(B)$，那么同时存在于 A 和 B 中的结果（即交集）就会被计算两次。为了修正这一点，我们需要减去一次重叠部分。

一般加法法则：

$$P(A \cup B) = P(A) + P(B) - P(A \cap B)$$

你知道吗？ 这个一般规则即使对于互斥事件也适用！如果它们是互斥的，那么 $P(A \cap B) = 0$，公式就会自动简化为特殊情况。

关键点： 计算“或”概率 ($A \cup B$) 时，一定要检查事件是否有重叠。如果有，请使用一般加法法则。

第 3 节：条件概率与独立性

本节引入了一个概念：如果我们已知另一个事件已经发生，那么某个事件发生的概率可能会改变。

3.1 条件概率

条件概率是指在事件 B 已经发生的前提下，事件 A 发生的概率。记作 $P(A|B)$。

类比： 假设样本空间 S 是全校所有学生。事件 A 是“戴眼镜”，事件 B 是“数学社团成员”。$P(A|B)$ 的意思是我们把样本空间缩小到了只剩下数学社团成员 (B)，并在该群体中计算戴眼镜 (A) 的概率。

条件概率公式：

$$P(A|B) = \frac{P(A \cap B)}{P(B)}$$

（前提是 $P(B) \neq 0$）。

实例： 如果 $P(\text{下雨} \cap \text{交通拥堵}) = 0.2$，且 $P(\text{交通拥堵}) = 0.4$，那么在交通拥堵的情况下下雨的概率是 $P(\text{下雨} | \text{交通拥堵}) = 0.2 / 0.4 = 0.5$。

3.2 一般乘法法则（重排条件概率公式）

我们可以通过重排条件概率公式来计算交集 ($A \cap B$) 的概率。这个规则对于树状图至关重要。

$$P(A \cap B) = P(B) \times P(A|B)$$

或者：

$$P(A \cap B) = P(A) \times P(B|A)$$

3.3 独立事件

如果事件 A 的发生不会影响事件 B 发生的概率，则称这两个事件是独立 (independent) 的。

如果 A 和 B 独立，则：

$$P(A|B) = P(A) \quad \text{且} \quad P(B|A) = P(B)$$

独立事件的乘法法则（独立性检验）

如果 A 和 B 独立，一般乘法法则可以简化为：

$$P(A \cap B) = P(A) \times P(B)$$

重要测试： 要证明两个事件 A 和 B 独立，必须计算 $P(A \cap B)$ 并将其与 $P(A) \times P(B)$ 进行精确比较。如果它们相等，则事件独立。

⚠️ 常见错误警示！

千万不要混淆互斥事件 (Mutually Exclusive) 和独立事件 (Independent)。

互斥： 不能同时发生。$P(A \cap B) = 0$。
独立： 一个发生不影响另一个。$P(A \cap B) = P(A)P(B)$。

如果事件的概率非零，它们不可能既互斥又独立。因为如果 A 发生了，B 就绝对不可能发生（因为它们互斥），所以 A 的发生会极大地影响 B 的概率（即它们是相关的）！

关键点： 条件概率会缩小样本空间。独立性是一个必须使用乘法法则 $P(A \cap B) = P(A)P(B)$ 进行数学验证的条件。

第 4 节：概率的可视化工具（韦恩图与树状图）

这些图表对于组织信息非常有用，特别是在处理复杂的条件概率问题或重叠问题时。

4.1 韦恩图 (Venn Diagrams)

韦恩图在矩形（样本空间 S）内使用重叠的圆圈来表示事件及其关系。

如何使用韦恩图：

画一个矩形 (S) 并为每个事件画一个圆圈 (A, B)。
始终先填充交集 ($A \cap B$)。
计算 A 的剩余部分：$P(A) - P(A \cap B)$。
计算 B 的剩余部分：$P(B) - P(A \cap B)$。
填充圆圈外的区域 ($A' \cap B'$)，确保所有概率之和为 1。

识图指南：

$A \cup B$：圆圈 A 和 B 内部的所有区域。
$A' \cap B$：在 B 内部但在 A 外部的区域（即发生 B，但不发生 A）。

4.2 树状图 (Tree Diagrams)

树状图非常适合展示序列事件（当一个事件跟随另一个事件发生时，例如不放回抽牌，或多阶段试验）。

树状图规则：

分支： 在分支上标注对应事件发生的概率。
“且”规则（乘法）： 要计算一条路径的概率（例如：先发生 A，再发生 B），需将路径上的概率相乘。（使用一般乘法法则：$P(A \cap B) = P(A) \times P(B|A)$）。
“或”规则（加法）： 如果多条路径都能导向最终目标结果（例如：第一次尝试“成功”或第二次尝试“成功”），则将这些路径终点的概率相加。

利用树状图处理条件概率

树状图通常在第二组分支上涉及条件概率（因为第二个事件的概率取决于第一个事件的结果）。

如果你想求 $P(A|B)$，其中 B 是可以通过两条不同路径（路径 1：A 然后 B；路径 2：A' 然后 B）发生的结果，你必须使用公式：