Poisson & binomial distributions - Further Mathematics (9FM0) - Pearson Edexcel A Level

欢迎来到随机事件的世界！

在本章中，我们将探讨如何计算随机发生的事件。无论是页面上的错别字数量、你在一个小时内收到的邮件数量，还是曲奇饼里有多少粒巧克力豆，统计学都能帮助我们预测这些“不可预测”的事物。我们将研究泊松分布 (Poisson Distribution)，以及它与你之前学过的二项分布 (Binomial Distribution)之间的联系。如果起初看到这些符号感到不知所措，请不用担心，我们会一步步为你拆解！

1. 泊松分布：基本概念

泊松分布用于模拟在一个固定间隔的时间或空间内，某事件发生的次数。

我们什么时候会用到它？
要使用泊松分布进行模拟，必须满足四个条件。你可以通过首字母缩写 RISH 来记忆：

• Randomly (随机性)：事件是随机发生的。
• Independently (独立性)：一个事件的发生不会改变另一个事件发生的概率。
• Singly (单一性)：事件不能在完全相同的时间点同时发生。
• Highly uniform (高度均匀性)：事件以恒定的平均速率 (\(\lambda\)) 发生。

例子：如果你正在计算经过闸门的汽车数量，它们应该以恒定的平均速率经过（例如每分钟 2 辆车），但每辆车经过的具体时间是随机且独立的。

公式：
如果一个随机变量 \(X\) 服从平均速率为 \(\lambda\) 的泊松分布，我们记作：
\(X \sim \text{Po}(\lambda)\)

恰好观察到 \(x\) 个事件的概率为：
\(P(X = x) = \frac{e^{-\lambda} \lambda^x}{x!}\)

记忆小技巧：在计算器上，你通常不需要输入整个公式！请寻找 Poisson PD（用于计算特定数值）或 Poisson CD（用于计算范围，例如“小于 3”）功能。

重点总结：泊松分布的核心在于事物在特定时间或空间“窗口”内发生的速率 (\(\lambda\))。

2. 加法性质：缩放与合并

泊松分布最酷的地方之一是它对速率 \(\lambda\) 的处理非常灵活。由于它是一个速率，你可以轻松地对其进行缩放。

缩放速率

如果 \(X\) 是每分钟发生的事件数量，且 \(X \sim \text{Po}(\lambda)\)，那么在 \(t\) 分钟的时间段内，新的分布为：
\(X_{new} \sim \text{Po}(\lambda t)\)

生活比喻：如果你通常每小时收到 2 条短信 (\(\lambda = 2\))，那么在 5 小时内，你预期会收到 10 条短信 (\(2 \times 5 = 10\))。你这 5 小时内的目标分布就是 \(\text{Po}(10)\)。

相加独立变量

如果你有两个独立的泊松变量 \(X\) 和 \(Y\)，你可以将它们相加：
如果 \(X \sim \text{Po}(\lambda)\) 且 \(Y \sim \text{Po}(\mu)\)，那么：
\(X + Y \sim \text{Po}(\lambda + \mu)\)

例子：如果一家商店有两个入口，A 门每小时进入的人数为 \(\text{Po}(3)\)，B 门每小时进入的人数为 \(\text{Po}(4)\)，那么进入商店的总人数即为 \(\text{Po}(3+4) = \text{Po}(7)\) 每小时。

重点总结：只要事件是独立的，且时间/空间间隔一致，你就可以将泊松速率相加！

3. 平均值与方差：泊松的“魔法”

在统计学中，我们经常研究期望值 (Expectation/Mean) 和方差 (Variance)（数据的分散程度）。以下是我们两个常用分布的对比：

对于二项分布 \(B(n, p)\)：

• 平均值：\(E(X) = np\)
• 方差：\(Var(X) = np(1-p)\)

对于泊松分布 \(Po(\lambda)\)：

• 平均值：\(E(X) = \lambda\)
• 方差：\(Var(X) = \lambda\)

你知道吗？
泊松分布的独特之处在于它的平均值和方差完全相同！这是一个非常常见的考题。如果题目给出的数据中平均值和方差很接近，这是一个强烈的暗示，表示使用泊松模型会非常合适。

快速回顾：
如果 \(Var(X) \approx E(X)\)，则泊松是一个好的模型。
如果 \(Var(X) < E(X)\)，使用二项分布模型可能会更好。

4. 二项分布的泊松近似

有时，计算二项分布 \(B(n, p)\) 的概率会变成一场恶梦——尤其是当 \(n\) 非常大（例如 1,000）且 \(p\) 非常小（例如 0.001）时。在这些情况下，我们可以使用泊松分布作为捷径！

什么时候可以使用这个捷径？
当满足以下条件时，你可以用 \(Po(\lambda)\) 近似 \(B(n, p)\)：
1. \(n\) 很大（通常 \(n > 50\)）
2. \(p\) 很小（通常 \(p < 0.1\)）

操作步骤：
步骤 1：检查 \(n\) 是否够大，\(p\) 是否够小。
步骤 2：利用公式 \(\lambda = np\) 计算速率 \(\lambda\)。
步骤 3：使用泊松分布 \(\text{Po}(np)\) 来查找你的概率。

例子：一家工厂生产 1,000 个灯泡，灯泡有瑕疵的概率是 0.005。与其使用 \(B(1000, 0.005)\)，不如使用 \(\text{Po}(1000 \times 0.005) = \text{Po}(5)\)。这样计算会快得多！

重点总结：随着试验次数增加且成功概率降低，泊松分布正是二项分布的“极限”。

5. 常见陷阱要避开

如果起初觉得棘手也别担心，但请记住以下常见错误：

• 忘记缩放 \(\lambda\)：务必检查题目中的时间间隔是否与 \(\lambda\) 的时间间隔匹配。如果 \(\lambda\) 是“每天”，但题目问的是“每周”，你必须先乘以 7。
• 独立性：只有当变量是独立的，你才能将泊松变量相加。如果一个事件会触发另一个事件（如传染病），泊松通常不是一个好的模型。
• 二项分布 vs. 泊松分布：记住二项分布有一个固定的上限 (\(n\))，而泊松在理论上没有上限（即使概率接近零，理论上也可能发生无穷多次事件）。
• 计算器模式：仔细检查你需要的是 PD（恰好 \(x\)）还是 CD（累积至 \(x\)）。如果题目问“大于 5”，你需要计算 \(1 - P(X \leq 5)\)（使用 CD 模式）。

总结检查清单

• 我能列出泊松分布的条件吗？(RISH)
• 我知道对于泊松分布，平均值 = 方差 = \(\lambda\) 吗？
• 我能针对不同的时间间隔缩放 \(\lambda\) 吗？
• 我知道使用泊松近似二项分布的条件吗（\(n\) 大，\(p\) 小）？
• 我能熟练使用计算器计算 \(P(X = x)\) 和 \(P(X \leq x)\) 吗？

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。