欢迎来到泊松分布(Poisson Distribution)的世界!

在你的 A Level 统计学旅程中,你应该已经接触过二项分布(Binomial distribution),它用于计算在固定次数试验中的“成功”次数。但如果没有固定的试验次数呢?如果我们只是想计算某件事在特定时间空间内发生的次数,该怎么办?

这就是泊松分布大显身手的时候了!无论是一小时内出现的流星数量、书页上的错别字数量,还是午餐时间进入商店的顾客人数,泊松分布都是我们的首选工具。如果一开始觉得它有点抽象,别担心,我们会一步步拆解给你听。

1. 什么样的情况适用“泊松”?(教学大纲 SB1)

要使用泊松模型,我们所计算的事件必须遵循四条严格的规则。你可以用记忆口诀 "RISC" 来记住它们:

R – Randomly(随机性): 事件必须是随机发生的。
I – Independently(独立性): 一个事件的发生不会增加或减少另一个事件发生的可能性。
S – Singly(单一性): 事件不会在同一时间或地点同时发生。
C – Constant Rate(恒定速率): 每段间隔内的平均事件数(\(\lambda\))必须保持不变。

术语与符号

如果随机变量 \(X\) 服从泊松分布,我们会将其写为:
\(X \sim \text{Po}(\lambda)\)

符号 \(\lambda\)(希腊字母 "lambda")代表平均值(在给定间隔内的平均发生次数)。

比喻: 想象雨点落在单块地砖上。如果雨势稳定(恒定速率),一滴雨点不会“指挥”另一滴雨点落在哪里(独立),而且雨点是一滴一滴落下的(单一),那么该地砖上的雨点数量就服从泊松分布。

重点总结: 在开始计算之前,请务必确认该情况是否符合随机、独立、单一且速率恒定的条件。

2. 计算概率(教学大纲 SB2)

要找出恰好发生 \(x\) 次事件的概率,我们使用以下公式:

\(P(X = x) = \frac{e^{-\lambda} \lambda^x}{x!}\)

其中:
\(e\) 是一个常数(约等于 2.718,可在计算器上找到)。
\(\lambda\) 是平均速率。
\(x\) 是你想要寻找的成功次数。
\(x!\) 是 "\(x\) 阶乘"(例如 \(4! = 4 \times 3 \times 2 \times 1\))。

使用计算器

在考试中,你大多会使用计算器的分布函数:
1. Poisson PD: 用于计算“刚好”的题目(例如 \(P(X = 3)\))。
2. Poisson CD: 用于计算“累积”的题目(例如 \(P(X \leq 3)\))。

快速检视:常见计算器错误
- 如果题目要求 \(P(X > 3)\),计算器无法直接计算。你必须计算 \(1 - P(X \leq 3)\)。
- 如果题目要求 \(P(X \geq 3)\),你必须计算 \(1 - P(X \leq 2)\)。

你知道吗? 泊松分布是以法国数学家 Siméon Denis Poisson 的名字命名的,但他本人其实并不是用它来计算事件发生次数——他当时是用它来为法律审判建模的!

3. 平均值与方差(教学大纲 SB3)

泊松分布最迷人(且最有帮助!)的特点之一,就是它的性质非常简单。对于 \(X \sim \text{Po}(\lambda)\):

平均值 (Mean): \(E(X) = \lambda\)
方差 (Variance): \(\text{Var}(X) = \lambda\)

没错,它们是相等的!这是泊松分布独有的特征。如果你手上的数据其平均值与方差大致相等,这就是该情况适用泊松模型的一个强烈讯号。

标准差 (Standard Deviation): 由于方差为 \(\lambda\),因此标准差为 \(\sqrt{\lambda}\)。

重点总结: 如果 \(X \sim \text{Po}(5)\),那么平均值就是 5,方差也是 5。很简单吧!

4. 加总独立的泊松分布(教学大纲 SB4)

有时候你有两个不同的泊松变量,想要求总和。只要它们是独立的,你就可以直接把平均值加起来。

如果 \(X \sim \text{Po}(\lambda_1)\) 且 \(Y \sim \text{Po}(\lambda_2)\),那么:
\(X + Y \sim \text{Po}(\lambda_1 + \lambda_2)\)

例子: 如果你的工作邮箱平均每小时收到 2 封邮件(\(X\)),个人邮箱平均每小时收到 3 封邮件(\(Y\)),那么你每小时收到的邮件总数为 \(X + Y \sim \text{Po}(2 + 3)\),即 \(X + Y \sim \text{Po}(5)\)。

别忘记: 这仅在事件相互独立时有效。如果收到工作邮件会导致你收到个人邮件,你就不能使用这个规则!

5. 泊松分布的假设检验(教学大纲 SB5)

我们使用假设检验来观察平均速率(\(\lambda\))是否因为某次观测而发生了改变。

逐步流程:

1. 设定假设:
\(H_0\):\(\lambda = \text{旧速率}\)
\(H_1\):\(\lambda > \text{旧速率}\)(或是 \(< \text{旧速率}\) 或 \(\neq \text{旧速率}\))

2. 确定分布:
假设 \(H_0\) 为真,即 \(X \sim \text{Po}(\lambda)\)。

3. 计算 P 值 (P-value):
找出观测值或更极端情况的发生概率。
- 若测试速率增加,计算 \(P(X \geq \text{观测值})\)。
- 若测试速率减少,计算 \(P(X \leq \text{观测值})\)。

4. 与显著性水平 (\(\alpha\)) 比较:
- 若 P 值 \(\leq \alpha\),拒绝 \(H_0\)。有显著证据显示速率已发生改变。
- 若 P 值 \(> \alpha\),接受 \(H_0\)(或称“未能拒绝”)。没有足够证据显示速率发生了改变。

例子: 一条路每年平均发生 4 起事故。安装新的测速摄像头后,隔年只发生了 1 起事故。摄像头有效吗?你可以通过计算 \(P(X \leq 1)\) 来检验 \(H_0: \lambda = 4\) 对抗 \(H_1: \lambda < 4\)。

快速检视:常见错误
学生常会计算 \(P(X = \text{观测值})\) 而非累积概率。在假设检验中,我们永远要寻找该结果或更极端情况的概率。

重点总结盒

术语: \(X \sim \text{Po}(\lambda)\)
条件: 随机、独立、单一、速率恒定。
性质: \(\text{平均值} = \text{方差} = \lambda\)。
公式: \(P(X=x) = \frac{e^{-\lambda} \lambda^x}{x!}\)
总和: 对于独立变量,直接相加 \(\lambda\) 值。
检验: 使用泊松分布求出“尾端”概率来检验平均值。