欢迎来到离散随机变量的世界!

在 H2 数学中,你已经掌握了二项分布(Binomial distribution)。现在,在进阶数学(Further Mathematics)中,我们要进一步扩展你的工具箱,引入两个专门的“计数”模型:泊松分布(Poisson Distribution)几何分布(Geometric Distribution)。无论是计算一小时内收到的邮件数量,还是计算玩游戏直到获胜所需的次数,这些模型都非常重要。别担心,如果这些看起来有点吓人,我们会一步步为你拆解!


1. 泊松分布 \(Po(\mu)\)

想象一下,你站在街角计算经过的红色汽车数量。你不知道“可能”经过的汽车最大数量(这与二项分布不同,二项分布有固定的试验次数)。你只知道平均发生率。这正是泊松分布大显身手的地方。

什么时候适合使用这个模型?

一个情况要符合泊松分布,必须满足四个条件。你可以通过缩写 CRIS 来记忆:

C – Constant rate (恒定比率): 在单位区间(时间或空间)内的平均发生次数保持不变。
R – Random/Independent (随机/独立): 事件的发生不会影响下一次事件发生的可能性。
I – Individually (个别发生): 事件不能同时发生(在极微小的时间内)。
S – Singly (单次发生): 事件每次只发生一次。

公式

若 \(X \sim Po(\mu)\),其中 \(\mu\) 是平均发生率:

\(P(X = x) = \frac{e^{-\mu} \mu^x}{x!}\),其中 \(x = 0, 1, 2, ...\)

注意:变量 \(x\) 可以无限延续!

平均值与方差

泊松分布有一个非常独特且实用的特性:

平均值 (Mean): \(E(X) = \mu\)
方差 (Variance): \(Var(X) = \mu\)

小贴士: 如果你计算某些数据的平均值和方差,发现它们几乎相等,这是一个强烈的暗示,表示泊松模型可能非常适合!

加法性质

如果你有两个独立的泊松变量,你可以直接将它们的比率加在一起!

若 \(X \sim Po(\mu_1)\) 且 \(Y \sim Po(\mu_2)\),那么:
\(X + Y \sim Po(\mu_1 + \mu_2)\)

例子:如果你平均每小时收到 2 封邮件,而你的朋友平均每小时收到 3 封,你们合起来平均每小时收到 5 封。

重点总结: 泊松分布用于模拟在固定的时间或空间区间内事件发生的次数

2. 几何分布 \(Geo(p)\)

泊松分布计算的是“有多少”,而几何分布则是在问“直到第一次成功需要多久?” 试想你要掷出骰子的“6”。你不断地掷,直到终于成功为止。你所需要的试验次数就是你的几何随机变量。

什么时候适合使用这个模型?

几何分布的条件与二项分布非常相似:

1. 每次试验都是独立的
2. 只有两种结果:成功失败
3. 成功的概率 \(p\) 在每次试验中都是固定不变的
4. 我们在第一次成功出现时立即停止试验。

公式

若 \(X \sim Geo(p)\),其中 \(p\) 是成功概率:

\(P(X = x) = (1-p)^{x-1} p\),其中 \(x = 1, 2, 3, ...\)

类比: 要在第 10 次尝试才成功,代表你必须先失败 9 次,然后在第 10 次成功。所以,\(P(X=10) = (1-p)^9 \times p\)。

平均值与方差

这些公式稍微复杂一点,但非常重要:

平均值 (期望值): \(E(X) = \frac{1}{p}\)
方差: \(Var(X) = \frac{1-p}{p^2}\)

你知道吗?如果赢得游戏的概率是 \(1/10\),平均值告诉你,你预期需要玩 10 次才能获得第一次胜利。这其实就是概率的倒数!

重点总结: 几何分布用于模拟直到第一次成功出现为止的试验次数

3. 常见陷阱

1. 泊松分布的区间错误: 如果比率是每小时 3 次,但题目询问 2 小时内的概率,你必须将 \(\mu\) 改为 6。务必确保你的 \(\mu\) 与题目中的时间/空间区间相符!

2. 从零开始:泊松分布中,\(X\) 可以是 0(什么都没发生)。但在几何分布中,\(X\) 必须至少是 1(你至少要尝试一次才能成功)。

3. 独立性: 如果事件之间相互影响,你不能将泊松变量相加,也不能使用几何分布。请务必检查题目是否暗示了独立性。


总结清单

在开始练习题之前,确保你能:

- [ ] 说出泊松 (CRIS) 和几何模型所需的条件。
- [ ] 计算这两种分布的 \(P(X=x)\) 概率。
- [ ] 记住对于泊松分布,平均值 = 方差
- [ ] 使用泊松分布的加法性质来合并独立的比率。
- [ ] 计算几何分布的预期试验次数 (\(1/p\))。

专业建议:如果公式刚开始看起来很棘手,请别担心。大多数学生在练习 5 到 10 题后,就会找到这些分布的“节奏”,并变得得心应手!