简介:计算事件与测量时间
欢迎来到统计学中最实用的章节之一!在单元一:数据与概率 (Paper 1: Data and Probability) 的这一部分,我们将探讨如何为“随机”发生的事件建立数学模型。
你有没有想过,你在一小时内可能会收到多少封邮件,或者你需要等待多久巴士才会到达?泊松分布 (Poisson distribution) 能帮助我们计算这些事件的数量,而指数分布 (Exponential distribution) 则能帮助我们测量事件之间的时间间隔。它们就像硬币的两面,息息相关!
1. 泊松分布 (The Poisson Distribution)
泊松分布是一种离散型 (discrete) 概率分布。当我们想要计算在固定的时间或空间间隔内,特定事件发生了多少次时,就会使用它。
何时适合使用泊松模型?
要使用泊松分布建立模型,必须满足四个条件。你可以利用助记词 CRIS 来记忆:
C – Constant Rate(固定比率):事件必须以一个固定的平均比率 (\(\lambda\)) 发生。
R – Random(随机性):事件随机发生;你无法准确预测下一次会在什么时候发生。
I – Independent(独立性):一个事件的发生不会改变另一个事件发生的可能性。
S – Singly(单一性):事件不能在同一瞬间同时发生;它们必须逐一发生。
泊松公式
如果一个随机变量 \(X\) 服从平均比率为 \(\lambda\) 的泊松分布,我们记作 \(X \sim \text{Po}(\lambda)\)。
观察到恰好 \(x\) 次事件的概率为:
\(P(X=x) = \frac{e^{-\lambda} \lambda^x}{x!}\)
平均值与方差:泊松分布最独特的地方之一,就是它的平均值 (mean) 和方差 (variance) 完全相同!
\(E(X) = \lambda\)
\(Var(X) = \lambda\)
重点速览:
- 离散型(计算整数)。
- \(\lambda\) 是平均发生次数。
- 平均值 = 方差。
关键总结:
当你想计算在固定的时间或空间区间内,随机且独立事件发生的次数时,请使用泊松分布。
2. 指数分布 (The Exponential Distribution)
如果说泊松分布用于计算事件数量,那么指数分布则用于测量事件之间的时间间隔。由于时间和距离可以精确到任何小数位,因此这是一种连续型 (continuous) 分布。
泊松与指数分布的关系
它们两者是好伙伴!如果事件发生的次数服从比率为 \(\lambda\) 的泊松分布,那么这些事件之间的时间间隔就服从比率同样为 \(\lambda\) 的指数分布。
比喻:如果泊松分布告诉你,平均每小时有 2 辆巴士到达 (\(\lambda = 2\)),那么指数分布就会告诉你,巴士之间的平均等待时间是半小时 (\(1/2\))。指数分布公式
我们记作 \(X \sim \text{Exp}(\lambda)\)。请注意,此处的 \(\lambda\) 与泊松分布中的“比率”相同。
平均值: \(E(X) = \frac{1}{\lambda}\)
方差: \(Var(X) = \frac{1}{\lambda^2}\)
若要计算时间 \(X\) 小于某个数值 \(x\) 的概率,我们使用累积分布函数 (Cumulative Distribution Function, CDF):
\(P(X < x) = 1 - e^{-\lambda x}\)
冷知识:
指数分布具有“无记忆性”(memoryless)。这意味着如果你在等待放射性原子衰变,无论你已经等待了十秒钟还是十年,它在下一分钟内发生衰变的概率都是一样的!
关键总结:
指数分布用于模拟随机事件之间的时间或空间间隔。如果事件发生率为 \(\lambda\),则平均等待时间为 \(1/\lambda\)。
3. 解题步骤:按部就班
如果起初觉得混淆也不用担心,大部分错误都是因为搞混了这两个分布。请遵循以下步骤:
步骤 1:识别分布类型
问自己:我是在计算东西的数量(泊松),还是在测量时间/距离(指数)?
步骤 2:找出 \(\lambda\)
确保 \(\lambda\) 与题目中的区间相匹配。
例子:如果比率是每小时 10 通电话,但题目问的是 30 分钟内的窗口,那么该题的 \(\lambda\) 就是 5。
步骤 3:使用正确的公式或计算器
对于泊松分布,你通常会使用计算器中的 Poisson PD(用于 \(X=x\))或 Poisson CD(用于 \(X \le x\))。对于指数分布,你几乎总是使用公式 \(P(X < x) = 1 - e^{-\lambda x}\)。
常见错误:
- 单位不匹配:务必检查 \(\lambda\) 的时间单位与题目是否一致(例如:分钟 vs 小时)。
- 平均值 vs 比率:在指数分布中,平均值是 \(1/\lambda\),但比率是 \(\lambda\)。如果题目说“平均时间是 10 分钟”,那么 \(\lambda = 1/10 = 0.1\)。
- 严格不等式:由于指数分布是连续的,\(P(X < 5)\) 与 \(P(X \le 5)\) 相同。但这对于离散型的泊松分布来说是不成立的!
关键总结:
开始计算前,一定要再次检查单位,并确认你处理的是比率 (\(\lambda\)) 还是平均值 (\(1/\lambda\))。
4. 快速复习总结表
泊松分布 \(X \sim \text{Po}(\lambda)\)
- 类型:离散型 (0, 1, 2...)
- 测量对象:事件发生的次数
- 平均值: \(\lambda\)
- 方差: \(\lambda\)
指数分布 \(X \sim \text{Exp}(\lambda)\)
- 类型:连续型 (\(x > 0\))
- 测量对象:事件之间的时间/空间间隔
- 平均值: \(\frac{1}{\lambda}\)
- 方差: \(\frac{1}{\lambda^2}\)
最终总结:
泊松分布计算的是有多少次,而指数分布测量的是还要等多久。只要掌握泊松分布的条件 (CRIS) 以及两者之间的关系,你在 Paper 1 中就能游刃有余!