指数分布简介
你好!欢迎阅读关于指数分布(Exponential Distribution)的学习笔记。这是你选修单元 2 – 统计(Optional application 2 – statistics)中的核心课题。虽然它看起来因为包含 \(e\) 和积分符号而显得有些吓人,但实际上,它是你将会学到的分布中,逻辑最清晰且最贴近“现实世界”的分布之一。
简单来说,如果泊松分布(Poisson distribution)是用来计算在特定时间内发生了多少次事件,那么指数分布则是衡量这些事件之间相隔的时间。如果你曾经等待过巴士或回复消息,你其实就已经体验过指数分布了!
1. 何时使用指数分布
在查看公式之前,我们需要知道何时适合使用这个模型。指数分布用于对以恒定平均速率(\(\lambda\))发生的独立事件之间的时间或距离进行建模。
关键条件 (SF1):
要使用此分布,事件必须满足以下条件:
- 独立性:一个事件的发生不会改变下一个事件发生的概率。
- 随机性:事件是单独发生的,且不会在同一瞬间同时发生。
- 恒定速率:单位时间内的平均事件数量,即 \(\lambda\)(lambda),必须保持不变。
与泊松分布的联系 (SF4):
这两个分布之间有一个绝妙的联系:如果事件发生的次数服从泊松分布,那么这些事件之间的时间间隔就服从指数分布。
例子:如果一家店平均每小时有 \(\lambda = 10\) 位顾客光临(泊松分布),那么顾客之间等待的时间就服从 \(\lambda\) 相同的指数分布。
快速回顾:记住,虽然泊松分布的变量 \(X\) 是离散的(你不可能有 2.5 位顾客),但指数分布的变量 \(X\) 是连续的(你可以等待 2.5 分钟)。
2. 概率密度函数 (PDF)
概率密度函数 (Probability Density Function),即 \(f(x)\),告诉我们曲线在任何一点 \(x\) 的“高度”。对于指数分布而言,曲线从高处开始,并随着 \(x\) 的增加逐渐衰减趋近于零。
公式 (SF1):
对于随机变量 \(X \sim \text{Exp}(\lambda)\):
\(f(x) = \lambda e^{-\lambda x}\),其中 \(x \ge 0\)
\(f(x) = 0\),其中 \(x < 0\)
图形看起来如何?
想象一个滑梯,从 y 轴上的 \(\lambda\) 开始向下弯曲,并无限趋近于 x 轴但永不接触。这显示了短时间的等待比长时间的等待发生的概率要高得多。
3. 累积概率分布函数 (CDF)
累积概率分布函数 (Cumulative Distribution Function),即 \(F(x)\),在解决考试题目时非常有用。它告诉你等待时间小于或等于某个数值 \(x\) 的概率。
公式 (SF1):
\(F(x) = P(X \le x) = 1 - e^{-\lambda x}\)
计算“大于”概率 (SF2):
题目经常要求计算等待时间超过某个数值的概率。这其实更简单:
\(P(X > x) = 1 - F(x) = e^{-\lambda x}\)
记忆小撇步:
记住 "L" 代表 Less than(小于)(包含 \(1 - e\)),"M" 代表 More than(大于)(只有 \(e\))。
\(P(X > x) = e^{-\lambda x}\)(即分布的“尾部”)。
例题:
呼叫中心接到电话的间隔时间服从指数分布,平均每小时接到 4 通电话。求下一次电话在 15 分钟内打入的概率。
1. 找出 \(\lambda\):每小时 4 通电话。
2. 将时间单位换算成与 \(\lambda\) 一致:15 分钟 = 0.25 小时。
3. 使用 \(F(x)\):\(P(X \le 0.25) = 1 - e^{-4 \times 0.25} = 1 - e^{-1} \approx 0.632\)。
4. 平均值、方差与标准差
你需要掌握指数分布的这三个属性 (SF3)。它们出奇地简单!
平均值(期望值):
\(E(X) = \mu = \frac{1}{\lambda}\)
类比:如果你每小时有 10 班巴士,你预期两班车之间的等待时间是 \(\frac{1}{10}\) 小时(6 分钟)。
方差:
\(\text{Var}(X) = \sigma^2 = \frac{1}{\lambda^2}\)
标准差:
\(\text{SD}(X) = \sigma = \sqrt{\frac{1}{\lambda^2}} = \frac{1}{\lambda}\)
你知道吗? 在指数分布中,平均值和标准差是完全一样的!如果题目告诉你平均值是 5,你马上就能知道标准差也是 5。
5. 必要证明 (SF3)
在 AQA Further Maths 中,你需要能够证明平均值和方差。别担心,如果这看起来很复杂,其实它们只是运用了分部积分法(Integration by Parts)。
平均值 \(E(X)\) 的证明:
回想 \(E(X) = \int_{0}^{\infty} x f(x) dx\)。
\(E(X) = \int_{0}^{\infty} x (\lambda e^{-\lambda x}) dx\)
使用分部积分法,设 \(u = x\) 且 \(\frac{dv}{dx} = \lambda e^{-\lambda x}\):
1. \(\frac{du}{dx} = 1\) 且 \(v = -e^{-\lambda x}\)
2. \(\int u v' = [uv] - \int v u'\)
3. \(E(X) = [-xe^{-\lambda x}]_{0}^{\infty} - \int_{0}^{\infty} -e^{-\lambda x} dx\)
4. 当 \(x \to \infty\) 时,\(-xe^{-\lambda x} \to 0\)。在 \(x=0\) 时,值为 \(0\)。
5. \(E(X) = 0 + [\frac{-1}{\lambda} e^{-\lambda x}]_{0}^{\infty}\)
6. \(E(X) = 0 - (0 - \frac{1}{\lambda}) = \frac{1}{\lambda}\)。
重点总结:证明平均值时,你需要对 \(x f(x)\) 进行积分。证明方差时,先通过对 \(x^2 f(x)\) 积分求出 \(E(X^2)\),然后利用 \(\text{Var}(X) = E(X^2) - [E(X)]^2\) 进行计算。
6. 常见错误避坑指南
- 单位混淆:请务必确保 \(\lambda\) 和你的时间 \(x\) 使用相同的单位(例如:都用小时或都用分钟)。
- 弄错 \(\lambda\):记住 \(\lambda\) 是速率(例如:每小时 5 次),而平均值是 \(1/\lambda\)(0.2 小时)。如果题目说“平均时间是 10”,那么 \(\lambda = 1/10\)。
- 忘记 \(1 - \dots\):对于 \(P(X < x)\),公式是 \(1 - e^{-\lambda x}\)。对于 \(P(X > x)\),公式只是 \(e^{-\lambda x}\)。学生经常会搞反!
总结表
参数: \(\lambda\)(速率)
PDF \(f(x)\): \(\lambda e^{-\lambda x}\)
CDF \(F(x)\): \(1 - e^{-\lambda x}\)
平均值: \(1/\lambda\)
方差: \(1/\lambda^2\)
应用情境: 随机且独立的事件之间的时间/距离。