Exponential distribution

指数分布简介

你好！欢迎阅读关于指数分布（Exponential Distribution）的学习笔记。这是你选修单元 2 – 统计（Optional application 2 – statistics）中的核心课题。虽然它看起来因为包含 \(e\) 和积分符号而显得有些吓人，但实际上，它是你将会学到的分布中，逻辑最清晰且最贴近“现实世界”的分布之一。

简单来说，如果泊松分布（Poisson distribution）是用来计算在特定时间内发生了多少次事件，那么指数分布则是衡量这些事件之间相隔的时间。如果你曾经等待过巴士或回复消息，你其实就已经体验过指数分布了！

1. 何时使用指数分布

在查看公式之前，我们需要知道何时适合使用这个模型。指数分布用于对以恒定平均速率（\(\lambda\)）发生的独立事件之间的时间或距离进行建模。

关键条件 (SF1)：

要使用此分布，事件必须满足以下条件：

独立性：一个事件的发生不会改变下一个事件发生的概率。
随机性：事件是单独发生的，且不会在同一瞬间同时发生。
恒定速率：单位时间内的平均事件数量，即 \(\lambda\)（lambda），必须保持不变。

与泊松分布的联系 (SF4)：

这两个分布之间有一个绝妙的联系：如果事件发生的次数服从泊松分布，那么这些事件之间的时间间隔就服从指数分布。

例子：如果一家店平均每小时有 \(\lambda = 10\) 位顾客光临（泊松分布），那么顾客之间等待的时间就服从 \(\lambda\) 相同的指数分布。

快速回顾：记住，虽然泊松分布的变量 \(X\) 是离散的（你不可能有 2.5 位顾客），但指数分布的变量 \(X\) 是连续的（你可以等待 2.5 分钟）。

2. 概率密度函数 (PDF)

概率密度函数 (Probability Density Function)，即 \(f(x)\)，告诉我们曲线在任何一点 \(x\) 的“高度”。对于指数分布而言，曲线从高处开始，并随着 \(x\) 的增加逐渐衰减趋近于零。

公式 (SF1)：
对于随机变量 \(X \sim \text{Exp}(\lambda)\)：
\(f(x) = \lambda e^{-\lambda x}\)，其中 \(x \ge 0\)
\(f(x) = 0\)，其中 \(x < 0\)

图形看起来如何？
想象一个滑梯，从 y 轴上的 \(\lambda\) 开始向下弯曲，并无限趋近于 x 轴但永不接触。这显示了短时间的等待比长时间的等待发生的概率要高得多。

3. 累积概率分布函数 (CDF)

累积概率分布函数 (Cumulative Distribution Function)，即 \(F(x)\)，在解决考试题目时非常有用。它告诉你等待时间小于或等于某个数值 \(x\) 的概率。

公式 (SF1)：
\(F(x) = P(X \le x) = 1 - e^{-\lambda x}\)

计算“大于”概率 (SF2)：
题目经常要求计算等待时间超过某个数值的概率。这其实更简单：
\(P(X > x) = 1 - F(x) = e^{-\lambda x}\)

记忆小撇步：
记住 "L" 代表 Less than（小于）（包含 \(1 - e\)），"M" 代表 More than（大于）（只有 \(e\)）。
\(P(X > x) = e^{-\lambda x}\)（即分布的“尾部”）。

例题：
呼叫中心接到电话的间隔时间服从指数分布，平均每小时接到 4 通电话。求下一次电话在 15 分钟内打入的概率。
1. 找出 \(\lambda\)：每小时 4 通电话。
2. 将时间单位换算成与 \(\lambda\) 一致：15 分钟 = 0.25 小时。
3. 使用 \(F(x)\)：\(P(X \le 0.25) = 1 - e^{-4 \times 0.25} = 1 - e^{-1} \approx 0.632\)。

4. 平均值、方差与标准差

你需要掌握指数分布的这三个属性 (SF3)。它们出奇地简单！

平均值（期望值）：
\(E(X) = \mu = \frac{1}{\lambda}\)

类比：如果你每小时有 10 班巴士，你预期两班车之间的等待时间是 \(\frac{1}{10}\) 小时（6 分钟）。

方差：
\(\text{Var}(X) = \sigma^2 = \frac{1}{\lambda^2}\)

标准差：
\(\text{SD}(X) = \sigma = \sqrt{\frac{1}{\lambda^2}} = \frac{1}{\lambda}\)

你知道吗？ 在指数分布中，平均值和标准差是完全一样的！如果题目告诉你平均值是 5，你马上就能知道标准差也是 5。

5. 必要证明 (SF3)

在 AQA Further Maths 中，你需要能够证明平均值和方差。别担心，如果这看起来很复杂，其实它们只是运用了分部积分法（Integration by Parts）。

平均值 \(E(X)\) 的证明：

回想 \(E(X) = \int_{0}^{\infty} x f(x) dx\)。
\(E(X) = \int_{0}^{\infty} x (\lambda e^{-\lambda x}) dx\)
使用分部积分法，设 \(u = x\) 且 \(\frac{dv}{dx} = \lambda e^{-\lambda x}\)：
1. \(\frac{du}{dx} = 1\) 且 \(v = -e^{-\lambda x}\)
2. \(\int u v' = [uv] - \int v u'\)
3. \(E(X) = [-xe^{-\lambda x}]_{0}^{\infty} - \int_{0}^{\infty} -e^{-\lambda x} dx\)
4. 当 \(x \to \infty\) 时，\(-xe^{-\lambda x} \to 0\)。在 \(x=0\) 时，值为 \(0\)。
5. \(E(X) = 0 + [\frac{-1}{\lambda} e^{-\lambda x}]_{0}^{\infty}\)
6. \(E(X) = 0 - (0 - \frac{1}{\lambda}) = \frac{1}{\lambda}\)。

重点总结：证明平均值时，你需要对 \(x f(x)\) 进行积分。证明方差时，先通过对 \(x^2 f(x)\) 积分求出 \(E(X^2)\)，然后利用 \(\text{Var}(X) = E(X^2) - [E(X)]^2\) 进行计算。

6. 常见错误避坑指南

单位混淆：请务必确保 \(\lambda\) 和你的时间 \(x\) 使用相同的单位（例如：都用小时或都用分钟）。
弄错 \(\lambda\)：记住 \(\lambda\) 是速率（例如：每小时 5 次），而平均值是 \(1/\lambda\)（0.2 小时）。如果题目说“平均时间是 10”，那么 \(\lambda = 1/10\)。
忘记 \(1 - \dots\)：对于 \(P(X < x)\)，公式是 \(1 - e^{-\lambda x}\)。对于 \(P(X > x)\)，公式只是 \(e^{-\lambda x}\)。学生经常会搞反！

总结表

参数： \(\lambda\)（速率）
PDF \(f(x)\)： \(\lambda e^{-\lambda x}\)
CDF \(F(x)\)： \(1 - e^{-\lambda x}\)
平均值： \(1/\lambda\)
方差： \(1/\lambda^2\)
应用情境： 随机且独立的事件之间的时间/距离。

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。