欢迎来到概率生成函数 (Probability Generating Functions)!
在本章中,我们要学习统计学中一个非常巧妙的「捷径」。概率生成函数 (PGF) 是一种将整个概率分布「打包」成单一代数表达式的方法。试想一下,原本有一堆杂乱无章的概率列表,现在你可以把它们折叠起来,放入一个简单的多项式中——这正是 PGF 的作用!
学完这些笔记后,你将能够建立这些函数,利用它们求出平均值 (mean) 和方差 (variance),甚至能推导出将不同随机变量相加时会发生什么事。如果起初觉得概念有些抽象,别担心;一旦你掌握了其中的规律,它就和普通的代数运算没什么两样。
1. 什么是 PGF?
对于一个取非负整数值 (\(0, 1, 2, ...\)) 的离散随机变量 \(X\),其概率生成函数以 \(G_X(t)\) 表示,定义如下:
\(G_X(t) = E(t^X) = \sum P(X=x)t^x\)
深入拆解:
你可以把变量 \(t\) 看作一个「占位符」。\(t\) 的次方代表 \(X\) 的值,而系数(\(t\) 前面的数字)则代表该数值发生的概率。
例子: 若一个随机变量 \(X\) 的概率为 \(P(X=0)=0.2\),\(P(X=1)=0.5\),以及 \(P(X=2)=0.3\),则该 PGF 为:
\(G_X(t) = 0.2t^0 + 0.5t^1 + 0.3t^2\)
\(G_X(t) = 0.2 + 0.5t + 0.3t^2\)
你知道吗? 「100% 规则」:由于所有概率之和必须等于 1,如果你令 \(t = 1\),PGF 的值永远会等于 1。所以,\(G_X(1) = 1\)。这是一个检查答案的好方法!
重点总结: PGF 就是一个多项式,其系数正是该分布的概率。
2. 常见分布的 PGF
你不必每次都从零开始构建 PGF。Edexcel 课程大纲要求你掌握(并能推导)最常见分布的 PGF。以下是你的「作弊单 (Cheat Sheet)」:
二项分布 (Binomial Distribution): \(X \sim B(n, p)\)
\(G_X(t) = (q + pt)^n\)
(其中 \(q = 1 - p\))
泊松分布 (Poisson Distribution): \(X \sim Po(\lambda)\)
\(G_X(t) = e^{\lambda(t-1)}\)
几何分布 (Geometric Distribution): \(X \sim Geo(p)\)
\(G_X(t) = \frac{pt}{1 - qt}\)
注意:这是指 \(X\) 从 1 开始的版本。
负二项分布 (Negative Binomial Distribution): \(X \sim Negative B(r, p)\)
\(G_X(t) = (\frac{pt}{1 - qt})^r\)
记忆小撇步: 注意到负二项分布的 PGF 其实就是几何分布的 PGF 的 \(r\) 次方。这很有道理,因为一个负二项分布变量本质上就是 \(r\) 个独立几何分布变量的和!
重点总结: 把这四种形式背下来!它们是本章几乎所有考试题目的基础。
3. 使用 PGF 求平均值与方差
这是 PGF 真正展现威力的地方。与其使用冗长的 \(\sum xP(x)\) 公式,我们可以使用微积分来处理。
求平均值 (\(E(X)\))
要找到期望值,我们只需求 PGF 的一阶导数,然后代入 \(t = 1\)。
1. 求 \(G'_X(t)\)
2. 令 \(t = 1\)
3. \(E(X) = G'_X(1)\)
求方差 (\(Var(X)\))
求方差需要进行两步导数运算。我们首先要求出 \(t=1\) 时的二阶导数,这会给我们一个称为「阶乘动差 (factorial moment)」的结果。要得到最终的方差,请使用此特定公式:
1. 求 \(G''_X(t)\) 并令 \(t = 1\)
2. \(Var(X) = G''_X(1) + G'_X(1) - [G'_X(1)]^2\)
如果起初觉得棘手,别担心! 许多学生会忘记加上 \(G'_X(1)\) 或者忘记减去平均值的平方。只需记住这个节奏:「二阶导数,加上平均值,再减去平均值的平方。」
快速复习盒:
- \(E(X) = G'(1)\)
- \(Var(X) = G''(1) + E(X) - [E(X)]^2\)
4. 独立随机变量的和
如果你有两个分开、独立的事件,而你想知道它们的总和的概率分布该怎么办?PGF 让这件事变得异常简单。
如果 \(X\) 和 \(Y\) 是独立的随机变量,且你定义了一个新变量 \(Z = X + Y\),那么 \(Z\) 的 PGF 只需将个别的 PGF相乘即可:
\(G_{X+Y}(t) = G_X(t) \times G_Y(t)\)
类比:
想象 \(G_X(t)\) 是乐高小车的蓝图,而 \(G_Y(t)\) 是乐高拖车的蓝图。如果你想要车子加拖车(\(X+Y\))的蓝图,你只需把两张蓝图拼在一起即可!
例子: 若 \(X \sim Po(\lambda)\) 和 \(Y \sim Po(\mu)\) 是独立的:
\(G_X(t) = e^{\lambda(t-1)}\)
\(G_Y(t) = e^{\mu(t-1)}\)
\(G_{X+Y}(t) = e^{\lambda(t-1)} \times e^{\mu(t-1)} = e^{(\lambda+\mu)(t-1)}\)
这证明了两个泊松变量的和依然是一个泊松变量,且其新的平均值为 \(\lambda + \mu\)!
重点总结: 在「现实世界」中将独立变量相加,等于在「数学世界」中将它们的 PGF 相乘。
5. 避免常见错误
即使是优秀的学生也可能在这些地方失足。请留意:
- 忘记令 \(t=1\): 微分后,你的答案应该是一个数字。如果你的平均值或方差算式中还残留着 \(t\),代表你漏了最后一步!
- 链式法则 (Chain Rule) 错误: 当微分像 \((q + pt)^n\) 这样的式子时,记得要乘以括号内部的导数(即 \(p\))。
- 搞混 p 和 q: 永远记住 \(p\) 是成功的概率,\(q\) 是失败的概率 (\(1-p\))。检查题目要求的是哪一个!
- 几何分布的起始点: 如果题目对几何分布的定义不同(例如从 \(X=0\) 而非 \(X=1\) 开始),请务必小心。上述标准 PGF 是针对 \(X \in \{1, 2, 3, ...\}\) 的。
总结检核清单
在进入练习题之前,请确保你能做到以下几点:
- 从概率表定义一个 PGF。
- 背诵二项、泊松、几何及负二项分布的 PGF。
- 对 PGF 微分以求出平均值 (\(G'(1)\))。
- 应用方差公式 (\(G''(1) + G'(1) - [G'(1)]^2\))。
- 将 PGF 相乘以求出独立变量之和的分布。
你一定没问题的! PGF 是一个强大的工具,能将困难的概率问题转化为简单的代数运算。继续练习微分,剩下的自然会迎刃而解。