Probability generating functions

欢迎来到概率生成函数 (Probability Generating Functions)！

在本章中，我们要学习统计学中一个非常巧妙的「捷径」。概率生成函数 (PGF) 是一种将整个概率分布「打包」成单一代数表达式的方法。试想一下，原本有一堆杂乱无章的概率列表，现在你可以把它们折叠起来，放入一个简单的多项式中——这正是 PGF 的作用！

学完这些笔记后，你将能够建立这些函数，利用它们求出平均值 (mean) 和方差 (variance)，甚至能推导出将不同随机变量相加时会发生什么事。如果起初觉得概念有些抽象，别担心；一旦你掌握了其中的规律，它就和普通的代数运算没什么两样。

1. 什么是 PGF？

对于一个取非负整数值 (\(0, 1, 2, ...\)) 的离散随机变量 \(X\)，其概率生成函数以 \(G_X(t)\) 表示，定义如下：

\(G_X(t) = E(t^X) = \sum P(X=x)t^x\)

深入拆解：

你可以把变量 \(t\) 看作一个「占位符」。\(t\) 的次方代表 \(X\) 的值，而系数（\(t\) 前面的数字）则代表该数值发生的概率。

例子： 若一个随机变量 \(X\) 的概率为 \(P(X=0)=0.2\)，\(P(X=1)=0.5\)，以及 \(P(X=2)=0.3\)，则该 PGF 为：
\(G_X(t) = 0.2t^0 + 0.5t^1 + 0.3t^2\)
\(G_X(t) = 0.2 + 0.5t + 0.3t^2\)

你知道吗？ 「100% 规则」：由于所有概率之和必须等于 1，如果你令 \(t = 1\)，PGF 的值永远会等于 1。所以，\(G_X(1) = 1\)。这是一个检查答案的好方法！

重点总结： PGF 就是一个多项式，其系数正是该分布的概率。

2. 常见分布的 PGF

你不必每次都从零开始构建 PGF。Edexcel 课程大纲要求你掌握（并能推导）最常见分布的 PGF。以下是你的「作弊单 (Cheat Sheet)」：

二项分布 (Binomial Distribution)： \(X \sim B(n, p)\)

\(G_X(t) = (q + pt)^n\)
（其中 \(q = 1 - p\)）

泊松分布 (Poisson Distribution)： \(X \sim Po(\lambda)\)

\(G_X(t) = e^{\lambda(t-1)}\)

几何分布 (Geometric Distribution)： \(X \sim Geo(p)\)

\(G_X(t) = \frac{pt}{1 - qt}\)
注意：这是指 \(X\) 从 1 开始的版本。

负二项分布 (Negative Binomial Distribution)： \(X \sim Negative B(r, p)\)

\(G_X(t) = (\frac{pt}{1 - qt})^r\)

记忆小撇步： 注意到负二项分布的 PGF 其实就是几何分布的 PGF 的 \(r\) 次方。这很有道理，因为一个负二项分布变量本质上就是 \(r\) 个独立几何分布变量的和！

重点总结： 把这四种形式背下来！它们是本章几乎所有考试题目的基础。

3. 使用 PGF 求平均值与方差

这是 PGF 真正展现威力的地方。与其使用冗长的 \(\sum xP(x)\) 公式，我们可以使用微积分来处理。

求平均值 (\(E(X)\))

要找到期望值，我们只需求 PGF 的一阶导数，然后代入 \(t = 1\)。

1. 求 \(G'_X(t)\)
2. 令 \(t = 1\)
3. \(E(X) = G'_X(1)\)

求方差 (\(Var(X)\))

求方差需要进行两步导数运算。我们首先要求出 \(t=1\) 时的二阶导数，这会给我们一个称为「阶乘动差 (factorial moment)」的结果。要得到最终的方差，请使用此特定公式：

1. 求 \(G''_X(t)\) 并令 \(t = 1\)
2. \(Var(X) = G''_X(1) + G'_X(1) - [G'_X(1)]^2\)

如果起初觉得棘手，别担心！ 许多学生会忘记加上 \(G'_X(1)\) 或者忘记减去平均值的平方。只需记住这个节奏：「二阶导数，加上平均值，再减去平均值的平方。」

快速复习盒：
- \(E(X) = G'(1)\)
- \(Var(X) = G''(1) + E(X) - [E(X)]^2\)

4. 独立随机变量的和

如果你有两个分开、独立的事件，而你想知道它们的总和的概率分布该怎么办？PGF 让这件事变得异常简单。

如果 \(X\) 和 \(Y\) 是独立的随机变量，且你定义了一个新变量 \(Z = X + Y\)，那么 \(Z\) 的 PGF 只需将个别的 PGF相乘即可：

\(G_{X+Y}(t) = G_X(t) \times G_Y(t)\)

类比：

想象 \(G_X(t)\) 是乐高小车的蓝图，而 \(G_Y(t)\) 是乐高拖车的蓝图。如果你想要车子加拖车（\(X+Y\)）的蓝图，你只需把两张蓝图拼在一起即可！

例子： 若 \(X \sim Po(\lambda)\) 和 \(Y \sim Po(\mu)\) 是独立的：
\(G_X(t) = e^{\lambda(t-1)}\)
\(G_Y(t) = e^{\mu(t-1)}\)
\(G_{X+Y}(t) = e^{\lambda(t-1)} \times e^{\mu(t-1)} = e^{(\lambda+\mu)(t-1)}\)
这证明了两个泊松变量的和依然是一个泊松变量，且其新的平均值为 \(\lambda + \mu\)！

重点总结： 在「现实世界」中将独立变量相加，等于在「数学世界」中将它们的 PGF 相乘。

5. 避免常见错误

即使是优秀的学生也可能在这些地方失足。请留意：

忘记令 \(t=1\)： 微分后，你的答案应该是一个数字。如果你的平均值或方差算式中还残留着 \(t\)，代表你漏了最后一步！
链式法则 (Chain Rule) 错误： 当微分像 \((q + pt)^n\) 这样的式子时，记得要乘以括号内部的导数（即 \(p\)）。
搞混 p 和 q： 永远记住 \(p\) 是成功的概率，\(q\) 是失败的概率 (\(1-p\))。检查题目要求的是哪一个！
几何分布的起始点： 如果题目对几何分布的定义不同（例如从 \(X=0\) 而非 \(X=1\) 开始），请务必小心。上述标准 PGF 是针对 \(X \in \{1, 2, 3, ...\}\) 的。

总结检核清单

在进入练习题之前，请确保你能做到以下几点：

从概率表定义一个 PGF。
背诵二项、泊松、几何及负二项分布的 PGF。
对 PGF 微分以求出平均值 (\(G'(1)\))。
应用方差公式 (\(G''(1) + G'(1) - [G'(1)]^2\))。
将 PGF 相乘以求出独立变量之和的分布。

你一定没问题的！ PGF 是一个强大的工具，能将困难的概率问题转化为简单的代数运算。继续练习微分，剩下的自然会迎刃而解。

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。