概率生成函数 (pgf) 简介

欢迎来到统计学中最巧妙的工具之一!概率生成函数 (Probability Generating Function, pgf) 听起来可能有点吓人,但你可以把它想像成一个“数学存储箱”。我们不需要随身携带一张冗长的概率表,而是将所有数据打包进一个代数表达式中。

在本章中,你将学习如何将概率分布转化为函数、如何利用该函数求出平均值 (mean)方差 (variance),以及如何轻松地处理不同随机变量的组合。如果你喜欢代数和一点微积分,你会发现 pgf 能让复杂的统计问题变得简单得多!

1. 什么是 PGF?

对于一个取非负整数值(0, 1, 2...)的离散随机变量 \(X\),其 pgf 定义为:

\( G_X(t) = E(t^X) = \sum P(X=x)t^x \)

用白话文解释:要建立一个 pgf,你需要将每个可能的结果 \(x\) 作为虚拟变量 \(t\) 的指数 (power),并乘以它对应的概率 (probability)

一个简单的例子

想像你有一个奇怪的 3 面骰子,其中:
\(P(X=0) = 0.2\)
\(P(X=1) = 0.5\)
\(P(X=2) = 0.3\)

该骰子的 pgf 为:
\(G_X(t) = 0.2t^0 + 0.5t^1 + 0.3t^2\)
化简后得到:\(G_X(t) = 0.2 + 0.5t + 0.3t^2\)

快速复习:
系数 (coefficient)(即前面的数字)就是概率
\(t\) 的指数就是该随机变量的数值

你知道吗?
变量 \(t\) 在现实世界中并没有实际意义。它仅仅作为一个占位符,帮助我们根据指数将概率进行分类整理。

2. PGF 的重要特性

在我们深入探讨之前,有两个关于 pgf 的“黄金法则”请务必记住:

1. 概率总和: 如果将 \(t = 1\) 代入任何合法的 pgf 中,结果必然为 1。
\(G_X(1) = \sum P(X=x)(1)^x = \sum P(X=x) = 1\)。

2. 寻找概率: 要找到 \(P(X=k)\),只需寻找 \(t^k\) 的系数。例如在上述骰子的例子中,\(t^2\) 的系数是 0.3,所以 \(P(X=2) = 0.3\)。

核心要点: pgf 只是表示概率分布表的一种不同方式。\(G_X(1)\) 永远等于 1!

3. 使用 PGF 寻找平均值与方差

这是 pgf 展现其强大威力的地方。我们可以利用微分来求出期望值 (Expected Value, 即平均值)方差 (Variance)

寻找平均值 (\(\mu\))

要计算平均值,我们只需对 pgf 求一阶导数,然后代入 \(t = 1\):
\(\mu = E(X) = G_X'(1)\)

寻找方差 (\(\sigma^2\))

计算方差则需要用到二阶导数。公式为:
\(\sigma^2 = G_X''(1) + G_X'(1) - [G_X'(1)]^2\)
或者,用 \(\mu\) 表示:
\(\sigma^2 = G_X''(1) + \mu - \mu^2\)

逐步流程:
1. 对 \(G_X(t)\) 求导得到 \(G_X'(t)\)。
2. 再次求导得到 \(G_X''(t)\)。
3. 将 \(t=1\) 分别代入上述两式。
4. 将结果代入方差公式中。

如果一开始觉得困难也不用担心! 只要记住 \(G_X'(1)\) 就是平均值,而方差公式只是一个额外的小步骤。多练习几次推导,自然就能熟能生巧。

4. 常见分布的 PGF

课程大纲要求你了解(并能够推导)常见分布的 pgf。以下是便捷的总结:

伯努利分布 (Bernoulli Distribution):\(X \sim B(1, p)\)
结果为 0(概率为 \(q\))和 1(概率为 \(p\))。
\(G_X(t) = q + pt\)

二项分布 (Binomial Distribution):\(X \sim B(n, p)\)
这本质上是 \(n\) 个独立的伯努利试验相加。
\(G_X(t) = (q + pt)^n\)

几何分布 (Geometric Distribution):\(X \sim Geo(p)\)
这描述了直到第一次成功所需的试验次数。
\(G_X(t) = \frac{pt}{1 - qt}\)

离散均匀分布 (Discrete Uniform Distribution):
当 \(X\) 取值 \(1, 2, ..., n\) 且概率皆为 \(1/n\) 时。
\(G_X(t) = \frac{1}{n}(t + t^2 + ... + t^n) = \frac{t(1 - t^n)}{n(1 - t)}\)

常见错误提醒:
在几何分布中,请记住 \(q = 1 - p\)。务必小心不要在分数中混淆它们!

5. 独立随机变量之和

统计学中最好的“技巧”之一就是 pgf 处理加法的方式。如果你有两个独立的随机变量 \(X\) 和 \(Y\),且想要求它们之和 \(Z = X + Y\) 的 pgf,你只需要将它们的 pgf相乘即可!

\(G_{X+Y}(t) = G_X(t) \times G_Y(t)\)

类比:
想像这就像组合两个播放列表。如果播放列表 \(X\) 在一个盒子里,播放列表 \(Y\) 在另一个盒子里,将这两个盒子相乘,就得到了一个包含所有歌曲组合(结果)的巨大播放列表。

例子:
如果 \(X \sim B(n, p)\) 且 \(Y \sim B(m, p)\),那么:
\(G_{X+Y}(t) = (q + pt)^n \times (q + pt)^m = (q + pt)^{n+m}\)。
这证明了两个二项分布变量之和仍然是一个二项分布,且试验次数为 \(n+m\)!

核心要点: 独立变量相加 = 它们的 pgf 相乘。这比建立巨大的概率表要简单得多!

最终复习清单

在进行练习题之前,请确保你能:
• 从概率表中建立 pgf
• 通过计算 \(G_X'(1)\) 找到平均值
• 使用 \(G_X''(1) + \mu - \mu^2\) 找到方差
• 识别并推导伯努利分布、二项分布和几何分布的 pgf。
• 通过函数相乘来组合独立变量

加油,你一定可以的! PGF 只是利用代数为你完成统计学中繁重工作的一种巧妙方法。