概率生成函數 (PGFs):學習筆記 (9231 Further Probability & Statistics)
你好!這一章將為你介紹進階統計學中最優雅的工具之一:概率生成函數 (Probability Generating Function, PGF)。別擔心,聽起來雖然複雜,但它本質上是一種巧妙的方法,將離散隨機變量所有的概率信息「打包」成一個函數。一旦打包完成,我們就可以運用微積分(微分!)的強大工具,輕鬆地求出均值與方差。是不是很酷?
本單元對於 Paper 4 至關重要,且內容完全集中於離散隨機變量。
1. 理解 PGF 的概念與定義
1.1 什麼是 PGF?
PGF 通常記作 \(G_X(t)\),是一個代數函數。它利用虛擬變量 \(t\) 的冪次來儲存離散隨機變量 \(X\) 的概率分佈。
你可以把它想像成一個文件櫃:索引編號(\(t\) 的指數)告訴你正在查看哪一個結果,而文件內容(\(t\) 的係數)則告訴你該結果發生的概率。
1.2 正式定義
對於一個離散隨機變量 \(X\),其取值為 \(x_i\),且概率為 \(P(X=x_i)\),則 PGF 定義為 \(t^X\) 的期望值:
定義: $$G_X(t) = E(t^X) = \sum_{x} P(X=x) t^x$$
由於所有概率之和必須為 1,因此當我們令 \(t=1\) 時,結果必定為 1:
$$G_X(1) = \sum P(X=x) (1)^x = \sum P(X=x) = 1$$
記憶小撇步:隨時檢查 G(1) 是否等於 1。這是驗證你的 PGF 公式是否正確的絕佳方法!
1.3 提取概率
PGF 的美妙之處在於,如果你已知函數 \(G_X(t)\),只需觀察對應 \(t\) 冪次的係數,就能找到任何特定結果的概率。
- \(P(X=0)\) 是 \(t^0\) 的係數。
- \(P(X=1)\) 是 \(t^1\) 的係數。
- \(P(X=k)\) 是 \(t^k\) 的係數。
如果 PGF 是一個簡單的多項式,你可以直接讀出概率;如果它是一個較複雜的函數(例如涉及 \(e\) 或分數),你可能需要使用麥克勞林級數展開 (Maclaurin series expansion)(這是 Further Pure Mathematics 的概念)來求出係數。
$$P(X=k) = \frac{G_X^{(k)}(0)}{k!}$$ (即第 \(k\) 階導數在 \(t=0\) 時的值,除以 \(k!\))
重點總結: PGF \(G_X(t)\) 是一系列項的和,其中 \(t\) 的指數是隨機變量的取值,而係數則是該取值的概率。恆有 \(G_X(1)=1\)。
2. 構建常見分佈的 PGF
你必須熟練掌握並能構建常見離散分佈的 PGF。
2.1 離散均勻分佈 (Discrete Uniform Distribution, D(n))
如果 \(X\) 是擲公平骰子的結果(\(X=1, 2, 3, 4, 5, 6\)),則對於所有結果,\(P(X=x) = 1/6\)。
$$G_X(t) = \sum_{x=1}^{6} P(X=x) t^x = \frac{1}{6}t^1 + \frac{1}{6}t^2 + ... + \frac{1}{6}t^6$$ $$G_X(t) = \frac{1}{n} \sum_{x=1}^{n} t^x \quad \text{或一般形式} \quad G_X(t) = \frac{t(1-t^n)}{n(1-t)}$$ (註:這是一個等比級數求和!)
2.2 二項分佈 (Binomial Distribution, \(X \sim B(n, p)\))
使用定義 \(G_X(t) = \sum P(X=x) t^x\)。回想 \(P(X=x) = \binom{n}{x} p^x q^{n-x}\),其中 \(q=1-p\)。
$$G_X(t) = \sum_{x=0}^{n} \left[ \binom{n}{x} q^{n-x} p^x \right] t^x$$ $$G_X(t) = \sum_{x=0}^{n} \binom{n}{x} q^{n-x} (pt)^x$$
根據二項式定理 (Binomial Theorem),該和可以簡化為:
$$G_X(t) = (q + pt)^n$$
2.3 幾何分佈 (Geometric Distribution, \(X \sim Geo(p)\))
幾何分佈(指在第一次成功前的失敗次數,或直到第一次成功所需的試驗次數,取決於你的基礎 A Level 課程定義——我們在此使用 \(P(X=x) = p q^{x-1}\) 對於 \(x=1, 2, 3...\) 的定義)
$$G_X(t) = \sum_{x=1}^{\infty} P(X=x) t^x = \sum_{x=1}^{\infty} p q^{x-1} t^x$$
提取 \(pt\):
$$G_X(t) = pt \sum_{x=1}^{\infty} q^{x-1} t^{x-1} = pt \sum_{k=0}^{\infty} (qt)^k$$
由於這是一個公比為 \(qt\) 的無窮等比級數,假設 \(|qt| < 1\),其和為 \(\frac{1}{1-qt}\)。
$$G_X(t) = \frac{pt}{1 - qt}$$
2.4 卜瓦松分佈 (Poisson Distribution, \(X \sim Po(\lambda)\))
回想 \(P(X=x) = \frac{e^{-\lambda} \lambda^x}{x!}\),其中 \(x=0, 1, 2...\)
$$G_X(t) = \sum_{x=0}^{\infty} \left[ \frac{e^{-\lambda} \lambda^x}{x!} \right] t^x$$
提取 \(e^{-\lambda}\) 並重排:
$$G_X(t) = e^{-\lambda} \sum_{x=0}^{\infty} \frac{(\lambda t)^x}{x!}$$
括號內的和即為 \(e^{\lambda t}\) 的麥克勞林級數展開式。
$$G_X(t) = e^{-\lambda} e^{\lambda t} = e^{\lambda t - \lambda}$$
$$G_X(t) = e^{\lambda(t-1)}$$
標準 PGF 總結(必須熟記或能快速推導)
- 二項分佈: \(G_X(t) = (q + pt)^n\)
- 卜瓦松分佈: \(G_X(t) = e^{\lambda(t-1)}\)
- 幾何分佈: \(G_X(t) = \frac{pt}{1 - qt}\)
3. 使用 PGF 求均值與方差
這才是重頭戲!我們利用微分(微積分)來計算均值與方差,這使得原本複雜的期望值計算變得非常簡單。
關鍵性質在於將 \(G_X(t)\) 的一階導數和二階導數在 \(t=1\) 處求值。
3.1 均值(期望值)
均值 \(E(X)\) 可以通過求 PGF 的一階導數並代入 \(t=1\) 得到:
$$E(X) = G'_X(1)$$
你知道嗎?這是因為當你對 PGF 關於 \(t\) 微分時,\(t^{x-1}\) 的係數變成了 \(x P(X=x)\)。隨後令 \(t=1\),你便得到 \(\sum x P(X=x)\),這正是均值 \(E(X)\) 的定義。
3.2 方差 (\(Var(X)\))
方差計算稍微複雜一些,需要二階導數。MF19 公式冊中提供的公式為:
$$Var(X) = G''_X(1) + G'_X(1) - \{G'_X(1)\}^2$$
這個公式看起來有點嚇人,但請注意: $$E(X) = G'_X(1)$$ 且 $$E[X(X-1)] = G''_X(1)$$ 所以,方差公式其實就是熟悉的恆等式 \(Var(X) = E(X^2) - [E(X)]^2\) 使用 PGF 的重寫版本。
分步計算流程:
- 求一階導數 \(G'_X(t)\)。
- 代入 \(t=1\) 計算均值 \(E(X) = G'_X(1)\)。
- 求二階導數 \(G''_X(t)\)。(記得若有必要需使用乘法定則!)
- 計算 \(G''_X(1)\)。
- 將 \(G''_X(1)\) 和 \(G'_X(1)\) 代入方差公式:\(Var(X) = G''_X(1) + E(X) - [E(X)]^2\)。
常見錯誤:請務必在微分「之後」才代入 \(t=1\),千萬不要在微分前代入!如果你先計算了 \(G'_X(1)\) 再對它微分,結果只會得到零。
範例:求 \(X \sim Po(\lambda)\) 的均值與方差
已知 \(G_X(t) = e^{\lambda(t-1)}\)。
1. 一階導數: $$G'_X(t) = \lambda e^{\lambda(t-1)}$$
2. 均值: 代入 \(t=1\)。 $$E(X) = G'_X(1) = \lambda e^{\lambda(1-1)} = \lambda e^0 = \lambda$$ (符合卜瓦松分佈的已知結果!)
3. 二階導數: 再對 \(G'_X(t)\) 微分一次。 $$G''_X(t) = \frac{d}{dt} \left[ \lambda e^{\lambda(t-1)} \right] = \lambda (\lambda e^{\lambda(t-1)}) = \lambda^2 e^{\lambda(t-1)}$$
4. 計算 \(G''_X(1)\): $$G''_X(1) = \lambda^2 e^{\lambda(1-1)} = \lambda^2$$
5. 方差: $$Var(X) = G''_X(1) + G'_X(1) - \{G'_X(1)\}^2$$ $$Var(X) = \lambda^2 + \lambda - (\lambda)^2$$ $$Var(X) = \lambda$$ (同樣符合卜瓦松分佈的已知結果!證明了 PGF 方法非常有效。)
重點總結: PGF 允許我們通過簡單的微分並在 \(t=1\) 處求值來計算 \(E(X)\) 和 \(Var(X)\)。請務必精確使用 MF19 公式冊中提供的公式。
4. 獨立隨機變量之和
這可以說是 PGF 最強大的應用——它讓我們能輕鬆地合併獨立隨機變量。
4.1 乘法法則
如果 \(X\) 與 \(Y\) 是兩個獨立的離散隨機變量,且 \(Z = X + Y\),那麼和 \(Z\) 的 PGF 等於個別 PGF 的乘積:
$$G_Z(t) = G_X(t) \times G_Y(t)$$
這個結果對於任意數量的獨立隨機變量之和皆成立。
類比:如果 PGF 是「概率食譜」,那麼將它們相乘就像是將兩份食譜混合在一起,從而得到合併後結果的食譜。
4.2 應用:常見分佈的和
這一性質對於證明同類分佈變量之和仍服從該類分佈(僅參數更新)特別有用。
範例 1:獨立二項分佈變量之和
設 \(X_1 \sim B(n_1, p)\) 與 \(X_2 \sim B(n_2, p)\),且 \(Z = X_1 + X_2\)。(註:它們必須具有相同的概率 \(p\))。
- \(G_{X_1}(t) = (q + pt)^{n_1}\)
- \(G_{X_2}(t) = (q + pt)^{n_2}\)
和的 PGF 為: $$G_Z(t) = G_{X_1}(t) G_{X_2}(t) = (q + pt)^{n_1} (q + pt)^{n_2} = (q + pt)^{n_1 + n_2}$$ 由於 \(G_Z(t)\) 具有二項分佈 PGF 的形式,我們得出 \(Z \sim B(n_1 + n_2, p)\)。
範例 2:獨立卜瓦松分佈變量之和
設 \(X_1 \sim Po(\lambda_1)\) 與 \(X_2 \sim Po(\lambda_2)\),且 \(Z = X_1 + X_2\)。
- \(G_{X_1}(t) = e^{\lambda_1(t-1)}\)
- \(G_{X_2}(t) = e^{\lambda_2(t-1)}\)
和的 PGF 為: $$G_Z(t) = G_{X_1}(t) G_{X_2}(t) = e^{\lambda_1(t-1)} e^{\lambda_2(t-1)}$$ $$G_Z(t) = e^{(\lambda_1 + \lambda_2)(t-1)}$$ 由於 \(G_Z(t)\) 具有卜瓦松分佈 PGF 的形式,我們得出 \(Z \sim Po(\lambda_1 + \lambda_2)\)。
快速回顧:PGF 工具箱
- 求概率: \(t^k\) 的係數即為 \(P(X=k)\)。
- 求均值: \(E(X) = G'_X(1)\)。
- 求方差: \(Var(X) = G''_X(1) + G'_X(1) - \{G'_X(1)\}^2\)。
- 合併獨立變量: 相乘 PGF:\(G_{X+Y}(t) = G_X(t) G_Y(t)\)。