概率生成函數 (pgf) 簡介

歡迎來到統計學中最巧妙的工具之一!概率生成函數 (Probability Generating Function, pgf) 聽起來可能有點嚇人,但你可以把它想像成一個「數學儲存箱」。我們不需要隨身攜帶一張冗長的概率表,而是將所有數據打包進一個代數表達式中。

在本章中,你將學習如何將概率分佈轉化為函數、如何利用該函數求出平均值 (mean)方差 (variance),以及如何輕鬆地處理不同隨機變量的組合。如果你喜歡代數和一點微積分,你會發現 pgf 能讓複雜的統計問題變得簡單得多!

1. 什麼是 PGF?

對於一個取非負整數值(0, 1, 2...)的離散隨機變量 \(X\),其 pgf 定義為:

\( G_X(t) = E(t^X) = \sum P(X=x)t^x \)

用白話文解釋:要建立一個 pgf,你需要將每個可能的結果 \(x\) 作為虛擬變量 \(t\) 的指數 (power),並乘以它對應的概率 (probability)

一個簡單的例子

想像你有一個奇怪的 3 面骰子,其中:
\(P(X=0) = 0.2\)
\(P(X=1) = 0.5\)
\(P(X=2) = 0.3\)

該骰子的 pgf 為:
\(G_X(t) = 0.2t^0 + 0.5t^1 + 0.3t^2\)
化簡後得到:\(G_X(t) = 0.2 + 0.5t + 0.3t^2\)

快速複習:
係數 (coefficient)(即前面的數字)就是概率
\(t\) 的指數就是該隨機變量的數值

你知道嗎?
變量 \(t\) 在現實世界中並沒有實際意義。它僅僅作為一個佔位符,幫助我們根據指數將概率進行分類整理。

2. PGF 的重要特性

在我們深入探討之前,有兩個關於 pgf 的「黃金法則」請務必記住:

1. 概率總和: 如果將 \(t = 1\) 代入任何合法的 pgf 中,結果必然為 1。
\(G_X(1) = \sum P(X=x)(1)^x = \sum P(X=x) = 1\)。

2. 尋找概率: 要找到 \(P(X=k)\),只需尋找 \(t^k\) 的係數。例如在上述骰子的例子中,\(t^2\) 的係數是 0.3,所以 \(P(X=2) = 0.3\)。

核心要點: pgf 只是表示概率分佈表的一種不同方式。\(G_X(1)\) 永遠等於 1!

3. 使用 PGF 尋找平均值與方差

這是 pgf 展現其強大威力的地方。我們可以利用微分來求出期望值 (Expected Value, 即平均值)方差 (Variance)

尋找平均值 (\(\mu\))

要計算平均值,我們只需對 pgf 求一階導數,然後代入 \(t = 1\):
\(\mu = E(X) = G_X'(1)\)

尋找方差 (\(\sigma^2\))

計算方差則需要用到二階導數。公式為:
\(\sigma^2 = G_X''(1) + G_X'(1) - [G_X'(1)]^2\)
或者,用 \(\mu\) 表示:
\(\sigma^2 = G_X''(1) + \mu - \mu^2\)

逐步流程:
1. 對 \(G_X(t)\) 求導得到 \(G_X'(t)\)。
2. 再次求導得到 \(G_X''(t)\)。
3. 將 \(t=1\) 分別代入上述兩式。
4. 將結果代入方差公式中。

如果一開始覺得困難也不用擔心! 只要記住 \(G_X'(1)\) 就是平均值,而方差公式只是一個額外的小步驟。多練習幾次推導,自然就能熟能生巧。

4. 常見分佈的 PGF

課程大綱要求你了解(並能夠推導)常見分佈的 pgf。以下是便捷的總結:

伯努利分佈 (Bernoulli Distribution):\(X \sim B(1, p)\)
結果為 0(概率為 \(q\))和 1(概率為 \(p\))。
\(G_X(t) = q + pt\)

二項分佈 (Binomial Distribution):\(X \sim B(n, p)\)
這本質上是 \(n\) 個獨立的伯努利試驗相加。
\(G_X(t) = (q + pt)^n\)

幾何分佈 (Geometric Distribution):\(X \sim Geo(p)\)
這描述了直到第一次成功所需的試驗次數。
\(G_X(t) = \frac{pt}{1 - qt}\)

離散均勻分佈 (Discrete Uniform Distribution):
當 \(X\) 取值 \(1, 2, ..., n\) 且概率皆為 \(1/n\) 時。
\(G_X(t) = \frac{1}{n}(t + t^2 + ... + t^n) = \frac{t(1 - t^n)}{n(1 - t)}\)

常見錯誤提醒:
在幾何分佈中,請記住 \(q = 1 - p\)。務必小心不要在分數中混淆它們!

5. 獨立隨機變量之和

統計學中最好的「技巧」之一就是 pgf 處理加法的方式。如果你有兩個獨立的隨機變量 \(X\) 和 \(Y\),且想要求它們之和 \(Z = X + Y\) 的 pgf,你只需要將它們的 pgf相乘即可!

\(G_{X+Y}(t) = G_X(t) \times G_Y(t)\)

類比:
想像這就像組合兩個播放列表。如果播放列表 \(X\) 在一個盒子裡,播放列表 \(Y\) 在另一個盒子裡,將這兩個盒子相乘,就得到了一個包含所有歌曲組合(結果)的巨大播放列表。

例子:
如果 \(X \sim B(n, p)\) 且 \(Y \sim B(m, p)\),那麼:
\(G_{X+Y}(t) = (q + pt)^n \times (q + pt)^m = (q + pt)^{n+m}\)。
這證明了兩個二項分佈變量之和仍然是一個二項分佈,且試驗次數為 \(n+m\)!

核心要點: 獨立變量相加 = 它們的 pgf 相乘。這比建立巨大的概率表要簡單得多!

最終複習清單

在進行練習題之前,請確保你能:
• 從概率表中建立 pgf
• 通過計算 \(G_X'(1)\) 找到平均值
• 使用 \(G_X''(1) + \mu - \mu^2\) 找到方差
• 識別並推導伯努利分佈、二項分佈和幾何分佈的 pgf。
• 通過函數相乘來組合獨立變量

加油,你一定可以的! PGF 只是利用代數為你完成統計學中繁重工作的一種巧妙方法。