Probability generating functions (pgf) - Further Mathematics (9665) - Oxford AQA International A-level

機率生成函數 (PGF)：FS1.4 學習筆記

哈囉，未來的數學家！歡迎來到統計學中最精巧且強大的工具之一：機率生成函數 (Probability Generating Function, PGF)。

別擔心，名字聽起來雖然深奧，但 PGF 本質上就是一個簡潔的數學「代碼」或「資料檔」。它將離散隨機變數機率分佈的*所有*資訊，全都濃縮在一個整齊的多項式（或冪級數）之中。

本章將帶你解開這個代碼，讓你無需進行複雜的求和或積分，就能輕鬆求出機率、期望值（平均數）和變異數。讓我們馬上開始吧！

1. 定義機率生成函數 (\(G_X(t)\))

什麼是 PGF？

對於離散隨機變數 \(X\)，其機率生成函數 \(G_X(t)\) 是一個包含虛擬變數 \(t\) 的期望值。

你可以把 \(t\) 想像成一個佔位符，我們利用它的次方來「儲存」對應每個可能結果的機率。

正式定義

若離散隨機變數 \(X\) 可取值 \(x_1, x_2, x_3, \dots\)，且對應機率為 \(p_1, p_2, p_3, \dots\)，則其 PGF 定義為：

\(G_X(t) = E(t^X) = \sum_{\text{all } x} t^x P(X=x)\)

簡單來說：你取出隨機變數 \(X\) 所有可能的取值 \(x\)，將 \(t\) 的該次方 (\(t^x\)) 乘以該值的機率 (\(P(X=x)\))，然後將它們全部加起來。

範例：擲骰子

設 \(X\) 為投擲一顆公平六面骰子的結果。\(X\) 的值可以是 1, 2, 3, 4, 5 或 6，每個值的機率皆為 \(1/6\)。
其 PGF 為：
\(G_X(t) = t^1 P(X=1) + t^2 P(X=2) + \dots + t^6 P(X=6)\)
\(G_X(t) = \frac{1}{6}t + \frac{1}{6}t^2 + \frac{1}{6}t^3 + \frac{1}{6}t^4 + \frac{1}{6}t^5 + \frac{1}{6}t^6\)
\(G_X(t) = \frac{1}{6}(t + t^2 + t^3 + t^4 + t^5 + t^6)\)

關鍵點：機率 \(P(X=x)\) 正是函數 \(G_X(t)\) 中 \(t^x\) 項的係數。

2. 特性：從 PGF 找出機率

PGF 最直接且好用的特性之一，就是能把原始機率找出來。

特性 1：提取機率

如果你已經有了 PGF \(G_X(t)\)，隨機變數 \(X\) 取特定值 \(x\) 的機率可以透過以下方式找到：

\(P(X = x) = G_X(t) \text{ 中 } t^x \text{ 的係數}\)

這就是為什麼 PGF 如此強大——它能「生成」機率！

快速檢查特性：\(G_X(1) = 1\)

如果我們在 PGF 公式中代入 \(t=1\)：
\(G_X(1) = \sum 1^x P(X=x) = \sum P(X=x)\)
由於所有機率的總和必須為 1，因此 \(G_X(1)\) 必須永遠等於 1。這是一個檢查你所推導出的 PGF 是否正確的好方法。

避免常見錯誤：請記得 \(G_X(t)\) 是一個關於 \(t\) 的函數。不要把 \(t\) 當作我們要解出的未知數，而要把它視為一個符號佔位符。

3. 特性：生成期望值與變異數（動差）

PGF 最大的用處在於利用簡單的微分來計算期望值（平均數 \(\mu\)）與變異數 (\(\sigma^2\))。

求期望值 (\(\mu\))

期望值（或稱期望值 \(E(X)\)）可透過 PGF 的一階導數在 \(t=1\) 時的值求得。

步驟 1：求出一階導數 \(G'_X(t)\)。
步驟 2：將 \(t=1\) 代入導數中。

期望值：\(\mu = E(X) = G'_X(1)\)

求變異數 (\(\sigma^2\))

變異數需要用到一階與二階導數，並在 \(t=1\) 時求值。

步驟 1：求出二階導數 \(G''_X(t)\)。
步驟 2：計算 \(G''_X(1)\)。
步驟 3：應用變異數公式（課程大綱中會提供）：

變異數：\(\sigma^2 = G''_X(1) + \mu - \mu^2\)

等等，為什麼要用這個公式呢？
你知道嗎？ \(G''_X(1)\) 的值實際上給我們的是 \(E(X^2) - E(X)\)，也就是 \(E(X^2) - \mu\)。如果你重新排列變異數的標準公式 \(\sigma^2 = E(X^2) - \mu^2\)，你會得到：
\(\sigma^2 = [G''_X(1) + \mu] - \mu^2\)。
這就是為什麼針對 PGF 必須使用這個特定的變異數公式。

關鍵點：PGF 將複雜的求和運算轉變為簡單的微分步驟，以便計算平均數與變異數。

4. 常見分佈的 PGF 推導

如同課程大綱所要求的，你必須懂得如何推導（或能即刻背出）關鍵分佈的 PGF。

4.1 伯努利分佈 (Bernoulli Distribution, Ber(p))

伯努利變數 \(X\) 可取 \(x=0\)（失敗）或 \(x=1\)（成功）。
\(P(X=0) = q\) (其中 \(q = 1-p\))
\(P(X=1) = p\)

\(G_X(t) = \sum t^x P(X=x)\)
\(G_X(t) = t^0 P(X=0) + t^1 P(X=1)\)
\(G_X(t) = 1 \cdot q + t \cdot p\)

伯努利 PGF：\(G_X(t) = q + pt\)

4.2 二項分佈 (Binomial Distribution, B(n, p))

二項變數 \(X\) 是 \(n\) 次獨立伯努利試驗的總和。
\(P(X=x) = \binom{n}{x} p^x q^{n-x}\)，對於 \(x=0, 1, \dots, n\)。

\(G_X(t) = \sum_{x=0}^{n} t^x P(X=x)\)
\(G_X(t) = \sum_{x=0}^{n} t^x \binom{n}{x} p^x q^{n-x}\)
\(G_X(t) = \sum_{x=0}^{n} \binom{n}{x} (pt)^x q^{n-x}\)

看出這個結構了嗎？這正是 \((A+B)^n\) 的二項式展開式，其中 \(A=q\) 且 \(B=pt\)。

二項分佈 PGF：\(G_X(t) = (q + pt)^n\)

4.3 幾何分佈 (Geometric Distribution, Geo(p))

幾何變數 \(X\) 是獲得第一次成功所需的試驗次數 (\(x=1, 2, 3, \dots\))。
\(P(X=x) = q^{x-1} p\)

\(G_X(t) = \sum_{x=1}^{\infty} t^x P(X=x)\)
\(G_X(t) = \sum_{x=1}^{\infty} t^x q^{x-1} p\)
\(G_X(t) = p \sum_{x=1}^{\infty} t^x q^{x-1}\)

展開級數：
\(G_X(t) = p (t^1 q^0 + t^2 q^1 + t^3 q^2 + \dots)\)
\(G_X(t) = pt (1 + qt + (qt)^2 + (qt)^3 + \dots)\)

括號內的表達式是一個無窮幾何級數，首項 \(a=1\)，公比 \(r=qt\)。
此級數的和為 \(\frac{a}{1-r} = \frac{1}{1 - qt}\)。

幾何分佈 PGF：\(G_X(t) = \frac{pt}{1 - qt}\)

4.4 均勻分佈 (離散)

設 \(X\) 為離散均勻變數，取值 \(1, 2, \dots, N\)，每個值的機率皆為 \(1/N\)。

\(G_X(t) = \sum_{x=1}^{N} t^x P(X=x) = \sum_{x=1}^{N} t^x \frac{1}{N}\)
\(G_X(t) = \frac{1}{N} (t^1 + t^2 + t^3 + \dots + t^N)\)

括號內的表達式是一個幾何級數，首項 \(a=t\)，公比 \(r=t\)，共 \(N\) 項。其和為 \(\frac{a(1-r^N)}{1-r}\)。

均勻分佈 PGF：\(G_X(t) = \frac{t(1 - t^N)}{N(1 - t)}\)

快速複習框：需熟記的關鍵 PGF

伯努利 \(Ber(p)\)： \(G_X(t) = q + pt\)

二項分佈 \(B(n, p)\)： \(G_X(t) = (q + pt)^n\)

幾何分佈 \(Geo(p)\)： \(G_X(t) = \frac{pt}{1 - qt}\)

5. 獨立隨機變數的和

這大概是使用 PGF 最有力的原因：它們簡化了將獨立隨機變數相加的過程。

特性 2：和的 PGF

如果 \(X\) 和 \(Y\) 是獨立的離散隨機變數，且 \(W = X + Y\)，則和 \(W\) 的 PGF 僅是它們各自 PGF 的乘積。

\(G_{X+Y}(t) = G_X(t) G_Y(t)\)

類比：想像你有兩個不同過程的獨立資料檔（PGF）。如果這兩個過程是獨立的，你只需將這些檔案相乘，就能將它們的資訊合併起來！

應用範例：二項分佈之和

假設 \(X_1 \sim B(n_1, p)\) 與 \(X_2 \sim B(n_2, p)\) 是獨立的，分別代表兩組不同試驗的成功次數（且機率 \(p\) 相同）。
令 \(W = X_1 + X_2\)。
\(G_{X_1}(t) = (q + pt)^{n_1}\)
\(G_{X_2}(t) = (q + pt)^{n_2}\)

\(G_W(t) = G_{X_1}(t) G_{X_2}(t) = (q + pt)^{n_1} \cdot (q + pt)^{n_2}\)
\(G_W(t) = (q + pt)^{n_1 + n_2}\)

由於結果的 PGF 具有二項分佈 PGF 的形式，我們立刻得知和 \(W\) 服從二項分佈：
\(W \sim B(n_1 + n_2, p)\)。

這個乘法特性使得組合分佈變得異常簡單，而若使用傳統機率方法（卷積）計算和的機率分佈則可能會極其複雜。

關鍵點：當將獨立隨機變數相加時，請將它們的 PGF 相乘。這通常有助於識別出該總和的分佈形式。

重要提醒與常見錯誤

1. 微分是關鍵：要計算變異數時，記得計算兩個導數 \(G'_X(1)\)（期望值 \(\mu\)）與 \(G''_X(1)\)，然後再代入公式：\(\sigma^2 = G''_X(1) + \mu - \mu^2\)。

2. 僅適用於獨立變數的和：特性 \(G_{X+Y}(t) = G_X(t) G_Y(t)\) 僅在 \(X\) 與 \(Y\) 獨立時成立。如果不獨立，則此關係式不適用。

3. 檢查 \(G_X(1) = 1\)：如果你推導出的 PGF 在 \(t=1\) 時不等於 1，那你肯定算錯了！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。