Probability generating functions - Further Mathematics (9FM0) - Pearson Edexcel A Level

歡迎來到機率生成函數 (Probability Generating Functions)！

在本章中，我們要學習統計學中一個非常巧妙的「捷徑」。機率生成函數 (PGF) 是一種將整個機率分佈「打包」成單一代數表達式的方法。試想一下，原本有一堆雜亂無章的機率列表，現在你可以把它們摺疊起來，放入一個簡單的多項式中——這正是 PGF 的作用！

學完這些筆記後，你將能夠建立這些函數，利用它們求出平均值 (mean) 和變異數 (variance)，甚至能推導出將不同隨機變數相加時會發生什麼事。如果起初覺得概念有些抽象，別擔心；一旦你掌握了其中的規律，它就和普通的代數運算沒什麼兩樣。

1. 什麼是 PGF？

對於一個取非負整數值 (\(0, 1, 2, ...\)) 的離散隨機變數 \(X\)，其機率生成函數以 \(G_X(t)\) 表示，定義如下：

\(G_X(t) = E(t^X) = \sum P(X=x)t^x\)

深入拆解：

你可以把變數 \(t\) 看作一個「佔位符」。\(t\) 的次方代表 \(X\) 的值，而係數（\(t\) 前面的數字）則代表該數值發生的機率。

例子： 若一個隨機變數 \(X\) 的機率為 \(P(X=0)=0.2\)，\(P(X=1)=0.5\)，以及 \(P(X=2)=0.3\)，則該 PGF 為：
\(G_X(t) = 0.2t^0 + 0.5t^1 + 0.3t^2\)
\(G_X(t) = 0.2 + 0.5t + 0.3t^2\)

你知道嗎？ 「100% 規則」：由於所有機率之和必須等於 1，如果你令 \(t = 1\)，PGF 的值永遠會等於 1。所以，\(G_X(1) = 1\)。這是一個檢查答案的好方法！

重點總結： PGF 就是一個多項式，其係數正是該分佈的機率。

2. 常見分佈的 PGF

你不必每次都從零開始構建 PGF。Edexcel 課程大綱要求你掌握（並能推導）最常見分佈的 PGF。以下是你的「作弊單 (Cheat Sheet)」：

二項分佈 (Binomial Distribution)： \(X \sim B(n, p)\)

\(G_X(t) = (q + pt)^n\)
（其中 \(q = 1 - p\)）

卜瓦松分佈 (Poisson Distribution)： \(X \sim Po(\lambda)\)

\(G_X(t) = e^{\lambda(t-1)}\)

幾何分佈 (Geometric Distribution)： \(X \sim Geo(p)\)

\(G_X(t) = \frac{pt}{1 - qt}\)
注意：這是指 \(X\) 從 1 開始的版本。

負二項分佈 (Negative Binomial Distribution)： \(X \sim Negative B(r, p)\)

\(G_X(t) = (\frac{pt}{1 - qt})^r\)

記憶小撇步： 注意到負二項分佈的 PGF 其實就是幾何分佈的 PGF 的 \(r\) 次方。這很有道理，因為一個負二項分佈變數本質上就是 \(r\) 個獨立幾何分佈變數的和！

重點總結： 把這四種形式背下來！它們是本章幾乎所有考試題目的基礎。

3. 使用 PGF 求平均值與變異數

這是 PGF 真正展現威力的地方。與其使用冗長的 \(\sum xP(x)\) 公式，我們可以使用微積分來處理。

求平均值 (\(E(X)\))

要找到期望值，我們只需求 PGF 的一階導數，然後代入 \(t = 1\)。

1. 求 \(G'_X(t\))
2. 令 \(t = 1\)
3. \(E(X) = G'_X(1)\)

求變異數 (\(Var(X)\))

求變異數需要進行兩步導數運算。我們首先要求出 \(t=1\) 時的二階導數，這會給我們一個稱為「階乘動差 (factorial moment)」的結果。要得到最終的變異數，請使用此特定公式：

1. 求 \(G''_X(t)\) 並令 \(t = 1\)
2. \(Var(X) = G''_X(1) + G'_X(1) - [G'_X(1)]^2\)

如果起初覺得棘手，別擔心！ 許多學生會忘記加上 \(G'_X(1)\) 或者忘記減去平均值的平方。只需記住這個節奏：「二階導數，加上平均值，再減去平均值的平方。」

快速複習盒：
- \(E(X) = G'(1)\)
- \(Var(X) = G''(1) + E(X) - [E(X)]^2\)

4. 獨立隨機變數的和

如果你有兩個分開、獨立的事件，而你想知道它們的總和的機率分佈該怎麼辦？PGF 讓這件事變得異常簡單。

如果 \(X\) 和 \(Y\) 是獨立的隨機變數，且你定義了一個新變數 \(Z = X + Y\)，那麼 \(Z\) 的 PGF 只需將個別的 PGF相乘即可：

\(G_{X+Y}(t) = G_X(t) \times G_Y(t)\)

類比：

想像 \(G_X(t)\) 是樂高小車的藍圖，而 \(G_Y(t)\) 是樂高拖車的藍圖。如果你想要車子加拖車（\(X+Y\)）的藍圖，你只需把兩張藍圖拼在一起即可！

例子： 若 \(X \sim Po(\lambda)\) 和 \(Y \sim Po(\mu)\) 是獨立的：
\(G_X(t) = e^{\lambda(t-1)}\)
\(G_Y(t) = e^{\mu(t-1)}\)
\(G_{X+Y}(t) = e^{\lambda(t-1)} \times e^{\mu(t-1)} = e^{(\lambda+\mu)(t-1)}\)
這證明了兩個卜瓦松變數的和依然是一個卜瓦松變數，且其新的平均值為 \(\lambda + \mu\)！

重點總結： 在「現實世界」中將獨立變數相加，等於在「數學世界」中將它們的 PGF 相乘。

5. 避免常見錯誤

即使是優秀的學生也可能在這些地方失足。請留意：

忘記令 \(t=1\)： 微分後，你的答案應該是一個數字。如果你的平均值或變異數算式中還殘留著 \(t\)，代表你漏了最後一步！
連鎖律 (Chain Rule) 錯誤： 當微分像 \((q + pt)^n\) 這樣的式子時，記得要乘以括號內部的導數（即 \(p\)）。
搞混 p 和 q： 永遠記住 \(p\) 是成功的機率，\(q\) 是失敗的機率 (\(1-p\))。檢查題目要求的是哪一個！
幾何分佈的起始點： 如果題目對幾何分佈的定義不同（例如從 \(X=0\) 而非 \(X=1\) 開始），請務必小心。上述標準 PGF 是針對 \(X \in \{1, 2, 3, ...\}\) 的。

總結檢核清單

在進入練習題之前，請確保你能做到以下幾點：

從機率表定義一個 PGF。
背誦二項、卜瓦松、幾何及負二項分佈的 PGF。
對 PGF 微分以求出平均值 (\(G'(1)\))。
應用變異數公式 (\(G''(1) + G'(1) - [G'(1)]^2\))。
將 PGF 相乘以求出獨立變數之和的分佈。

你一定沒問題的！ PGF 是一個強大的工具，能將困難的機率問題轉化為簡單的代數運算。繼續練習微分，剩下的自然會迎刃而解。

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。