歡迎來到機率生成函數 (Probability Generating Functions)!

在本章中,我們要學習統計學中一個非常巧妙的「捷徑」。機率生成函數 (PGF) 是一種將整個機率分佈「打包」成單一代數表達式的方法。試想一下,原本有一堆雜亂無章的機率列表,現在你可以把它們摺疊起來,放入一個簡單的多項式中——這正是 PGF 的作用!

學完這些筆記後,你將能夠建立這些函數,利用它們求出平均值 (mean)變異數 (variance),甚至能推導出將不同隨機變數相加時會發生什麼事。如果起初覺得概念有些抽象,別擔心;一旦你掌握了其中的規律,它就和普通的代數運算沒什麼兩樣。


1. 什麼是 PGF?

對於一個取非負整數值 (\(0, 1, 2, ...\)) 的離散隨機變數 \(X\),其機率生成函數以 \(G_X(t)\) 表示,定義如下:

\(G_X(t) = E(t^X) = \sum P(X=x)t^x\)

深入拆解:

你可以把變數 \(t\) 看作一個「佔位符」。\(t\) 的次方代表 \(X\) 的值,而係數(\(t\) 前面的數字)則代表該數值發生的機率。

例子: 若一個隨機變數 \(X\) 的機率為 \(P(X=0)=0.2\),\(P(X=1)=0.5\),以及 \(P(X=2)=0.3\),則該 PGF 為:
\(G_X(t) = 0.2t^0 + 0.5t^1 + 0.3t^2\)
\(G_X(t) = 0.2 + 0.5t + 0.3t^2\)

你知道嗎? 「100% 規則」:由於所有機率之和必須等於 1,如果你令 \(t = 1\),PGF 的值永遠會等於 1。所以,\(G_X(1) = 1\)。這是一個檢查答案的好方法!

重點總結: PGF 就是一個多項式,其係數正是該分佈的機率。


2. 常見分佈的 PGF

你不必每次都從零開始構建 PGF。Edexcel 課程大綱要求你掌握(並能推導)最常見分佈的 PGF。以下是你的「作弊單 (Cheat Sheet)」:

二項分佈 (Binomial Distribution): \(X \sim B(n, p)\)

\(G_X(t) = (q + pt)^n\)
(其中 \(q = 1 - p\))

卜瓦松分佈 (Poisson Distribution): \(X \sim Po(\lambda)\)

\(G_X(t) = e^{\lambda(t-1)}\)

幾何分佈 (Geometric Distribution): \(X \sim Geo(p)\)

\(G_X(t) = \frac{pt}{1 - qt}\)
注意:這是指 \(X\) 從 1 開始的版本。

負二項分佈 (Negative Binomial Distribution): \(X \sim Negative B(r, p)\)

\(G_X(t) = (\frac{pt}{1 - qt})^r\)

記憶小撇步: 注意到負二項分佈的 PGF 其實就是幾何分佈的 PGF 的 \(r\) 次方。這很有道理,因為一個負二項分佈變數本質上就是 \(r\) 個獨立幾何分佈變數的和!

重點總結: 把這四種形式背下來!它們是本章幾乎所有考試題目的基礎。


3. 使用 PGF 求平均值與變異數

這是 PGF 真正展現威力的地方。與其使用冗長的 \(\sum xP(x)\) 公式,我們可以使用微積分來處理。

求平均值 (\(E(X)\))

要找到期望值,我們只需求 PGF 的一階導數,然後代入 \(t = 1\)。

1. 求 \(G'_X(t\))
2. 令 \(t = 1\)
3. \(E(X) = G'_X(1)\)

求變異數 (\(Var(X)\))

求變異數需要進行兩步導數運算。我們首先要求出 \(t=1\) 時的二階導數,這會給我們一個稱為「階乘動差 (factorial moment)」的結果。要得到最終的變異數,請使用此特定公式:

1. 求 \(G''_X(t)\) 並令 \(t = 1\)
2. \(Var(X) = G''_X(1) + G'_X(1) - [G'_X(1)]^2\)

如果起初覺得棘手,別擔心! 許多學生會忘記加上 \(G'_X(1)\) 或者忘記減去平均值的平方。只需記住這個節奏:「二階導數,加上平均值,再減去平均值的平方。」

快速複習盒:
- \(E(X) = G'(1)\)
- \(Var(X) = G''(1) + E(X) - [E(X)]^2\)


4. 獨立隨機變數的和

如果你有兩個分開、獨立的事件,而你想知道它們的總和的機率分佈該怎麼辦?PGF 讓這件事變得異常簡單。

如果 \(X\) 和 \(Y\) 是獨立的隨機變數,且你定義了一個新變數 \(Z = X + Y\),那麼 \(Z\) 的 PGF 只需將個別的 PGF相乘即可:

\(G_{X+Y}(t) = G_X(t) \times G_Y(t)\)

類比:

想像 \(G_X(t)\) 是樂高小車的藍圖,而 \(G_Y(t)\) 是樂高拖車的藍圖。如果你想要車子加拖車(\(X+Y\))的藍圖,你只需把兩張藍圖拼在一起即可!

例子: 若 \(X \sim Po(\lambda)\) 和 \(Y \sim Po(\mu)\) 是獨立的:
\(G_X(t) = e^{\lambda(t-1)}\)
\(G_Y(t) = e^{\mu(t-1)}\)
\(G_{X+Y}(t) = e^{\lambda(t-1)} \times e^{\mu(t-1)} = e^{(\lambda+\mu)(t-1)}\)
這證明了兩個卜瓦松變數的和依然是一個卜瓦松變數,且其新的平均值為 \(\lambda + \mu\)!

重點總結: 在「現實世界」中將獨立變數相加,等於在「數學世界」中將它們的 PGF 相乘。


5. 避免常見錯誤

即使是優秀的學生也可能在這些地方失足。請留意:

  • 忘記令 \(t=1\): 微分後,你的答案應該是一個數字。如果你的平均值或變異數算式中還殘留著 \(t\),代表你漏了最後一步!
  • 連鎖律 (Chain Rule) 錯誤: 當微分像 \((q + pt)^n\) 這樣的式子時,記得要乘以括號內部的導數(即 \(p\))。
  • 搞混 p 和 q: 永遠記住 \(p\) 是成功的機率,\(q\) 是失敗的機率 (\(1-p\))。檢查題目要求的是哪一個!
  • 幾何分佈的起始點: 如果題目對幾何分佈的定義不同(例如從 \(X=0\) 而非 \(X=1\) 開始),請務必小心。上述標準 PGF 是針對 \(X \in \{1, 2, 3, ...\}\) 的。

總結檢核清單

在進入練習題之前,請確保你能做到以下幾點:

  • 從機率表定義一個 PGF。
  • 背誦二項、卜瓦松、幾何及負二項分佈的 PGF。
  • 對 PGF 微分以求出平均值 (\(G'(1)\))。
  • 應用變異數公式 (\(G''(1) + G'(1) - [G'(1)]^2\))。
  • 將 PGF 相乘以求出獨立變數之和的分佈。

你一定沒問題的! PGF 是一個強大的工具,能將困難的機率問題轉化為簡單的代數運算。繼續練習微分,剩下的自然會迎刃而解。