Probability generating functions (pgf) - Further Mathematics (9665) - Oxford AQA International AS Level

概率生成函數 (pgf) 簡介

歡迎來到統計學中最巧妙的工具之一！概率生成函數 (Probability Generating Function, pgf) 聽起來可能有點嚇人，但你可以把它想像成一個「數學儲存箱」。我們不需要隨身攜帶一張冗長的概率表，而是將所有數據打包進一個代數表達式中。

在本章中，你將學習如何將概率分佈轉化為函數、如何利用該函數求出平均值 (mean) 和方差 (variance)，以及如何輕鬆地處理不同隨機變量的組合。如果你喜歡代數和一點微積分，你會發現 pgf 能讓複雜的統計問題變得簡單得多！

1. 什麼是 PGF？

對於一個取非負整數值（0, 1, 2...）的離散隨機變量 \(X\)，其 pgf 定義為：

\( G_X(t) = E(t^X) = \sum P(X=x)t^x \)

用白話文解釋：要建立一個 pgf，你需要將每個可能的結果 \(x\) 作為虛擬變量 \(t\) 的指數 (power)，並乘以它對應的概率 (probability)。

一個簡單的例子

想像你有一個奇怪的 3 面骰子，其中：
\(P(X=0) = 0.2\)
\(P(X=1) = 0.5\)
\(P(X=2) = 0.3\)

該骰子的 pgf 為：
\(G_X(t) = 0.2t^0 + 0.5t^1 + 0.3t^2\)
化簡後得到：\(G_X(t) = 0.2 + 0.5t + 0.3t^2\)

快速複習：
係數 (coefficient)（即前面的數字）就是概率。
\(t\) 的指數就是該隨機變量的數值。

你知道嗎？
變量 \(t\) 在現實世界中並沒有實際意義。它僅僅作為一個佔位符，幫助我們根據指數將概率進行分類整理。

2. PGF 的重要特性

在我們深入探討之前，有兩個關於 pgf 的「黃金法則」請務必記住：

1. 概率總和： 如果將 \(t = 1\) 代入任何合法的 pgf 中，結果必然為 1。
\(G_X(1) = \sum P(X=x)(1)^x = \sum P(X=x) = 1\)。

2. 尋找概率： 要找到 \(P(X=k)\)，只需尋找 \(t^k\) 的係數。例如在上述骰子的例子中，\(t^2\) 的係數是 0.3，所以 \(P(X=2) = 0.3\)。

核心要點： pgf 只是表示概率分佈表的一種不同方式。\(G_X(1)\) 永遠等於 1！

3. 使用 PGF 尋找平均值與方差

這是 pgf 展現其強大威力的地方。我們可以利用微分來求出期望值 (Expected Value, 即平均值) 和方差 (Variance)。

尋找平均值 (\(\mu\))

要計算平均值，我們只需對 pgf 求一階導數，然後代入 \(t = 1\)：
\(\mu = E(X) = G_X'(1)\)

尋找方差 (\(\sigma^2\))

計算方差則需要用到二階導數。公式為：
\(\sigma^2 = G_X''(1) + G_X'(1) - [G_X'(1)]^2\)
或者，用 \(\mu\) 表示：
\(\sigma^2 = G_X''(1) + \mu - \mu^2\)

逐步流程：
1. 對 \(G_X(t)\) 求導得到 \(G_X'(t)\)。
2. 再次求導得到 \(G_X''(t)\)。
3. 將 \(t=1\) 分別代入上述兩式。
4. 將結果代入方差公式中。

如果一開始覺得困難也不用擔心！ 只要記住 \(G_X'(1)\) 就是平均值，而方差公式只是一個額外的小步驟。多練習幾次推導，自然就能熟能生巧。

4. 常見分佈的 PGF

課程大綱要求你了解（並能夠推導）常見分佈的 pgf。以下是便捷的總結：

伯努利分佈 (Bernoulli Distribution)：\(X \sim B(1, p)\)
結果為 0（概率為 \(q\)）和 1（概率為 \(p\)）。
\(G_X(t) = q + pt\)

二項分佈 (Binomial Distribution)：\(X \sim B(n, p)\)
這本質上是 \(n\) 個獨立的伯努利試驗相加。
\(G_X(t) = (q + pt)^n\)

幾何分佈 (Geometric Distribution)：\(X \sim Geo(p)\)
這描述了直到第一次成功所需的試驗次數。
\(G_X(t) = \frac{pt}{1 - qt}\)

離散均勻分佈 (Discrete Uniform Distribution)：
當 \(X\) 取值 \(1, 2, ..., n\) 且概率皆為 \(1/n\) 時。
\(G_X(t) = \frac{1}{n}(t + t^2 + ... + t^n) = \frac{t(1 - t^n)}{n(1 - t)}\)

常見錯誤提醒：
在幾何分佈中，請記住 \(q = 1 - p\)。務必小心不要在分數中混淆它們！

5. 獨立隨機變量之和

統計學中最好的「技巧」之一就是 pgf 處理加法的方式。如果你有兩個獨立的隨機變量 \(X\) 和 \(Y\)，且想要求它們之和 \(Z = X + Y\) 的 pgf，你只需要將它們的 pgf相乘即可！

\(G_{X+Y}(t) = G_X(t) \times G_Y(t)\)

類比：
想像這就像組合兩個播放列表。如果播放列表 \(X\) 在一個盒子裡，播放列表 \(Y\) 在另一個盒子裡，將這兩個盒子相乘，就得到了一個包含所有歌曲組合（結果）的巨大播放列表。

例子：
如果 \(X \sim B(n, p)\) 且 \(Y \sim B(m, p)\)，那麼：
\(G_{X+Y}(t) = (q + pt)^n \times (q + pt)^m = (q + pt)^{n+m}\)。
這證明了兩個二項分佈變量之和仍然是一個二項分佈，且試驗次數為 \(n+m\)！

核心要點： 獨立變量相加 = 它們的 pgf 相乘。這比建立巨大的概率表要簡單得多！

最終複習清單

在進行練習題之前，請確保你能：
• 從概率表中建立 pgf。
• 通過計算 \(G_X'(1)\) 找到平均值。
• 使用 \(G_X''(1) + \mu - \mu^2\) 找到方差。
• 識別並推導伯努利分佈、二項分佈和幾何分佈的 pgf。
• 通過函數相乘來組合獨立變量。

加油，你一定可以的！ PGF 只是利用代數為你完成統計學中繁重工作的一種巧妙方法。

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。