離散隨機變數 (Discrete Random Variables) (9709 Paper 5, 第 5.4 節)

各位未來的統計學家,你們好!這一章標誌著你們正式踏入正規機率分佈的世界。離散隨機變數聽起來可能很複雜,但它們其實只是那些你可以數出來的變數值。
我們將學習如何以數學方式描述這些計數,找出平均結果(期望值),以及測量結果的分佈程度(變異數)。這些工具對於模擬各種情況至關重要,從拋硬幣到製造業的品質管制都能派上用場!

1. 什麼是離散隨機變數 (DRV)?

隨機變數 (Random Variable),通常用大寫字母(例如 \(X\))表示,是一個其數值為隨機現象結果的變數。

關鍵定義
  • 離散隨機變數 (Discrete Random Variable, DRV): 只能取特定、離散數值的隨機變數。這些數值通常是整數。
  • 類比:想像在數人數(你可以有 1、2 或 3 個人,但不可能有 2.5 個人)。
  • 可能取值(定義域): 如果你擲一枚骰子,\(X\) 可以是 {1, 2, 3, 4, 5, 6}。如果你計算拋 4 次硬幣中正面出現的次數,\(X\) 可以是 {0, 1, 2, 3, 4}。
1.1 機率分佈表 (Probability Distribution Table, PDT)

一個 DRV 完全由其機率分佈所定義。這是一份變數所有可能取值 (\(x\)) 及其對應機率 \(P(X=x)\) 的清單。

這種分佈通常以表格形式呈現:

\(x\) \(x_1\) \(x_2\) \(x_3\) ...
\(P(X=x)\) \(p_1\) \(p_2\) \(p_3\) ...

任何機率分佈必須遵守的規則:
  1. 所有機率必須為非負數: 對於所有 \(x\),\(P(X=x) \ge 0\)。(某件事發生的機率不可能為負!)
  2. 所有機率之和必須等於 1: \(\sum P(X=x) = 1\)。(總要發生點什麼事吧!)

例子: 袋子裡有 2 個紅球 (R) 和 3 個藍球 (B)。你從中不放回地取出兩個球。令 \(X\) 為取出的紅球數量。\(X\) 可以取 0、1 或 2。
P(X=0) = P(BB) = (3/5) * (2/4) = 6/20
P(X=1) = P(RB 或 BR) = (2/5)*(3/4) + (3/5)*(2/4) = 12/20
P(X=2) = P(RR) = (2/5) * (1/4) = 2/20

檢查: \(6/20 + 12/20 + 2/20 = 20/20 = 1\)。此表格有效。


2. 期望值 (平均值) 與變異數

一旦你有了一張機率分佈表 (PDT),你就可以計算 DRV 兩個最重要的特徵:平均結果和結果的分散程度。

2.1 期望值, \(E(X)\) (平均值)

期望值 (Expected Value) 或期望值 \(E(X)\)(也常以 \(\mu\) 表示),代表隨機變數的長期平均值。如果你重複進行多次隨機實驗,這就是你預期得到的平均結果。

期望值公式:

$$E(X) = \sum x P(X=x)$$

逐步技巧: 只要將每個數值 (\(x\)) 乘以其對應的機率 (\(P(X=x)\)),然後將所有乘積相加即可。

2.2 變異數, \(Var(X)\) (分散程度)

變異數 \(Var(X)\)(或 \(\sigma^2\))衡量數值距離平均值有多分散。變異數越高,代表結果散佈得越廣。

標準的計算方法使用以下關係:

變異數公式:

$$Var(X) = E(X^2) - [E(X)]^2$$

其中 \(E(X^2)\) 是 \(X^2\) 的期望值,計算方式為: $$E(X^2) = \sum x^2 P(X=x)$$

快速回顧:計算 \(Var(X)\)

  1. 計算 \(E(X) = \sum x P(X=x)\)。
  2. 計算 \(E(X^2) = \sum x^2 P(X=x)\)(在乘以機率之前,先對 \(x\) 值進行平方)。
  3. 代入變異數公式:\(Var(X) = E(X^2) - [E(X)]^2\)。

標準差 (Standard Deviation) 則僅是 \(\sqrt{Var(X)}\)。

常見錯誤警示! 千萬不要忘記變異數公式中的括號!它是 \( [E(X)]^2 \),這意味著你要將最終算出的平均值平方,而不是先對個別 \(x\) 值平方再求和。


3. 二項分佈 (Binomial Distribution) \(B(n, p)\)

二項分佈是一種特定類型的 DRV 分佈,用於當我們有固定數量的相同試驗,且我們關注的是成功的總次數時。

我們記作 \(X \sim B(n, p)\),其中 \(n\) 是試驗次數,\(p\) 是單次試驗中成功的機率。

3.1 二項模型的前提條件

只有在滿足全部四個條件時,情況才可用二項分佈來模擬。使用記憶口訣 BITZ 來記住它們:

  • Binary(二元):每次試驗只有兩種可能結果(成功或失敗)。
  • Independent(獨立):每次試驗的結果不會影響其他試驗的結果。
  • Trials fixed(試驗次數固定,\(n\)):試驗次數是固定且預先確定的。
  • Zero change in \(p\)(成功機率不變):每次試驗的成功機率 (\(p\)) 保持不變。
3.2 二項機率公式

如果 \(X \sim B(n, p)\),在 \(n\) 次試驗中獲得恰好 \(r\) 次成功的機率為:

$$P(X=r) = \binom{n}{r} p^r (1-p)^{n-r}$$

其中:

  • \(\binom{n}{r}\)(讀作「n 取 r」)計算在 \(n\) 次試驗中出現 \(r\) 次成功的方法數。請使用計算機上的 nCr 功能。
  • \(p^r\) 是這 \(r\) 次成功發生的機率。
  • \((1-p)^{n-r}\) 是其餘 \((n-r)\) 次失敗發生的機率。

你知道嗎? \((1-p)\) 通常寫作 \(q\)。該公式僅僅是將得到結果的方法數與該特定結果順序的機率結合起來。

3.3 \(B(n, p)\) 的期望值與變異數

對於二項分佈,使用專用公式計算平均值和變異數非常直接(這些公式列在 MF19 公式表中):

期望值 (平均值):

$$E(X) = np$$

變異數:

$$Var(X) = np(1-p)$$

例子: 如果你拋一枚均勻硬幣 100 次 (\(n=100\), \(p=0.5\)),你預期 \(E(X) = 100 \times 0.5 = 50\) 次正面。變異數為 \(100 \times 0.5 \times 0.5 = 25\)。


4. 幾何分佈 (Geometric Distribution) \(Geo(p)\)

幾何分佈模擬的是必須等待直到第一次成功發生時的機率。它是二項分佈概念的延伸,但沒有固定的試驗次數。

我們記作 \(X \sim Geo(p)\),其中 \(p\) 是單次試驗中成功的機率。\(X\) 的可能取值為 \(r=1, 2, 3, \ldots\)(因為第一次成功最終一定會發生)。

4.1 幾何模型的前提條件

幾何分佈需要符合 BITZ 中的前三個條件,但將「固定試驗次數」替換為變數「等待時間」:

  • Binary(二元):只有兩種結果(成功或失敗)。
  • Independent(獨立):試驗是獨立的。
  • Zero change in \(p\)(成功機率不變):成功機率 (\(p\)) 保持不變。

類比: 你不斷拋硬幣直到得到第一個正面。\(X=5\) 意味著你經歷了 4 次反面,隨後得到 1 次正面 (FFFFH)。

4.2 幾何機率公式

如果 \(X\) 是第一次成功發生的試驗次數,那麼對於 \(r = 1, 2, 3, \ldots\):

$$P(X=r) = (1-p)^{r-1} p$$

此公式意味著在第 \(r\) 次試驗成功之前,必須先經歷 \((r-1)\) 次失敗。

例子: 如果 \(p=0.2\),第一次成功發生在第 4 次試驗 (\(r=4\)) 的機率為:
\(P(X=4) = (1-0.2)^{4-1} \times 0.2 = (0.8)^3 \times 0.2 = 0.1024\)

4.3 \(Geo(p)\) 的期望值

幾何分佈的期望值 \(E(X)\) 告訴你等待第一次成功平均需要進行多少次試驗。

期望值 (平均值):

$$E(X) = \frac{1}{p}$$

例子: 如果射中靶心的機率是 \(p=0.1\),你預期平均需要等待 \(E(X) = 1/0.1 = 10\) 次射擊才能射中第一次靶心。

(注意:幾何分佈的變異數公式不是 P5 的考試要求,只需知道期望值即可。)


快速回顧與學習建議
  • DRV 基礎: 記住任何機率分佈的兩條規則:機率總和必須為 1,且必須為非負數。
  • 矩的計算: 總是先計算 \(E(X)\)。當計算 \(E(X^2)\) 時,記得在乘以 \(P(X=x)\) *之前*,先將 \(x\) 值平方。
  • 二項分佈 vs 幾何分佈:
    • 二項分佈:固定試驗次數,計算成功總數。(BITZ)
    • 幾何分佈:變數試驗次數,等待第一次成功。(等待時間模型)
  • 公式表 (MF19): 二項分佈和幾何分佈的期望值與變異數公式皆已提供。重點在於了解「何時」該使用它們。

如果計算變異數看起來很棘手,別擔心。請透過增加 \(xP(X=x)\) 和 \(x^2 P(X=x)\) 的列來仔細整理你的表格。有條理的架構是邁向成功的關鍵!