Discrete random variables - Further Mathematics B (MEI) - H645 - Cambridge OCR A Level

歡迎來到離散隨機變數的世界！

在本章中，我們將從觀察單一事件轉向從「宏觀」角度理解機率。我們利用離散隨機變數 (Discrete Random Variables) 來建立現實生活中的模型，例如商店中顧客的到達數量，或是擲硬幣直到出現「正面」所需的次數。理解這些模式能讓我們進行預測並計算風險，而這正是統計學的核心。

如果剛開始覺得公式有點深奧，別擔心！我們會將它們拆解成簡單的步驟，保證大家都能跟上！

1. 基礎概念：什麼是隨機變數？

隨機變數 (Random Variable)（通常記作 \(X\)）是一個將實驗的每個結果賦予一個數值的規則。如果它只能取特定的、分離的數值（如 1, 2, 3...）而不能取範圍內的任意值，它就是離散 (discrete) 的。

機率分佈 (Probability Distributions)

機率分佈簡單來說就是一個列表或公式，列出 \(X\) 所有可能的數值及其各自發生的機率。我們將其寫為 \(P(X = x)\)。

兩大黃金法則：
1. 每個個別的機率必須介於 0 和 1 之間：\(0 \le P(X=x) \le 1\)。
2. 分佈中所有機率的總和必須等於 1：\(\sum P(X=x) = 1\)。

例子：設 \(X\) 為投擲一顆公平 4 面骰子的點數。數值為 {1, 2, 3, 4}，每個數值的機率皆為 0.25。如果你將它們相加（\(0.25 \times 4\)），結果就是 1！

快速複習小撇步：如果在表中漏掉了一個機率，只要把其他的機率加起來，再用 1 減去總和即可！

2. 期望值與變異數

我們該如何找出一個模式的「平均值」呢？我們使用期望值 (Expectation) 和變異數 (Variance)。

期望值 \(E(X)\)

期望值（或平均值，\(\mu\)）是長期的平均數值。要計算它，將每個數值乘以其對應的機率，然後全部加總：
\(E(X) = \mu = \sum x P(X = x)\)

變異數 \(Var(X)\)

變異數 (\(\sigma^2\)) 用來衡量數值的分佈離散程度。最容易使用的公式是：
\(Var(X) = E(X^2) - [E(X)]^2\)

計算變異數的步驟：
1. 先計算 \(E(X)\)。
2. 將每個 \(x\) 的數值平方，乘以其機率，再全部加總以得到 \(E(X^2)\)。
3. 用第二步的答案減去第一步答案的平方。

記憶口訣：你可以將變異數公式記作「平方的平均值減去平均值的平方」。

重點提示：標準差 (Standard Deviation) (\(\sigma\)) 其實就是變異數的平方根：\(\sigma = \sqrt{Var(X)}\)。

3. 編碼：變數轉換

有時候我們需要改變資料（例如，將分數轉換為現金獎勵）。我們使用以下簡單規則來處理期望值代數：

1. 期望值： \(E(a + bX) = a + bE(X)\)。（完全符合直覺！）
2. 變異數： \(Var(a + bX) = b^2 Var(X)\)。（加上常數 \(a\) 不會改變離散程度，但乘數 \(b\) 需要平方！）

常見錯誤：永遠不要從變異數中減去常數。即使你將資料平移了 -10，資料的「分佈範圍」保持不變，因此變異數不會改變！

4. 離散均勻分佈 (Discrete Uniform Distribution)

這是最簡單的模型。當每個結果發生的機率皆相等時使用，例如公平的骰子或轉盤。

若 \(X\) 在數值 \(\{1, 2, \dots, n\}\) 上呈均勻分佈：
\(E(X) = \frac{n + 1}{2}\)
\(Var(X) = \frac{1}{12}(n^2 - 1)\)

例子：對於標準的 6 面骰子（\(n=6\)），平均點數 \(E(X)\) 為 \(\frac{6+1}{2} = 3.5\)。

5. 二項分佈 \(X \sim B(n, p)\)

你在 A Level 數學中已經見過它，但在進階數學 (Further Maths) 中，我們更深入探討其性質。當你有固定次數的試驗 (\(n\)) 且只有兩種結果（成功或失敗）時使用。

核心性質：
平均值： \(E(X) = np\)
變異數： \(Var(X) = np(1 - p)\)

你知道嗎？二項分佈變數其實就是 \(n\) 個獨立伯努利試驗 (Bernoulli trials)（即 \(n=1\) 的試驗）的總和。這就是為什麼平均值簡單地等於 \(n \times p\)！

6. 卜瓦松分佈 \(X \sim Po(\lambda)\)

這用於建立在固定時間或空間區間內發生的事件次數模型（例如一小時內收到的郵件數量）。

卜瓦松模型的條件：
- 事件隨機且獨立發生。
- 事件以固定的平均速率 (\(\lambda\)) 發生。
- 事件不能同時發生。

「神奇」的性質：
在卜瓦松分佈中，平均值與變異數相等！
\(E(X) = \lambda\)
\(Var(X) = \lambda\)

快速複習：如果你被問到卜瓦松模型是否適用於某組數據，檢查計算出的平均值和變異數是否接近。如果差異很大，卜瓦松模型就不是一個好選擇！

合併卜瓦松分佈：如果 \(X \sim Po(\lambda)\) 與 \(Y \sim Po(\mu)\) 是獨立的，那麼它們的總和也符合卜瓦松分佈：\(X + Y \sim Po(\lambda + \mu)\)。

7. 幾何分佈 \(X \sim Geo(p)\)

幾何分佈用於模擬直到第一次成功為止的試驗次數。你可以把它想成是「我需要等多久？」的分佈。

公式：
- 在第 \(r\) 次試驗成功的機率： \(P(X = r) = (1 - p)^{r-1}p\)
- 成功需要超過 \(r\) 次試驗的機率： \(P(X > r) = (1 - p)^r\)
- 平均值： \(E(X) = \frac{1}{p}\)
- 變異數： \(Var(X) = \frac{1 - p}{p^2}\)

例子：如果贏得遊戲的機率是 0.2，為了贏一次平均需要玩的遊戲次數為 \(\frac{1}{0.2} = 5\) 場。

8. 獨立變數的線性組合

這就是進階數學精彩的地方！如果我們有兩個不同的隨機變數 \(X\) 和 \(Y\)，想要找出它們組合後的平均值與變異數該怎麼辦？如果 \(X\) 和 \(Y\) 是獨立的：

組合平均值（期望值）

\(E(X + Y) = E(X) + E(Y)\)
\(E(X - Y) = E(X) - E(Y)\)
\(E(aX + bY) = aE(X) + bE(Y)\)

組合變異數（平方規則）

關鍵法則：當你組合變數時，變異數永遠是相加的（前提是它們必須獨立）。即使你是在減去變數，不確定性（變異數）仍然會增加！
\(Var(X + Y) = Var(X) + Var(Y)\)
\(Var(X - Y) = Var(X) + Var(Y)\)（沒錯，這裡還是加號！）
\(Var(aX \pm bY) = a^2 Var(X) + b^2 Var(Y)\)

類比：想像 \(X\) 和 \(Y\) 是兩台不同的震動機器人。如果你把一台機器人疊在另一台上面，總體的「震動程度」（變異數）會加劇，無論它們是往相同方向還是相反方向移動！

總結摘要：
- 使用期望值來求平均，使用變異數來衡量分佈程度。
- 卜瓦松分佈用於計數時間間隔內的事件；幾何分佈用於等待成功的次數。
- 對於獨立變數：平均值遵循運算符號，但變異數永遠相加！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。