隨機變數的線性組合 (Paper 6, 第 6.2 節)

哈囉!歡迎來到統計學 P2 中最實用且經常出現的考點:隨機變數的線性組合 (Linear Combinations of Random Variables)。別被這個長長的名字嚇到了——這一章其實就是在教你,當我們把不同的隨機結果結合、相加或相減時,該如何計算它們的平均值(期望值)和變異數(離散程度)。

可以這樣想:如果你知道早上通勤時間 (X) 和下午回程時間 (Y) 的平均值與變異性,那麼你要如何算出全天總交通時間 (X + Y) 的平均值和變異性呢?這一章就是給你這些簡單的規則來解決問題!

1. 單一隨機變數的轉換:\(aX + b\)

在我們合併兩個變數(如 \(X+Y\))之前,先來看看如何轉換單一變數 \(X\)。這在計算成本、調整測量刻度或單位轉換時非常有用。

A. 期望值的規則(平均值)

期望值(\(E\))用來衡量分佈的中心。它遵循非常直觀的規則:

規則 1:縮放與平移

\[ E(aX + b) = aE(X) + b \]

類比:想像 \(X\) 是咖啡的價格,其 \(E(X) = \$4\)。如果政府徵收 \( \$0.50 \) 的定額稅 (\(b=0.5\)),然後店家將原價加倍 (\(a=2\)),那麼新的期望價格就是 \(2(\$4) + \$0.50 = \$8.50\)。期望值很簡單,它是線性的。

B. 變異數的規則(離散程度)

變異數 (\(Var\)) 用來衡量圍繞平均值的離散程度或變異性。這裡是學生最容易犯錯的地方,請務必留意!

規則 2:變異數不受平移影響

對每個數值加上或減去一個常數 (\(b\)) 只會移動整個分佈,但不會改變數值之間的離散程度。

\[ Var(X + b) = Var(X) \]

規則 3:變異數會將縮放因子平方

如果你將變數乘以一個常數 \(a\),則離散程度會乘以 \(a^2\)。這是因為變異數是利用與平均值的平方差計算出來的。

\[ Var(aX + b) = a^2 Var(X) \]

重點:常數 \(b\) 在變異數計算中會完全消失。

快速複習:單一變數轉換

對於 \(Y = aX + b\):

  • 期望值 (\(E\)):線性的!直接乘上並加減常數即可。\(E(Y) = aE(X) + b\)。
  • 變異數 (\(Var\)):將乘數 (\(a\)) 平方,並「忽略」常數 (\(b\))。\(Var(Y) = a^2 Var(X)\)。

2. 合併兩個獨立隨機變數:\(aX \pm bY\)

在現實生活中,我們很少只處理一個變數。我們需要合併兩個(或多個)不同變數的規則,例如計算兩個隨機挑選的蘋果的總重量 (\(X+Y\))。

以下變異數規則的關鍵前提是:變數 \(X\) 和 \(Y\) 必須是獨立的。(在 AS & A Level 數學中,除非題目另有說明,否則通常假設它們是獨立的。)

A. 合併後的期望值規則

期望值依然非常直接,並且永遠按線性方式合併:

規則 4:和與差的期望值

總和的平均值等於平均值的總和;差的平均值等於平均值的差。

\[ E(aX + bY) = aE(X) + bE(Y) \]

註:即使 X 和 Y 不獨立,此規則依然成立,但課程重點在於將其與變異數的獨立性假設結合應用。

B. 合併變異數的黃金法則

這是本章中最重要且最常被誤用的公式。

規則 5:變異數永遠相加(針對獨立變數)

無論你是在計算總和的變異數 (\(X+Y\)),還是差值的變異數 (\(X-Y\)),個別的變異數永遠相加

\[ Var(aX \pm bY) = Var(aX) + Var(bY) = a^2 Var(X) + b^2 Var(Y) \]

為什麼即使是減法,變異數也要相加?
類比:考慮兩個行程時間 X 和 Y。如果你計算總時間 \(X+Y\),不確定性增加了;如果你計算兩者之差 \(X-Y\),不確定性同樣增加了!你對 X 不確定,對 Y 也不確定。相減並不會神奇地抵消不確定性,反而會使其累積。你對最終結果的掌握度降低了,這意味著離散程度(變異數)變大了。

常見錯誤提醒!
絕對不要寫 \(Var(X - Y) = Var(X) - Var(Y)\)。這是錯誤的。如果你看到變數之間有減號,大腦請立即切換成變異數相加模式:\(Var(X - Y) = Var(X) + Var(Y)\)。

重點總結:規則檢查清單(X 與 Y 獨立)

設 \(W = aX + bY\)。

  • \(E(W)\): \(aE(X) + bE(Y)\)。 (直接相加或相減。)
  • \(Var(W)\): \(a^2 Var(X) + b^2 Var(Y)\)。 (係數平方,變異數永遠相加。)

3. 合併特定分佈

當合併隨機變數時,所得分佈的形狀很重要,特別是如果你打算計算機率(例如使用常態分佈表)。關鍵概念是:對於某些常見的分佈,線性組合的結果通常會保持在相同的分佈族群中。

A. 常態變數的線性組合

如果 \(X\) 服從常態分佈,且 \(Y\) 也服從常態分佈,那麼它們的線性組合一定服從常態分佈(前提是它們獨立)。

如果 \(X \sim N(\mu_X, \sigma_X^2)\),\(Y \sim N(\mu_Y, \sigma_Y^2)\),且兩者獨立,那麼:

\[ aX \pm bY \sim N \left( E(aX \pm bY), \ Var(aX \pm bY) \right) \]

這意味著什麼:如果你將兩個常態變數相加或相減,新的變數依然是常態分佈。你只需要利用第 2 節的規則計算出新的平均值和變異數即可。

情境範例:成年男性體重 (\(M\)) 服從常態分佈,兒童體重 (\(C\)) 也服從常態分佈。如果你各選一人,總重量 (\(M+C\)) 也會是常態分佈。這非常重要,因為這意味著你可以使用標準常態分佈 (\(Z\)) 來計算總重量的機率。

你知道嗎?

這種特性——兩個獨立常態變數的和依然是常態分佈——正是常態分佈在統計學中如此特殊且好用的原因!

B. 卜瓦松變數的線性組合

課程大綱要求你掌握兩個獨立卜瓦松變數之和的結果。至於卜瓦松變數的縮放或相減,通常超出了 Paper 6 的考核範圍。

規則 6:獨立卜瓦松變數之和

如果 \(X\) 和 \(Y\) 是獨立的卜瓦松分佈,則它們的和 \(X+Y\) 也服從卜瓦松分佈,其平均參數 (\(\lambda\)) 為兩者之和。

如果 \(X \sim Po(\lambda_X)\),\(Y \sim Po(\lambda_Y)\),且兩者獨立,那麼:

\[ X + Y \sim Po(\lambda_X + \lambda_Y) \]

情境範例:Jane 收到的郵件數 (\(X\)) 服從 \(Po(2)\),David 收到的郵件數 (\(Y\)) 服從 \(Po(3)\)。如果兩者獨立,兩人收到的總郵件數 (\(X+Y\)) 服從 \(Po(2+3) = Po(5)\)。

這個特性與一般規則一致,因為對於卜瓦松分佈而言,\(E(X) = \lambda\) 且 \(Var(X) = \lambda\)。

  • \(E(X+Y) = E(X) + E(Y) = \lambda_X + \lambda_Y\)
  • \(Var(X+Y) = Var(X) + Var(Y) = \lambda_X + \lambda_Y\)

因為新變數 \(X+Y\) 的平均值和變異數都是 \(\lambda_X + \lambda_Y\),它完全符合參數為 \(\lambda_X + \lambda_Y\) 的卜瓦松分佈定義。

4. 解題步驟策略

大多數涉及線性組合的題目,都需要在計算機率之前,細心地應用期望值和變異數規則。

範例:總生產時間

組裝零件 A 的時間(以分鐘計)為 \(T_A \sim N(10, 4)\)。組裝零件 B 的時間為 \(T_B \sim N(15, 9)\)。一名工人在獨立的情況下完成了 3 個零件 A 和 2 個零件 B。試求總時間 \(T_{Total}\) 的分佈。

步驟 1:定義合併後的變數。
總時間為 \(T_{Total} = T_{A1} + T_{A2} + T_{A3} + T_{B1} + T_{B2}\)。
或者,由於所有 \(T_A\) 都是獨立且分佈相同,我們可以寫成: \[ T_{Total} = 3T_A + 2T_B \]

步驟 2:計算期望值 (\(E\))。

\[ E(T_{Total}) = E(3T_A + 2T_B) = 3E(T_A) + 2E(T_B) \] \[ E(T_{Total}) = 3(10) + 2(15) = 30 + 30 = 60 \text{ 分鐘} \]

步驟 3:計算變異數 (\(Var\))。

記住,變異數永遠相加,且係數要平方!

\[ Var(T_{Total}) = Var(3T_A + 2T_B) = 3^2 Var(T_A) + 2^2 Var(T_B) \] \[ Var(T_{Total}) = 9(4) + 4(9) = 36 + 36 = 72 \]

步驟 4:說明結果的分佈。

由於 \(T_A\) 和 \(T_B\) 均為常態分佈,它們的組合也服從常態分佈。

\[ T_{Total} \sim N(60, 72) \]

接著,你就可以使用這個新分佈,透過標準常態分佈的 Z 轉換來解決任何機率問題。

關於平方係數的重要提示:
\(X_1 + X_2 + X_3\) 與 \(3X\) 之間的區別常令人困惑。

  • 如果你處理的是三個獨立觀測值之和(例如三個不同且隨機選取的零件),其變異數為 \(Var(X_1) + Var(X_2) + Var(X_3)\)。如果它們分佈相同,這就等於 \(3 Var(X)\)。
  • 如果你處理的是一個觀測值乘以 3(縮放因子),其變異數為 \(Var(3X) = 3^2 Var(X) = 9 Var(X)\)。

請務必確保你的公式反映了題目的實際情況:你是在計算多個物品的總和,還是在對單一物品進行縮放? 當 \(Y\) 只是常數零時,公式 \(Var(aX + bY) = a^2 Var(X) + b^2 Var(Y)\) 可以優雅地處理這兩種情況。

線性組合摘要清單
  1. 定義新變數(例如 \(W = X - Y\) 或 \(W = 5X + 2Y\))。
  2. 計算新的期望值(平均值線性地相加或相減)。
  3. 計算新的變異數(係數平方,變異數永遠相加)。
  4. 確定新變數的分佈(如果元件是常態分佈,組合後通常也是常態分佈;如果是卜瓦松分佈且進行加法,組合後依然是卜瓦松分佈)。
  5. 利用新分佈的參數(\(\mu_W\) 和 \(\sigma_W^2\))來計算所需的機率。