隨機變數的線性組合 (Paper 6, 第 6.2 節)
哈囉!歡迎來到統計學 P2 中最實用且經常出現的考點:隨機變數的線性組合 (Linear Combinations of Random Variables)。別被這個長長的名字嚇到了——這一章其實就是在教你,當我們把不同的隨機結果結合、相加或相減時,該如何計算它們的平均值(期望值)和變異數(離散程度)。
可以這樣想:如果你知道早上通勤時間 (X) 和下午回程時間 (Y) 的平均值與變異性,那麼你要如何算出全天總交通時間 (X + Y) 的平均值和變異性呢?這一章就是給你這些簡單的規則來解決問題!
1. 單一隨機變數的轉換:\(aX + b\)
在我們合併兩個變數(如 \(X+Y\))之前,先來看看如何轉換單一變數 \(X\)。這在計算成本、調整測量刻度或單位轉換時非常有用。
A. 期望值的規則(平均值)
期望值(\(E\))用來衡量分佈的中心。它遵循非常直觀的規則:
規則 1:縮放與平移
\[ E(aX + b) = aE(X) + b \]
類比:想像 \(X\) 是咖啡的價格,其 \(E(X) = \$4\)。如果政府徵收 \( \$0.50 \) 的定額稅 (\(b=0.5\)),然後店家將原價加倍 (\(a=2\)),那麼新的期望價格就是 \(2(\$4) + \$0.50 = \$8.50\)。期望值很簡單,它是線性的。
B. 變異數的規則(離散程度)
變異數 (\(Var\)) 用來衡量圍繞平均值的離散程度或變異性。這裡是學生最容易犯錯的地方,請務必留意!
規則 2:變異數不受平移影響
對每個數值加上或減去一個常數 (\(b\)) 只會移動整個分佈,但不會改變數值之間的離散程度。
\[ Var(X + b) = Var(X) \]
規則 3:變異數會將縮放因子平方
如果你將變數乘以一個常數 \(a\),則離散程度會乘以 \(a^2\)。這是因為變異數是利用與平均值的平方差計算出來的。
\[ Var(aX + b) = a^2 Var(X) \]
重點:常數 \(b\) 在變異數計算中會完全消失。
快速複習:單一變數轉換
對於 \(Y = aX + b\):
- 期望值 (\(E\)):線性的!直接乘上並加減常數即可。\(E(Y) = aE(X) + b\)。
- 變異數 (\(Var\)):將乘數 (\(a\)) 平方,並「忽略」常數 (\(b\))。\(Var(Y) = a^2 Var(X)\)。
2. 合併兩個獨立隨機變數:\(aX \pm bY\)
在現實生活中,我們很少只處理一個變數。我們需要合併兩個(或多個)不同變數的規則,例如計算兩個隨機挑選的蘋果的總重量 (\(X+Y\))。
以下變異數規則的關鍵前提是:變數 \(X\) 和 \(Y\) 必須是獨立的。(在 AS & A Level 數學中,除非題目另有說明,否則通常假設它們是獨立的。)
A. 合併後的期望值規則
期望值依然非常直接,並且永遠按線性方式合併:
規則 4:和與差的期望值
總和的平均值等於平均值的總和;差的平均值等於平均值的差。
\[ E(aX + bY) = aE(X) + bE(Y) \]
註:即使 X 和 Y 不獨立,此規則依然成立,但課程重點在於將其與變異數的獨立性假設結合應用。
B. 合併變異數的黃金法則
這是本章中最重要且最常被誤用的公式。
規則 5:變異數永遠相加(針對獨立變數)
無論你是在計算總和的變異數 (\(X+Y\)),還是差值的變異數 (\(X-Y\)),個別的變異數永遠相加。
\[ Var(aX \pm bY) = Var(aX) + Var(bY) = a^2 Var(X) + b^2 Var(Y) \]
為什麼即使是減法,變異數也要相加?
類比:考慮兩個行程時間 X 和 Y。如果你計算總時間 \(X+Y\),不確定性增加了;如果你計算兩者之差 \(X-Y\),不確定性同樣增加了!你對 X 不確定,對 Y 也不確定。相減並不會神奇地抵消不確定性,反而會使其累積。你對最終結果的掌握度降低了,這意味著離散程度(變異數)變大了。
常見錯誤提醒!
絕對不要寫 \(Var(X - Y) = Var(X) - Var(Y)\)。這是錯誤的。如果你看到變數之間有減號,大腦請立即切換成變異數相加模式:\(Var(X - Y) = Var(X) + Var(Y)\)。
重點總結:規則檢查清單(X 與 Y 獨立)
設 \(W = aX + bY\)。
- \(E(W)\): \(aE(X) + bE(Y)\)。 (直接相加或相減。)
- \(Var(W)\): \(a^2 Var(X) + b^2 Var(Y)\)。 (係數平方,變異數永遠相加。)
3. 合併特定分佈
當合併隨機變數時,所得分佈的形狀很重要,特別是如果你打算計算機率(例如使用常態分佈表)。關鍵概念是:對於某些常見的分佈,線性組合的結果通常會保持在相同的分佈族群中。
A. 常態變數的線性組合
如果 \(X\) 服從常態分佈,且 \(Y\) 也服從常態分佈,那麼它們的線性組合一定服從常態分佈(前提是它們獨立)。
如果 \(X \sim N(\mu_X, \sigma_X^2)\),\(Y \sim N(\mu_Y, \sigma_Y^2)\),且兩者獨立,那麼:
\[ aX \pm bY \sim N \left( E(aX \pm bY), \ Var(aX \pm bY) \right) \]
這意味著什麼:如果你將兩個常態變數相加或相減,新的變數依然是常態分佈。你只需要利用第 2 節的規則計算出新的平均值和變異數即可。
情境範例:成年男性體重 (\(M\)) 服從常態分佈,兒童體重 (\(C\)) 也服從常態分佈。如果你各選一人,總重量 (\(M+C\)) 也會是常態分佈。這非常重要,因為這意味著你可以使用標準常態分佈 (\(Z\)) 來計算總重量的機率。
你知道嗎?
這種特性——兩個獨立常態變數的和依然是常態分佈——正是常態分佈在統計學中如此特殊且好用的原因!
B. 卜瓦松變數的線性組合
課程大綱要求你掌握兩個獨立卜瓦松變數之和的結果。至於卜瓦松變數的縮放或相減,通常超出了 Paper 6 的考核範圍。
規則 6:獨立卜瓦松變數之和
如果 \(X\) 和 \(Y\) 是獨立的卜瓦松分佈,則它們的和 \(X+Y\) 也服從卜瓦松分佈,其平均參數 (\(\lambda\)) 為兩者之和。
如果 \(X \sim Po(\lambda_X)\),\(Y \sim Po(\lambda_Y)\),且兩者獨立,那麼:
\[ X + Y \sim Po(\lambda_X + \lambda_Y) \]
情境範例:Jane 收到的郵件數 (\(X\)) 服從 \(Po(2)\),David 收到的郵件數 (\(Y\)) 服從 \(Po(3)\)。如果兩者獨立,兩人收到的總郵件數 (\(X+Y\)) 服從 \(Po(2+3) = Po(5)\)。
這個特性與一般規則一致,因為對於卜瓦松分佈而言,\(E(X) = \lambda\) 且 \(Var(X) = \lambda\)。
- \(E(X+Y) = E(X) + E(Y) = \lambda_X + \lambda_Y\)
- \(Var(X+Y) = Var(X) + Var(Y) = \lambda_X + \lambda_Y\)
因為新變數 \(X+Y\) 的平均值和變異數都是 \(\lambda_X + \lambda_Y\),它完全符合參數為 \(\lambda_X + \lambda_Y\) 的卜瓦松分佈定義。
4. 解題步驟策略
大多數涉及線性組合的題目,都需要在計算機率之前,細心地應用期望值和變異數規則。
範例:總生產時間
組裝零件 A 的時間(以分鐘計)為 \(T_A \sim N(10, 4)\)。組裝零件 B 的時間為 \(T_B \sim N(15, 9)\)。一名工人在獨立的情況下完成了 3 個零件 A 和 2 個零件 B。試求總時間 \(T_{Total}\) 的分佈。
步驟 1:定義合併後的變數。
總時間為 \(T_{Total} = T_{A1} + T_{A2} + T_{A3} + T_{B1} + T_{B2}\)。
或者,由於所有 \(T_A\) 都是獨立且分佈相同,我們可以寫成:
\[ T_{Total} = 3T_A + 2T_B \]
步驟 2:計算期望值 (\(E\))。
\[ E(T_{Total}) = E(3T_A + 2T_B) = 3E(T_A) + 2E(T_B) \] \[ E(T_{Total}) = 3(10) + 2(15) = 30 + 30 = 60 \text{ 分鐘} \]
步驟 3:計算變異數 (\(Var\))。
記住,變異數永遠相加,且係數要平方!
\[ Var(T_{Total}) = Var(3T_A + 2T_B) = 3^2 Var(T_A) + 2^2 Var(T_B) \] \[ Var(T_{Total}) = 9(4) + 4(9) = 36 + 36 = 72 \]
步驟 4:說明結果的分佈。
由於 \(T_A\) 和 \(T_B\) 均為常態分佈,它們的組合也服從常態分佈。
\[ T_{Total} \sim N(60, 72) \]
接著,你就可以使用這個新分佈,透過標準常態分佈的 Z 轉換來解決任何機率問題。
關於平方係數的重要提示:
\(X_1 + X_2 + X_3\) 與 \(3X\) 之間的區別常令人困惑。
- 如果你處理的是三個獨立觀測值之和(例如三個不同且隨機選取的零件),其變異數為 \(Var(X_1) + Var(X_2) + Var(X_3)\)。如果它們分佈相同,這就等於 \(3 Var(X)\)。
- 如果你處理的是一個觀測值乘以 3(縮放因子),其變異數為 \(Var(3X) = 3^2 Var(X) = 9 Var(X)\)。
請務必確保你的公式反映了題目的實際情況:你是在計算多個物品的總和,還是在對單一物品進行縮放? 當 \(Y\) 只是常數零時,公式 \(Var(aX + bY) = a^2 Var(X) + b^2 Var(Y)\) 可以優雅地處理這兩種情況。
線性組合摘要清單
- 定義新變數(例如 \(W = X - Y\) 或 \(W = 5X + 2Y\))。
- 計算新的期望值(平均值線性地相加或相減)。
- 計算新的變異數(係數平方,變異數永遠相加)。
- 確定新變數的分佈(如果元件是常態分佈,組合後通常也是常態分佈;如果是卜瓦松分佈且進行加法,組合後依然是卜瓦松分佈)。
- 利用新分佈的參數(\(\mu_W\) 和 \(\sigma_W^2\))來計算所需的機率。