歡迎來到隨機變數的組合!
在你之前的統計單元中,已經學過如何處理單一隨機變數,例如學生的身高或蘋果的重量。但如果袋子裡裝了三個蘋果會怎樣?又或者,如果你想找出盒子重量與盒內物品重量之間的差異,該怎麼算呢?
在本章中,我們將探討如何結合不同的獨立隨機變數。這對於單元 S3 來說是一項至關重要的技能,因為它構成了稍後更進階統計檢定(Testing)的基礎。如果剛開始覺得有點抽象也不用擔心,只要看懂了其中的規律,它就像照著食譜做菜一樣簡單!
1. 先修知識:遊戲規則
在結合變數之前,我們先快速重溫統計學一 (S1) 中你需要用到的兩條規則。若 \(X\) 為隨機變數,而 \(a\) 與 \(b\) 為常數:
- 期望值(平均值): \(E(aX + b) = aE(X) + b\)
- 變異數(離散程度): \(Var(aX + b) = a^2Var(X)\)
小撇步:請注意,對於變異數而言,\(b\) 會消失(加上一個常數並不會改變數據的離散程度),而 \(a\) 需要平方,因為變異數的單位是原始單位的平方!
2. 結合兩個不同的變數
想像你有兩個獨立變數:\(X\)(咖啡杯的重量)和 \(Y\)(杯內咖啡的重量)。要找出總重量,我們關注的是 \(X + Y\)。
組合的平均值
計算新的平均值非常直接。只需根據期望值進行加減即可:
\(E(aX \pm bY) = aE(X) \pm bE(Y)\)
組合的變異數
這是學生最容易出錯的地方,請務必留意!如果 \(X\) 和 \(Y\) 是獨立的:
\(Var(aX \pm bY) = a^2Var(X) + b^2Var(Y)\)
等等,為什麼兩者中間都是加號?
把變異數想成「不確定性」或「誤差」。如果你加上兩件物品,你的不確定性就會增加。即使你是從一個物品中減去另一個,總體的不確定性依然會增加,因為你結合了兩次測量的「不穩定性」。
類比:如果你嘗試測量兩張搖晃的桌子之間的縫隙,這個縫隙會比單張桌子搖晃得更厲害!
避免常見錯誤:永遠不要將變異數相減。即使公式要求的是 \(X - Y\),你依然要相加變異數:\(Var(X - Y) = Var(X) + Var(Y)\)。
3. 常態分配變數的線性組合
S3 課程大綱的核心重點在於,當 \(X\) 和 \(Y\) 皆服從常態分配 (Normal Distribution) 時會發生什麼。
黃金法則:如果 \(X\) 和 \(Y\) 都是常態分配,那麼它們的任何線性組合(例如 \(X + Y\) 或 \(2X - 3Y\))也必定是常態分配。
主公式
如果 \(X \sim N(\mu_x, \sigma_x^2)\) 和 \(Y \sim N(\mu_y, \sigma_y^2)\) 是獨立的,那麼:
\(aX \pm bY \sim N(a\mu_x \pm b\mu_y, a^2\sigma_x^2 + b^2\sigma_y^2)\)
解題步驟:
- 找出每個變數的平均值 (\(\mu\)) 和變異數 (\(\sigma^2\))。
- 使用期望值規則計算新的平均值。
- 計算新的變異數(記得將係數平方,並且永遠執行加法)。
- 寫出新的分配形式:\(N(\text{新平均值}, \text{新變異數})\)。
- 使用計算機或常態分配表查出所需的機率。
範例:
餅乾的重量 \(C \sim N(30, 2)\),其包裝的重量 \(P \sim N(5, 0.5)\)。總重量 \(T = C + P\) 的分配為何?
\(E(T) = 30 + 5 = 35\)
\(Var(T) = 2 + 0.5 = 2.5\)
所以,\(T \sim N(35, 2.5)\)。
4. 「總和」與「倍數」的陷阱
這是 Further Maths S3 最容易失分的地方之一。單一物品乘以 \(n\) 倍與 \(n\) 個獨立物品相加之間有巨大的差異。
情況 A:單一變數的倍數 (\(nX\))
想像你拿取了一袋巨大的 2kg 麵粉。
\(E(2X) = 2E(X)\)
\(Var(2X) = 2^2Var(X) = 4Var(X)\)
情況 B:獨立變數的總和 (\(X_1 + X_2\))
想像你拿取了兩袋分開的 1kg 麵粉。因為它們是分開的,它們的變異可能會稍微抵銷(一袋可能重一點,另一袋可能輕一點)。
\(E(X_1 + X_2) = E(X) + E(X) = 2E(X)\)
\(Var(X_1 + X_2) = Var(X) + Var(X) = 2Var(X)\)
重點總結:相加獨立項目(情況 B)所得的變異數會比將單一項目乘以倍數(情況 A)的變異數小。在考試中請務必細讀題目:你買的是「一瓶 5 公升的瓶子」(\(5X\)) 還是「五瓶 1 公升的瓶子」(\(X_1 + X_2 + X_3 + X_4 + X_5\))?
5. 總結與快速回顧
你知道嗎?這種結合常態變數的能力,就是我們稍後在 S3 學到的中央極限定理 (Central Limit Theorem) 的基礎,它能讓我們對平均值進行預測!
快速回顧欄:
- 平均值:\(E(aX + bY) = aE(X) + bE(Y)\)
- 變異數:\(Var(aX + bY) = a^2Var(X) + b^2Var(Y)\)
- 變異數:\(Var(aX - bY) = a^2Var(X) + b^2Var(Y)\)(永遠執行加法)
- 常態變數的線性組合永遠是常態的。
- 標準差是變異數的平方根——使用這些公式前,請務必先換算成變異數!
鼓勵一下:如果變異數的規則讓你感到奇怪,記住「搖晃的桌子」那個類比就好。誤差永遠只會疊加!多練習幾個關於 \(X_1 + X_2\) 對比 \(2X\) 的題目,很快你就會成為這部分的專家了。