歡迎來到隨機變數的線性組合 (Linear Combinations of Random Variables)!
在之前的學習中,你已經學過如何求出單一隨機變數的期望值 (Expectation) 和變異數 (Variance)。但當我們將它們組合在一起時會發生什麼事呢?在現實世界中,事件很少是獨立發生的。如果你要計算旅程的總時間,你可能需要將「步行時間」和「乘車時間」加總。如果你是一位企業主,你的總利潤則是「總收入」減去「成本」。
在本章中,我們將探討當結合不同的隨機變數時,如何計算平均結果以及風險的離散程度。別擔心,起初看起來可能會有點複雜——但只要你看出了其中的規律,其實就只是遵循幾個黃金法則而已!
1. 組合任意隨機變數
我們先從適用於任何隨機變數(無論其分佈為何,如二項分佈、卜瓦松分佈等)的規則開始。
期望值規則(「友好」規則)
由 \(E(X)\) 表示的期望值表現非常「乖巧」。它完全符合你所預期的線性組合方式。如果你對變數進行縮放或將變數相加,平均值也會隨之進行相同的運算。
課程大綱中的通用公式為:
\(E(aX + bY + c) = aE(X) + bE(Y) + c\)
其中 \(a, b,\) 和 \(c\) 為常數。
現實生活例子: 想像你在做副業,每小時賺取 \(X\) 元,外加一筆固定的 \(c\) 元小費。如果你工作了 3 小時 (\(a=3\)),你的預期收入就是 \(3 \times E(X) + c\)。
變異數規則(「平方」規則)
由 \(Var(X)\) 表示的變異數則比較敏感。在組合變異數之前,有一個至關重要的條件必須檢查:變數必須互相獨立 (Independent)。
如果 \(X\) 和 \(Y\) 是獨立的,公式如下:
\(Var(aX + bY + c) = a^2Var(X) + b^2Var(Y)\)
為什麼 \(a\) 要平方? 記住,變異數是一種「平方」度量。如果你將某物的尺寸加倍,其面積(變異數)會增加 \(2^2 = 4\) 倍。
為什麼 \(c\) 消失了? 加入常數 \(c\) 只會將整個分佈向上或向下平移,但並不會改變數據的「離散程度」。因此,常數對變異數沒有影響。
快速複習箱:
1. 期望值直接使用 \(a\)。
2. 變異數使用 \(a^2\)。
3. 常數 \(c\) 會加進期望值中,但會被變異數忽略。
重點總結: 期望值很直觀,直接代入計算即可。變異數則要求必須獨立,並且千萬記得要將係數平方!
2. 變數相加 vs. 相減
這就是許多學生容易跌倒的地方!我們來看看當我們將一個變數減去另一個變數(例如 \(X - Y\))時會發生什麼事。
差值的期望值
\(E(X - Y) = E(X) - E(Y)\)
例子:如果你預期收入為 £50,預期支出為 £30,那你預期剩下 £20。很簡單吧!
差值的變異數
\(Var(X - Y) = Var(X) + Var(Y)\)(前提是獨立)
等等,為什麼中間是加號?這是進階數學中最常犯的錯誤!試著這樣想:不確定性總是會累積的。 如果你不確定會賺多少 (\(X\)),也不確定會花多少 (\(Y\)),那麼你對最終利潤的不確定性只會更多。為了找出總離散程度,我們永遠不會將變異數相減。
記憶小撇步: 把變異數想像成「雜亂」。如果你把兩個凌亂的房間合併在一起,你得到的永遠是更多的雜亂,絕不會減少!
重點總結: 無論是在計算 \(X+Y\) 還是 \(X-Y\),變異數永遠都是相加的:\(Var(X) + Var(Y)\)。
3. 加總相同變數 vs. 縮放變數
\(2X\)(取一個觀測值並將其加倍)與 \(X_1 + X_2\)(取兩個獨立的觀測值並將其相加)之間有很大的區別。
「一個大項目」(縮放:\(nX\))
如果你取一個隨機變數並將其乘以 \(n\):
\(E(nX) = nE(X)\)
\(Var(nX) = n^2Var(X)\)
「多個小項目」(加總:\(X_1 + X_2 + ... + X_n\))
如果你對同一個變數取 \(n\) 個獨立的觀測值:
\(E(X_1 + ... + X_n) = nE(X)\)
\(Var(X_1 + ... + X_n) = nVar(X)\)
類比: 想像你要買 10 個蘋果。
情境 A (\(10X\)):你挑選了一個蘋果,收銀員告訴你總價是那顆蘋果的 10 倍。如果那顆蘋果特別重,那麼整批蘋果就很重。這風險很大(變異數高)。
情境 B (\(X_1 + ... + X_{10}\)):你挑選了 10 個不同的蘋果。有些可能重,有些可能輕。它們傾向於「相互抵消」。這風險較小(變異數低)。
重點總結: 加總 \(n\) 個獨立變數後的變異數為 \(nVar(X)\);而將單一變數縮放 \(n\) 倍後的變異數則大得多,為 \(n^2Var(X)\)。
4. 常態分佈變數的線性組合
常態分佈有一個非常特殊的「超能力」:如果你結合常態分佈變數,結果永遠是另一個常態分佈。這被稱為再生性質 (Reproductive Property)。
根據課程大綱 (5.04b):
1. 若 \(X \sim N(\mu, \sigma^2)\),則 \(aX + b\) 也服從常態分佈。
2. 若 \(X\) 和 \(Y\) 是獨立的常態分佈,則 \(aX + bY\) 也服從常態分佈。
逐步教學:求出新的分佈
如果你已知 \(X \sim N(\mu_X, \sigma_X^2)\) 和 \(Y \sim N(\mu_Y, \sigma_Y^2)\),且需要求出 \(W = aX + bY\) 的分佈:
步驟 1:求出新的平均值。
\(E(W) = a\mu_X + b\mu_Y\)
步驟 2:求出新的變異數。
\(Var(W) = a^2\sigma_X^2 + b^2\sigma_Y^2\)
步驟 3:寫出分佈。
\(W \sim N(E(W), Var(W))\)
你知道嗎? 這個性質正是常態分佈如此著名的原因。在許多科學實驗中,「總誤差」是許多小常態誤差的總和,這意味著總誤差本身也服從常態分佈!
重點總結: 「常態進,常態出」。只需算出新的平均值和變異數,之後就可以使用標準常態分佈步驟(或計算機)來求得機率。
總結檢查表
在開始練習題目之前,請將這些要點記在心裡:
• 檢查獨立性: 除非變數互相獨立,否則不能將變異數相加。
• 將係數平方: 當把數字從 \(Var(...)\) 括號中移出時,記得要平方 (\(a \rightarrow a^2\))。
• 永遠不要相減變異數: 即使變數是在相減 (\(X - Y\)),變異數依然是相加的。
• 常數: 常數會平移平均值,但會被變異數忽略。
• 常態依舊是常態: 常態變數的線性組合結果仍為常態分佈。
鼓勵的話: 你一定做得到的!從期望值(較簡單的部分)開始建立信心,然後再仔細地一步步處理變異數。加油!