前言:隨機變數的組合
歡迎來到統計學的進階領域!在你之前的學習中,你可能已經接觸過單一隨機變數(例如投擲一枚骰子的結果)。但在現實世界中,情況通常沒有那麼簡單。我們經常需要處理不同事件的組合。例如,你的總通勤時間其實就是步行時間和乘車時間的總和。
在本章中,我們將學習當我們對離散隨機變數進行加、減或乘法運算時,該如何計算其平均值(期望值)和變異數(離散程度)。如果一開始覺得有點棘手,不用擔心——我們會把它們拆解成一套簡單且通用的規則!
1. 基本概念:線性變換
在我們結合兩個不同的變數之前,先快速複習一下,如果只改變單一變數(將其乘以一個數值,即縮放;或加上一個常數,即平移),會發生什麼事。
若 \(X\) 為隨機變數,且 \(a\) 和 \(b\) 為常數:
1. 平均值: \(E(aX + b) = aE(X) + b\)
2. 變異數: \(Var(aX + b) = a^2Var(X)\)
為什麼會這樣?
想像全班同學在考試中每人都獲得額外 5 分。全班的平均分會增加 5 分。然而,分數的離散程度(變異數)會保持完全不變,因為大家的分數是一起提升的!但如果你把所有人的分數乘以 2,平均值會加倍,而離散程度則會增加 \(2^2 = 4\) 倍。
重點速覽:
- 加上常數 (\(b\)) 會影響平均值,但不會影響變異數。
- 乘以常數 (\(a\)) 會使平均值變為原來的 \(a\) 倍,變異數則變為原來的 \(a^2\) 倍。
2. 組合兩個變數:平均值法則
本章最好的消息是:平均值是非常友善的!無論兩個變數之間是否相關,還是完全獨立,它們的計算方式都和你預期的一模一樣。
對於任何兩個隨機變數 \(X\) 和 \(Y\):
\(E(aX + bY) = aE(X) + bE(Y)\)
現實例子:
如果你每小時賺 10 元 (\(X\)),你的朋友每小時賺 12 元 (\(Y\)),你們兩人工作時數不同,你們總預期收入就是各自預期收入的總和。無論你們是在同一家店工作還是不同店,這個原則都適用!
核心觀點:你可以隨時直接對平均值進行加減。\(E(X - Y) = E(X) - E(Y)\)。
3. 組合兩個變數:共變異數與相關係數
在我們探討變數組合的變異數之前,我們需要先了解 \(X\) 和 \(Y\) 是如何「溝通」的。這就是共變異數 (Covariance) 和 相關係數 (Correlation) 的用武之地。
共變異數 \(Cov(X, Y)\):這衡量了兩個變數一起變化的程度。
- 如果 \(Cov(X, Y)\) 為正值,當 \(X\) 上升時,\(Y\) 往往也會上升。
- 如果 \(Cov(X, Y)\) 為負值,當 \(X\) 上升時,\(Y\) 往往會下降。
- 如果 \(Cov(X, Y)\) 為零,表示兩者之間沒有線性關係。
相關係數 (\(\rho\)):這是共變異數的「標準化」版本,數值始終介於 -1 到 1 之間,比共變異數更容易解讀。
兩者之間的公式為:
\( \rho = \frac{Cov(X, Y)}{\sqrt{Var(X)Var(Y)}} \)
小知識:
相關係數不關心單位!無論你是用公分還是英吋來測量身高,身高與體重之間的相關係數始終保持不變。
4. 線性組合的變異數
計算組合變數的變異數比較複雜,因為我們必須考慮它們之間的相互影響。
通用公式:
\(Var(aX + bY) = a^2Var(X) + b^2Var(Y) + 2abCov(X, Y)\)
等等,如果是相減呢?
如果你要計算 \(Var(aX - bY)\),公式會變成:
\(Var(aX - bY) = a^2Var(X) + b^2Var(Y) - 2abCov(X, Y)\)
常見錯誤警示!
學生經常忘記 \(a^2\) 和 \(b^2\)。請記住:變異數永遠與乘數的平方有關。即使你將變數乘以 -1,變異數也會乘以 \((-1)^2 = 1\)。變異數永遠是表示離散程度的正數!
5. 特殊情況:獨立變數
如果 \(X\) 和 \(Y\) 是獨立的(意即其中一個對另一個完全沒有影響),則 \(Cov(X, Y) = 0\)。這會讓我們的計算變得簡單許多!
對於獨立變數 \(X\) 和 \(Y\):
1. \(E(aX + bY) = aE(X) + bE(Y)\)
2. \(Var(aX + bY) = a^2Var(X) + b^2Var(Y)\)
3. \(Var(aX - bY) = a^2Var(X) + b^2Var(Y)\)
仔細看看最後一條規則!
即使你是在相減兩個獨立變數,你依然要相加它們的變異數。
類比:想像你在裁切一塊木板。木板的長度有誤差 (\(X\)),你下鋸的位置也有誤差 (\(Y\))。當你把它們切下來時,最終成品的總「誤差」或「晃動」(變異數)會變大而不是變小,因為你有兩個隨機因素同時在起作用!
獨立變數總結表:
- 運算: \(X + Y\) \(\rightarrow\) 平均值: \(E(X)+E(Y)\) \(\rightarrow\) 變異數: \(Var(X)+Var(Y)\)
- 運算: \(X - Y\) \(\rightarrow\) 平均值: \(E(X)-E(Y)\) \(\rightarrow\) 變異數: \(Var(X)+Var(Y)\)
6. \(n\) 個獨立變數之和
有時候你處理的不只是 \(X\) 和 \(Y\),而是同類型變數的多次觀察值(例如 10 個獨立蘋果的總重量)。
若 \(X_1, X_2, ..., X_n\) 是同一變數 \(X\) 的獨立觀察值:
\(E(X_1 + X_2 + ... + X_n) = nE(X)\)
\(Var(X_1 + X_2 + ... + X_n) = nVar(X)\)
重要區別:
\(X_1 + X_2\)(兩個不同的獨立蘋果)與 \(2X\)(將同一個蘋果的重量乘以 2)之間有巨大的差別。
- \(Var(X_1 + X_2) = Var(X) + Var(X) = 2Var(X)\)
- \(Var(2X) = 2^2Var(X) = 4Var(X)\)
將單一隨機測量值倍增的「風險」(變異數)遠大於進行兩次分開測量再相加!
逐步演練:解決典型問題
問題:設 \(X\) 為紅骰子的點數,\(Y\) 為藍骰子的點數。假設骰子是獨立的,求 \(S = 3X - Y\) 的平均值和變異數。
第一步:確認 \(X\) 和 \(Y\) 的性質。
對於均勻的 6 面骰子:\(E(X) = 3.5\) 且 \(Var(X) = \frac{35}{12} \approx 2.917\)。
第二步:求新的平均值。
\(E(3X - Y) = 3E(X) - E(Y)\)
\(E(3X - Y) = 3(3.5) - 3.5 = 10.5 - 3.5 = 7\)。
第三步:求新的變異數。
由於兩者獨立,使用 \(a^2Var(X) + b^2Var(Y)\) 規則。
\(Var(3X - Y) = 3^2Var(X) + (-1)^2Var(Y)\)
\(Var(3X - Y) = 9Var(X) + 1Var(Y)\)
\(Var(3X - Y) = 10 \times 2.917 = 29.17\)。
重點速覽:
- 你有相加變異數嗎?有!
- 你有將乘數(3 和 -1)平方嗎?有!
總結與關鍵要點
1. 平均值很簡單: 遵循算式中的符號即可。
2. 變異數比較棘手: 務必將常數平方,且若變數獨立,變異數項永遠要相加。
3. 共變異數很重要: 如果變數不獨立,必須加入 \(2abCov(X, Y)\) 項。
4. 獨立性是你的好朋友: 它透過消除共變異數項來簡化變異數公式。
5. \(n\) 個變數 vs. \(n \times\) 單個變數: 相加 \(n\) 個獨立複製品會得到 \(nVar(X)\),但將一個變數乘以 \(n\) 則會得到 \(n^2Var(X)\)。
請多加練習這些規則!一旦你習慣了將變異數的常數平方並檢查獨立性,這些問題將成為你在考試中最有把握的「得分點」!