📚 高等數學學習筆記:離散隨機變量的線性組合 (FS1.5)

歡迎來到高等統計學中最實用且強大的課題之一!本章的重點在於如何將兩個或多個隨機變量(例如不同產品線的利潤或不同實驗的測量結果)結合成一個全新的變量。

你已經學過如何求單個變量的期望值 (\(E(X)\)) 和變異數 (\(Var(X)\))。在這裡,我們將進一步探討當我們對變量進行縮放、平移和組合時,這些統計特性會如何變化。這項技巧對於建立現實世界的不確定性模型至關重要!


1. 快速回顧:期望值與變異數基礎

在組合變量之前,我們先重溫一下單個離散隨機變量 \(X\) 的基本概念:

  • 期望值 (平均值),\(E(X)\) 或 \(\mu\): 這是變量在長期下的平均取值。
  • 變異數,\(Var(X)\) 或 \(\sigma^2\): 這衡量了變量圍繞平均值的離散程度。變異數越高,數據就越分散。
1.1 縮放與平移的影響

如果我們通過變換 \(X\) 來建立一個新變量 \(W\)(例如 \(W = aX + b\)),期望值和變異數的變化規律如下:

期望值法則:

\[E(aX + b) = a E(X) + b\]

(例子:如果你將所有分數乘以 2 (a=2) 並加上 5 (b=5),平均分數也會變為原來的兩倍再加上 5。)

變異數法則:

\[Var(aX + b) = a^2 Var(X)\]

(例子:平移數據(加上 b)並不會改變分散程度,因此 \(b\) 會消失。但將數據縮放 \(a\) 倍,會使分散程度變為原來的 \(a^2\) 倍。)

⚠ 學習小貼士: 請記住,常數只會影響平均值(平移分佈位置),但永遠不會影響變異數(它們不會改變分佈的離散程度!)。


2. 兩個變量的線性組合

兩個離散隨機變量 \(X\) 和 \(Y\) 的線性組合通常寫成以下形式:

\[W = aX + bY + c\]

其中 \(a\)、\(b\) 和 \(c\) 為常數(係數)。

想像一家咖啡店,X 是拿鐵的每日銷量,Y 是卡布奇諾的每日銷量。如果拿鐵售價 £3 (a=3),卡布奇諾售價 £4 (b=4),那麼總營業額 (W) 就是 \(W = 3X + 4Y\)。
2.1 計算組合後的期望值

期望值的法則非常簡單明瞭。無論 \(X\) 和 \(Y\) 是否相關(相依或獨立),法則都是一樣的:

和/差的期望值法則:

\[E(aX + bY + c) = a E(X) + b E(Y) + c\]

核心重點: 組合後的期望值,就是各個期望值的線性組合。


3. 引入相依性:共變異數與相關係數

當我們談到變異數時,情況會變得複雜——除非這些變量是獨立的。我們必須考慮 \(X\) 和 \(Y\) 之間如何相互影響。

3.1 什麼是共變異數 (Covariance)?

共變異數,記作 \(Cov(X, Y)\),告訴我們 \(X\) 和 \(Y\) 之間關係的方向。

  • 如果 \(Cov(X, Y) > 0\),當 \(X\) 較大時,\(Y\) 往往也較大(反之亦然)。它們同時變動。(正相關關係
  • 如果 \(Cov(X, Y) < 0\),當 \(X\) 較大時,\(Y\) 往往較小(反之亦然)。它們向相反方向變動。(負相關關係
  • 如果 \(Cov(X, Y) = 0\),則不存在線性關係。若 \(X\) 和 \(Y\) 獨立,則此條件必然成立。

⚠ 常見錯誤警示: 如果 \(Cov(X, Y) = 0\),僅代表沒有「線性」關係,並不自動證明變量是獨立的(儘管在大多數高等數學考試情境中,若題目提到它們獨立,你可以假設共變異數為零)。務必檢查題目背景!

3.2 相關係數 (Correlation)

相關係數 (\(\rho\) 或 \(r\)) 是由共變異數標準化後得出的度量。它告訴你線性關係的強度方向,數值始終在 -1 到 1 之間。

\[\rho = \frac{Cov(X, Y)}{\sqrt{Var(X)Var(Y)}}\]

課程大綱要求你理解並應用這些概念,但通常題目會給定共變異數或相關係數的值,或是要求你利用定義公式計算,而非要求推導。

冷知識: 共變異數的單位是 \(X\) 的單位乘以 \(Y\) 的單位,這通常不直觀。相關係數通過將其轉化為 -1 到 1 之間的純數,解決了這個問題。


4. 線性組合的變異數(關鍵公式)

若變量之間具相依性,計算組合後的變異數時必須加入共變異數項。這是一個通用的法則:

4.1 通用法則(相依變量)

對於兩個離散隨機變量 \(X\) 和 \(Y\),以及新變量 \(W = aX + bY\):

\[Var(W) = Var(aX + bY) = a^2 Var(X) + b^2 Var(Y) + 2ab Cov(X, Y)\]

如果有額外的常數 \(c\),則忽略不計,因為常數不會影響變異數:\(Var(aX + bY + c) = Var(aX + bY)\)。

\(2ab\) 項至關重要! 它反映了變量如何放大或抵消彼此的分散程度。

  • 如果 \(Cov(X, Y)\) 為正,組合後的變異數會增加(分散程度累加)。
  • 如果 \(Cov(X, Y)\) 為負,組合後的變異數會減少(變量傾向於平衡彼此的波動)。

計算變異數的步驟:

  1. 找出係數 \(a\) 和 \(b\)。
  2. 對係數取平方以計算變異數項:\(a^2 Var(X)\) 和 \(b^2 Var(Y)\)。
  3. 計算共變異數項:\(2ab Cov(X, Y)\)。
  4. 將這三項相加。
4.2 獨立變量的法則(簡化版)

如果 \(X\) 和 \(Y\) 是獨立的,它們的共變異數必為零:\(Cov(X, Y) = 0\)。這大大簡化了公式:

\[Var(aX + bY) = a^2 Var(X) + b^2 Var(Y)\]

記憶口訣 (VAA): Variance Always Adds!(變異數永遠相加!)。當組合獨立變量時,你總是將它們的變異數(或縮放後的變異數 \(a^2 Var(X)\) 和 \(b^2 Var(Y)\))相加。

4.3 處理減法:\(Var(X - Y)\)

減法是常見的陷阱。考慮 \(W = X - Y\)。這裡 \(a=1\),\(b=-1\)。

減法的通用法則(相依):

\[Var(X - Y) = (1)^2 Var(X) + (-1)^2 Var(Y) + 2(1)(-1) Cov(X, Y)\]

\[Var(X - Y) = Var(X) + Var(Y) - 2 Cov(X, Y)\]

減法的法則(獨立):

若 \(X\) 和 \(Y\) 獨立,\(Cov(X, Y)=0\)。變異數仍然是相加的:

\[Var(X - Y) = Var(X) + Var(Y)\]

⚠ 關鍵點: 無論你是加還是減這些變量,它們的變異數總是對總散佈產生正向貢獻(因為散佈是由平方 \(a^2\) 和 \(b^2\) 衡量的)。如果是減法,你只會減去共變異數項。

🔖 快速回顧:變異數檢查清單

計算 \(Var(aX + bY)\) 時,問自己一個問題:

  • X 和 Y 是否獨立?
  • 是: 使用 \(a^2 Var(X) + b^2 Var(Y)\)。
  • 否: 使用 \(a^2 Var(X) + b^2 Var(Y) + 2ab Cov(X, Y)\)。(你必須先求得或題目已給定 \(Cov(X, Y)\)!)

5. 應用與推廣

這些規則在處理超過兩個變量或重複相同的變量時同樣適用。

5.1 \(n\) 個獨立變量的和

如果你有 \(n\) 個獨立同分佈 (i.i.d.) 的隨機變量 \(X_1, X_2, \dots, X_n\),且將它們求和 \(S = X_1 + X_2 + \dots + X_n\):

期望值:

\[E(S) = E(X_1) + E(X_2) + \dots + E(X_n) = n E(X)\]

(如果你擲一枚公正硬幣 10 次,正面出現次數的期望值就是單次擲硬幣正面期望值的 10 倍。)

變異數:

由於它們是獨立的,共變異數為零。我們只需將變異數相加:

\[Var(S) = Var(X_1) + Var(X_2) + \dots + Var(X_n) = n Var(X)\]

(此原理對於理解二項分佈至關重要,因為二項分佈本質上就是多次獨立伯努利試驗的和。)

5.2 應用例子:包裝產品

設 \(X\) 為一瓶果汁的重量(單位:kg),\(E(X) = 1.2\),\(Var(X) = 0.04\)。
設 \(P\) 為包裝的重量,為常數 \(P = 0.05\) kg。

一個板條箱裝有 5 瓶。總重量 \(W = X_1 + X_2 + X_3 + X_4 + X_5 + 5P\)。假設瓶裝重量是獨立的。

1. 求總重量的期望值:

\[E(W) = E(X_1) + \dots + E(X_5) + E(5P)\]

因為 \(E(X) = 1.2\):

\[E(W) = 5(1.2) + 5(0.05) = 6.0 + 0.25 = 6.25 \text{ kg}\]

2. 求總重量的變異數:

因為瓶子是獨立的,且 \(5P\) 是常數(變異數為 0):

\[Var(W) = Var(X_1) + \dots + Var(X_5) + Var(5P)\]

\[Var(W) = 5(0.04) + 0 = 0.20\]

標準差為 \(\sqrt{0.20}\)。

核心重點: 務必將獨立變量(變異數相加)與常數(只影響平均值,不影響變異數)分開處理。


6. 關於相關係數與決策的備註

在解決應用題時,理解相關係數對於解釋結果至關重要,即使你不計算 \(\rho\):

  • 如果你相加的兩個變量(如投資回報)是正相關的,組合後的總風險(變異數)會高於它們獨立的情況。
  • 如果它們是負相關的(例如某產品暢銷時另一產品銷量下降),共變異數項為負,這會導致總體變異數變小。這就是為什麼分散投資(選擇負相關資產)可以降低風險!

總結:公式的力量
線性組合規則讓我們能夠模擬複雜系統——無論它們涉及的是獨立組件(如生產線步驟),還是高度互相關的組件(如兩個競爭產品的銷售數據)——只需要使用各部分的平均值、變異數和共變異數即可。